本节将说明如何单独调用rerank模型,以计算两段文本间的相似度
rerank 用于重新批量计算输入文本与检索到的文本之间的 score 值,以对召回结果进行重排序。判断依据 chunk content 能回答 query 提问的概率,分数越高即模型认为该文本片能回答 query 提问的概率越大。
参数 | 类型 | 是否必选 | 默认值 | 参数说明 |
---|---|---|---|---|
datas | list[map] | 是 | -- | map 中包含 query、content 和 title 三个参数。list 最大量为 50。
|
endpoint_id | string | 否 | -- | rerank 私有接入点 |
rerank_model | string | 否 | "Doubao-pro-4k-rerank" | rerank 模型选择
|
请先完成SDK初始化,再运行代码,详见初始化SDK
datas = [{ "query": "退改", "content": "如果您需要人工服务,可以拨打人工客服电话:4006660921", "title":"无" }, { "query": "退改", "content": "1、1日票 1.5日票 2日票的退款政策: -到访日前2天的00:00前,免费退款 - 到访日前2天的00:00至到访日前夜23:59期间,退款需扣除服务费(人民币80元) - 到访日当天(00:00 之后),不可退款 2、半日票的退款政策: - 未使用的门票可在所选入...", "title":"门票退改政策|北京环球影城的门票退改政策" }, { "query": "退改", "content": "如果您需要人工服务,可以拨打人工客服电话:4006660921", }] res = viking_knowledgebase_service.rerank(datas=datas, rerank_model="") print(res)
Python 调用执行上面的任务,返回字典,包含的属性如下表所示
字段 | 类型 | 子字段 | 子字段类型 | 说明 |
---|---|---|---|---|
code | 数值 | -- | 状态码 | |
message | string | -- | 错误信息 | |
data | map | scores | list[float64] | rerank 得分列表 |
token_usage | int64 | tokens 消耗量 | ||
request_id | string | -- | 标识每个请求的唯一标识符 |