本节将介绍如何基于已创建的知识库进行在线检索。知识检索适用于多种场景,包括文本查重、打标分类等。
说明
- 知识库创建完成、文档导入且处理完成后,即代表可以进行在线检索。
- 调用接口前请先完成“API参考-对接指南”页面的注册账号、实名认证、AK/SK 密钥获取和签名获取。
知识检索
- 入口一:在知识库列表页选择对应的知识库,进入详情页并点击「知识检索」按钮进入测试界面。
- 入口二:在知识库列表页找到对应的知识库,通过知识库右上角的 ··· ,进入检索测试页面。
测试
在知识检索界面,您可以提出您要检索的问题,系统会返回与问题最相关的若干个文本片段:
参数说明
左侧为知识检索测试的参数设置,右侧为知识检索的界面。下表为各个参数的详细信息:
参数 | 作用 | 取值范围 |
---|
返回文本片数量 | 控制最终检索返回的文本片数量。
如果没有若打开重排模型,则表示检索返回重排后的 TopN 文本片数量;
若打开了重排模型,则表示模型排序后的结果的前 K 个文本片,K 为返回的文本片数量。 | 如果没有打开重排模型:[1, 200]
如果打开了重排模型:[1, Top K] |
启用重排模型 | 控制是否使用重排模型对检索到的文本片进行重新排序。
打开重排模型则会获得更准确的问题-文本片相似性的评分,提升检索效果。 打开后检索的时间会略有增长,且与召回文本数量成正比,建议合理设置召回文本数量。 | 默认模型:m3-v2-rerank,轻量小模型,推理速度更快 |
召回数量(Top K) | 召回是指从海量的候选文本片中找出与问题最相关的 K 个文本片的过程。仅在打开了重排模型的时候可设置此项。建议设置召回数量略大于返回文本片数量,可提高生成准确性。 | [1, 200] |
更多参数-Dense Weight | 在创建知识库时,如果选择的向量化模型和索引算法支持混合检索,则检索时系统会同时考虑问题与候选文本片的语义相关性和字面上的匹配程度,获得更准确的检索结果。
Dense Weight 参数用于控制检索时语义相似程度的重要性权重,越偏向 1 表示越倾向于语义检索,越偏向 0 则表示越偏向于关键词匹配检索。 | [0.2, 1] |
更多参数-按标签过滤文档范围 | 标签过滤文档范围未配置时,表示不做过滤。
如希望按照标签过滤文档,可在添加条件中的下拉列表中选择需要过滤的标签名称,并选择对应的过滤条件。 过滤条件包括六种:包含、不包含、大于、小于、大于等于、小于等于。条件关系包括两种:且、或。 | -- |