本页面用于介绍如何进行混合检索测试,可配置查询向量、限制(Top-K)、子索引、标量过滤后查看混合检索结果。
混合检索是指在向量数据库中,同时使用向量检索和标量检索两种方法进行检索。在混合检索中,使用向量检索来匹配向量的相似度,同时可以使用标量检索来匹配数据的标量值进行过滤。
注意
- 当索引的执行状态为已就绪时,才支持操作检索测试;当索引的执行状态为初始化中、失败时,不支持操作检索测试。
- 标量过滤参数配置时,表示混合检索;该参数未配置时,表示向量检索。本页面该参数需要配置。
- 当查询向量配置时,表示按照输入的查询向量检索出相似的 K 个向量;当查询向量未配置时,表示默认按照向量 [0,0,0,0......] 检索出相似的 K 个向量。
操作步骤
检索测试页面有两种进入方式:
- 方式一:在左侧导航栏单击索引,进入索引页面。单击索引列表指定索引操作列的检索测试,进入检索测试页面。
- 方式二:在左侧导航栏单击索引,进入索引页面。单击索引列表指定索引的名称,进入索引详情页面,单击检索测试页签。
在检索测试页面,输入查询向量、限制(Top-K)、子索引、标量过滤。
检索条件 | 参数说明 |
---|
查询向量 | 输入 JSON 数组字符串,向量维度为创建数据集时定义向量字段的维度。选填。 - 当查询向量配置时,表示按照输入的查询向量检索出相似的 K 个向量。
- 当查询向量未配置时,表示默认按照向量 [0,0,0,0......] 检索出相似的 K 个向量
|
限制(Top-K) | 输入 Top-K 值,默认100,表示检索返回多少个结果。必填。 |
子索引 | 在下拉列表中选择子索引,即《新建索引》页面中子索引划分字段选择的字段名称所对应的字段值。必填。 - 子索引划分字段未设置时,则子索引下拉框默认为 default。
- 适用场景:适用于将数据集划分为多个子数据集,在某个子数据集/子索引内部检索等检索模式固定的场景。比如,根据国家 ID 将数据集拆分,针对某个国家 ID 的子索引检索场景,无需对国家 ID 进行过滤,提升检索性能。
|
标量过滤 | 标量过滤条件,混合检索时必填。 - 《新建索引》页面中过滤字段未设置时,表示不做过滤,检索测试阶段标量过滤没有可选择的字段名称。
- 《新建索引》页面中过滤字段设置时,检索测试阶段在下拉列表中选择一个标量过滤字段名字,并选择对应的过滤条件。
- 过滤条件包括六种:包含、不包含、大于、小于、大于等于、小于等于。条件关系包括两种:且、或。
|
单击左下角查询后可查看混合检索结果,查询结果默认按照 score 从高到低排序。