search 用于在当前 Index 进行检索,支持向量检索、标量检索、标量过滤检索。
异步调用使用async_search接口,参数不变。
说明
Collection 数据写入/删除后,Index 数据更新时间最长滞后 20s,不能立即在 Index 检索到。
参数 | 类型 | 是否必选 | 默认值 | 参数说明 |
---|---|---|---|---|
order | map | 否 | 指定向量 VectorOrder 对象或者标量 ScalarOrder 对象,两者二选一进行配置。
说明 对于使用 hnsw-hybrid 的混合索引,暂不支持 search_by_id 用法。
| |
filter | map | 否 | 过滤条件,详见 filter 表达式说明。
| |
limit | int | 否 | 10 | 检索结果数量,最大5000个。 |
dense_weight | float | 否 | 0.5 | 对于标量过滤检索,dense_weight 用于控制稠密向量在检索中的权重。范围为[0.2,1]。仅在检索的索引为混合索引时有效。 |
output_fields | list<string> | 否 | 过滤字段,指定要返回的标量或向量字段列表。
如果索引的距离方式为cosine,向量字段返回的向量是归一化后的向量。 | |
partition | string/int | 否 | "default" | 子索引名称,类型与 partition_by 的 field_type 一致,字段值对应 partition_by 的 field_value。
|
算子 | 算子说明 | 示例 |
---|---|---|
must | 针对指定字段名生效,语义为必须在 [...] 之中,即 "must in"。 |
|
must_not | 针对指定字段名生效,语义为必须不在 [...] 之中,即 "must not in"。 |
|
range | 针对指定字段名生效,语义为必须在指定范围内。 |
|
range_out | 针对指定字段名生效,语义为必须在指定范围外。配置使用 |
|
and | 逻辑算子,针对逻辑查询需求,对多个条件取交集。 |
|
or | 逻辑算子,针对逻辑查询需求,对多个条件取并集。 |
|
# 获取指定索引,程序初始化时调用即可,无需重复调用 index = vikingdb_service.get_index("example", "example_index")
def gen_random_vector(dim): res = [0, ] * dim for i in range(dim): res[i] = random.random() - 0.5 return res res = index.search(order=VectorOrder(gen_random_vector(10), "1"), limit=2, output_fields=["doc_id", "like", "text_vector"], partition="default", filter={"op": "range", "field": "price", "lt": 3.5}) # 异步调用 async def search(): index = vikingdb_service.get_index("async", "async") def gen_random_vector(dim): res = [0, ] * dim for i in range(dim): res[i] = random.random() - 0.5 return res res = index.search(order=VectorOrder(gen_random_vector(10)), limit=2, output_fields=["doc_id", "like", "text_vector"], filter={"op": "range", "field": "price", "lt": 3.5}) print("-----------search_vector---------") for item in res: print(item) print(item.score) print("-----------search_scalar---------") res = index.search(order=ScalarOrder("price", Order.Desc), limit=6, output_fields=["price"], filter={"op": "range", "field": "price", "lt": 5}) for item in res: print(item) print(item.score) print("-----------search_None---------") res = index.search(limit=5, output_fields=["doc_id", "like"], ilter={"op": "range", "field": "price", "lt": 3.5}) for item in res: print(item.fields) print(item.score) asyncio.run(search())
Python 调用执行上面的任务,返回 List<Data> 。Data 实例包含的属性如下表所示。
属性 | 说明 |
---|---|
id | 主键 id。 |
fields | 请求返回中的 fields 字段,是具体的数据,字典类型。 |
score | 表示找到的向量和输入的向量的匹配程度。 |