search_by_vector 用于向量检索。根据查询的向量,搜索与其距离最近的 limit 个向量。
异步调用使用async_search_by_vector接口,参数不变。
说明
参数 | 类型 | 是否必选 | 默认值 | 参数说明 |
---|---|---|---|---|
vector | map | 是 | 用于检索的稠密向量字段。 | |
sparse_vectors | map | Spa | 用于检索的稀疏向量。格式是字典,k 为 string 类型,表示关键词的字面量,v 为 float 类型,表示该关键词的权重数值。 | |
dense_weight | float | 否 | 0.5 | 对于混合检索,dense_weight 用于控制稠密向量在检索中的权重。范围为[0.2,1]。仅在检索的索引为混合索引(IndexType.HNSW_HYBRID)时有效。 |
filter | map | 否 | None | 过滤条件,详见标量过滤。
|
limit | int | 否 | 10 | 检索结果数量,最大5000个。 |
output_fields | list<string> | 否 | 过滤字段,指定要返回的标量或向量字段列表。
如果索引的距离方式为cosine,向量字段返回的向量是归一化后的向量。。 | |
partition | string/int | 否 | "default" | 子索引名称,类型与 partition_by 的 field_type 一致,字段值对应 partition_by 的 field_value。
|
# 获取指定索引,程序初始化时调用即可,无需重复调用
index = vikingdb_service.get_index("example", "example_index")
def gen_random_vector(dim):
res = [0, ] * dim
for i in range(dim):
res[i] = random.random() - 0.5
return res
res = index.search_by_vector(gen_random_vector(10), {"hello": 0.34, "world": 0.03, "!": 0.11},limit=2, dense_wight = 0.5, output_fields=["doc_id", "like", "text_vector"], partition="default") #混合检索
res = index.search_by_vector(gen_random_vector(10),limit=2, output_fields=["doc_id", "like", "text_vector"], partition="default") #纯稠密检索
# 异步调用
async def search_by_vector():
def gen_random_vector(dim):
res = [0, ] * dim
for i in range(dim):
res[i] = random.random() - 0.5
return res
index = await vikingdb_service.async_get_index("async", "async")
res = await index.async_search_by_vector(gen_random_vector(10))
asyncio.run(search_by_vector())
Python 调用执行上面的任务,返回 List<Data> 。Data 实例包含的属性如下表所示。
属性 | 说明 |
---|---|
id | 主键 id。 |
fields | 请求返回中的 fields 字段,是具体的数据,字典类型。 |
score | 表示找到的向量和输入的向量的匹配程度。 |