searchByText--向量数据库VikingDB-火山引擎

文档中心

立即注册

导航

searchByText

最近更新时间：2025.06.10 11:47:55首次发布时间：2024.04.17 14:21:07

说明

目前向量数据库已支持多模态检索，可以直接通过文本搜索文本、文本搜索图片、图片搜索图片等，原有的searchByText 接口可迁移至searchWithMultiModal

概述

searchByText 用于非结构化数据检索。非结构化数据检索是指向量数据库支持非结构化原始数据，可以直接通过文本搜索文本。

说明

当前仅支持文本类型的非结构化数据。
Collection 数据写入/删除后，Index 数据更新时间预计20s，不能立即在 Index 检索到。

前提条件

从控制台选择了从向量化开始的数据库类型，并在创建数据集时配置了向量化字段；或通过 create_collection 接口创建数据集时，通过设置 vectorize 参数配置了 Collection 的向量化功能
通过 upsert_data 接口写入数据时，已写入text 类型的字段名称和字段值。
通过 create_index 创建索引时，已创建 vector_index 向量索引。

请求参数

请求参数是 SearchByTextParam，SearchByTextParam 实例包含的参数如下表所示。

参数	类型	是否必选	默认值	参数说明
text	string	是		检索的输入文本。
filter	map	否		过滤条件，详见标量过滤。默认为空，不做过滤。过滤条件包含 must、must_not、range、range_out四类查询算子，包含 and 和 or 两种对查询算子的组合。
limit	int	否	10	检索结果数量，最大5000个。
denseWeight	float	否	0.5	对于混合检索，dense_weight 用于控制稠密向量在检索中的权重。范围为[0.2，1]。仅在检索的索引为混合索引时有效。
outputFields	list<string>	否		过滤字段，指定要返回的标量或向量字段列表。 outputFields 不传时，返回所有的标量字段，不返回向量字段。 outputFields 为空列表时，不返回 fields 字段。 outputFields 格式错误或者过滤字段不是 collection 里的字段时, 接口返回错误。如果索引的距离方式为cosine，向量字段返回的向量是归一化后的向量。
partition	string/int	否	"default"	子索引名称，类型与 partitionBy 的 fieldType 一致，字段值对应 partitionBy 的 fieldValue。 fieldType 为 int64，list<int64> 时，partition 输入类型为 int64。 fieldType 为 string，list<string> 时，partition 输入类型为 string，格式要求 "^[a-zA-Z0-9._]+$"。
scale_k	float64	否	1	检索sef是索引参数sef的scale_k倍。默认1，取值范围[0.1, 100]，值越大检索结果越精确，但相应地会降低性能。

示例

请求参数

//获取指定索引，程序初始化时调用即可，无需重复调用
IndexClient indexClient = new IndexClient("test_collection", "test_index", "api-vikingdb.volces.com", "cn-beijing", "your ak", "your sk", "http");

HashMap<String, Object> filter = new HashMap<>();
filter.put("op", "range");
filter.put("field", "price");
filter.put("lt", 4);
Text text = new Text().setText("this.is test").build();
SearchByTextParam searchByTextParam = new SearchByTextParam()
                                        .setText(text)
                                        .setFilter(filter)
                                        .setDenseWeight(0.5)
                                        .build();
List<DataObject> datas = indexClient.searchByText(searchByTextParam);

返回值

Java 调用执行上面的任务，返回 List<DataObject> 。DataObject 实例包含的属性如下表所示。

属性	说明
id	主键 id。
fields	请求返回中的 fields 字段，是具体的数据，map 类型。
score	表示找到的向量和输入的向量的匹配程度。
text	文本非结构化检索时返回。