embedding 用于将非结构化数据向量化,通过深度学习神经网络提取文本、图片、音视频等非结构化数据里的内容和语义,把文本、图片、音视频等变成特征向量。
异步调用使用async_embedding接口,参数不变。
说明
参数 | 子参数 | 类型 | 是否必选 | 说明 |
---|---|---|---|---|
emb_model 说明 EmbModel 实例。 | model_name | string | 是 | 指定模型名称,当前支持的模型有 bge-large-zh。
|
raw_data 说明 RawData 实例或者列表,最大 100 个。 | data_type | string | 是 | 指定数据类型,当前仅支持文本 text。 |
text | string | 是 | 当 data_type=text 时,直接传入类型为 string 的文本。 |
list = [RawData("text","hello1"), RawData("text","hello2")] res = vikingdb_service.embedding(EmbModel("bge-large-zh"), list)
Python 调用执行上面的任务,返回 list<float> 、list<list<float>> 类型的向量。