/data/embedding 接口用于请求 Embedding 服务,通过深度学习神经网络提取文本、图片、音视频等非结构化数据里的内容和语义,把文本、图片、音视频等变成特征向量。
说明
说明
请求 Embedding 服务的 OpenAPI 接口时,需要构造签名进行鉴权,详细的 OpenAPI 签名调用方法请参见 API签名调用指南。
URI | /api/data/embedding | 统一资源标识符 |
---|---|---|
方法 | POST/GET | 客户端对Embedding服务请求的操作类型 |
请求头 | Content-Type: application/json | 请求消息类型 |
Authorization: HMAC-SHA256 *** | 鉴权 |
参数 | 子参数 | 类型 | 是否必选 | 说明 |
---|---|---|---|---|
model | model_name | string | 是 | 指定模型名称,当前支持的模型有 bge-large-zh。
|
data 说明 最大 100 个。 | data_type | string | 是 | 指定数据类型,当前仅支持文本 text。 |
text | string | 是 | 当 data_type=text 时,直接传入类型为 string 的文本。 |
参数 | 参数说明 |
---|---|
code | 状态码 |
message | 返回信息 |
request_id | 标识每个请求的唯一标识符 |
data | embedding 结果。 |
状态码 | http状态码 | 返回信息 | 状态码说明 |
---|---|---|---|
0 | 200 | success | 请求 Embedding 服务成功。 |
1000003 | 400 | invalid request:%s | 非法参数:
|
1000001 | 401 | unauthorized | 请求头中缺乏鉴权信息。 |
1000025 | 404 | failed to calcTextEmbedding | 请求模型服务失败:
|
curl -i -X POST \ -H 'Content-Type: application/json' \ -H 'Authorization: HMAC-SHA256 ***' \ https://api-vikingdb.volces.com/api/data/embedding \ -d '{ "model": { "model_name": "bge-large-zh" }, "data": [ { "data_type": "text", "text": "如何使用torchserve部署模型" }, { "data_type": "text", "text": "怎么使用训练机器学习模型" } ] }'
执行成功返回:
HTTP/1.1 200 OK Content-Length: 43 Content-Type: application/json { "code":0, "message":"success", "request_id":"021695029736548fd001de66666000000000000000000029aa917", "data": [ // 输出是个二维数组, [batch_size, model_output_dimension] [ 0.014988808892667294, -0.025562003254890442, -0.039532456547021866, ... ], ... ] }
执行失败返回:
HTTP/1.1 404 OK Content-Length: 43 Content-Type: application/json {"message":"failed to calcTextEmbedding, ModelNotFoundException: Model not found: bge-large-zh","code":1000025, "request_id":"021695029736548fd001de66666000000000000000000029aa917"}