说明
embedding 接口升级为 v2 版本,新增长文本窗口模型及稀疏向量产出,支持用量统计。建议迁移到 v2 接口使用 embedding 功能。
data/embedding/version/2 接口用于请求 Embedding 服务,通过深度学习神经网络提取文本、图片、音视频等非结构化数据里的内容和语义,把文本、图片、音视频等变成特征向量。
说明
说明
请求 Embedding 服务的 OpenAPI 接口时,需要构造签名进行鉴权,详细的 OpenAPI 签名调用方法请参见 API签名调用指南。
URI | /api/data/embedding/version/2 | 统一资源标识符 |
---|---|---|
方法 | POST/GET | 客户端对Embedding服务请求的操作类型 |
请求头 | Content-Type: application/json | 请求消息类型 |
Authorization: HMAC-SHA256 *** | 鉴权 |
参数 | 子参数 | 类型 | 是否必选 | 说明 |
---|---|---|---|---|
model | model_name | string | 是 | 指定模型名称,当前支持的模型有:
|
params | map | 否 | 模型参数: | |
data 说明 最大 100 个。 | data_type | string | 是 | 支持如下类型:
|
text | string | data_type 为 text 或 text-image时,必选 | data_type=text时,直接传入文本string | |
image | string | data_type 为 image 或 text-image时,必选 | data_type=image时,传入图片内容的base64编码 |
参数 | 参数说明 |
---|---|
code | 状态码 |
message | 返回信息 |
request_id | 标识每个请求的唯一标识符 |
data | 字典类型,现在包含 |
状态码 | http状态码 | 返回信息 | 状态码说明 |
---|---|---|---|
0 | 200 | success | 请求 Embedding 服务成功。 |
1000003 | 400 | invalid request:%s | 非法参数:
|
1000001 | 401 | unauthorized | 请求头中缺乏鉴权信息。 |
1000025 | 404 | failed to calcTextEmbedding | 请求模型服务失败:
|
curl -i -X POST \ -H 'Content-Type: application/json' \ -H 'Authorization: HMAC-SHA256 ***' \ https://api-vikingdb.volces.com/api/data/embedding/version/2 \ -d '{ "model": { "model_name": "bge-m3", "params":{ "return_dense":true, "return_sparse":true, "return_token_usage":true } }, "data": [ { "data_type": "text", "text": "如何使用torchserve部署模型" }, { "data_type": "text", "text": "怎么使用训练机器学习模型" } ] }'
执行成功返回:
HTTP/1.1 200 OK Content-Length: 43 Content-Type: application/json { "code":0, "message":"success", "request_id":"021695029736548fd001de66666000000000000000000029aa917", "sentence_dense_embedding":[ [0.23, 0.54, 0.76], [0.57, 0.93, 0.21], ], "sentence_sparse_embedding":[ {'如何': 0.05005, '使用': 0.1368, 'torchserve': 0.04498, '部署': 0.0633, '模型': 0.251}, {'怎么': 0.0352, '使用': 0.5238, '训练': 0.2356, '机器学习': 0.2456, '模型': 0.42}, ... ], }
执行失败返回:
HTTP/1.1 404 OK Content-Length: 43 Content-Type: application/json {"message":"failed to calcTextEmbedding, ModelNotFoundException: Model not found: bge-large-zh","code":1000025, "request_id":"021695029736548fd001de66666000000000000000000029aa917"}