说明
由于大模型底层架构升级,知识库同步兼容适配,chat_completions API 用法和影响如下:
1、若原本使用公共接入点调用 Doubao 模型,无影响
2、若原本使用私有接入点调用 Doubao 模型,需要额外上传 API key 参数,否则会自动调度到公共 EP 上(此时计费项和折扣会走知识库商品)
本节将说明如何基于多轮历史对话,使用大语言模型进行回答生成
/api/knowledge/chat/completions 接口用于向大模型发起一次对话请求,与新升级的search_knowledge接口联通,可以完成标准的检索生成链路。
本接口对 Doubao 大模型 chat/completions 接口全面兼容。
URI | /api/knowledge/chat/completions | 统一资源标识符 |
---|---|---|
请求方法 | POST | 客户端对向量数据库服务器请求的操作类型 |
请求头 | Content-Type: application/json | 请求消息类型 |
Authorization: HMAC-SHA256 *** | 鉴权 |
参数 | 子参数 | 类型 | 是否必选 | 默认值 | 参数说明 |
---|---|---|---|---|---|
model | -- | String | 是 | Doubao-pro-32k | 想要用于在线生成的大模型
公共推理接入点 doubao 系列模型可选范围:
【图文理解大模型】
私有推理接入点 ID 形如:
注意当使用私有接入点时,需要配合传入 API key 进行鉴权 |
model_version | -- | string | 否 | -- | Doubao-pro-32k可选的模型版本
Doubao-pro-128k可选的模型版本
Doubao-pro-256k可选的模型版本
Doubao-lite-32k可选的模型版本
Doubao-lite-128k可选的模型版本
Doubao-vision-pro 32k可选的模型版本
|
api_key | -- | string | 否 | -- | 接入点 API Key |
messages | -- | json | 否 | -- | 发出消息的对话参与者角色,可选值包括:
多轮文本问答: 串联脚本示例可参考知识库多轮检索问答样例
多轮图文理解:串联脚本示例可参考知识库图文问答样例
|
stream | -- | Boolean | 否 | False | 响应内容是否流式返回
|
max_tokens | -- | Integer | 否 | 4096 | 模型可以生成的最大 token 数量 |
return_token_usage | -- | Boolean | 否 | False | 是否返回token用量统计 |
temperature | -- | Float | 否 | 0.1 | 采样温度 |
参数 | 参数说明 |
---|---|
code | 状态码 |
message | 返回信息 |
request_id | 标识每个请求的唯一标识符 |
data | 模型回答与token用量统计 |
data返回值
字段 | 子字段 | 字段类型 | 说明 |
---|---|---|---|
generated_answer | -- | string | 大模型回答 |
usage | -- | string | token用量统计 |
状态码 | http状态码 | 返回信息 | 状态码说明 |
---|---|---|---|
0 | 200 | success | 成功 |
1000001 | 401 | unauthorized | 缺乏鉴权信息 |
1000002 | 403 | no permission | 权限不足 |
1000003 | 400 | invalid request:%s | 非法参数 |
curl -i -X POST \ -H 'Content-Type: application/json' \ -H 'Authorization: HMAC-SHA256 ***' \ https://api-knowledgebase.mlp.cn-beijing.volces.com/api/knowledge/chat/completions \ -d '{ request_params = { "model": "m3-v2-rerank", "max_tokens": 4096, "temperature": 0.1, "messages": [ { "role": "system", "content": "prompt template" }, { "role": "user", "content": "history content" } { "role": "assistant", "content": "history content" }, { "role": "user", "content": "history content" }, ... { "role": "assistant", "content": "history content" } ], "stream":False, "return_token_usage": True } } } }'
执行成功返回:
HTTP/1.1 200 OK Content-Length: 209 Content-Type: application/json { "code": 0, "data": {##大模型返回结果,包含回答与token用量详情 "generated_answer": "HNSW(Hierarchical Navigable Small World)是一种用于高效近似最近邻搜索的数据结构和算法。\n\n它具有以下特点和优势:\n1. **高效性**:能够在大规模数据集中快速找到近似最近邻。\n2. **可扩展性**:适用于处理海量数据。\n3. **准确性**:提供相对准确的最近邻搜索结果。\n4. **层次结构**:通过构建层次结构来加速搜索过程。\n5. **小世界特性**:利用数据的局部性和相似性,提高搜索效率。\n\nHNSW 在许多领域有广泛的应用,例如:\n1. **图像检索**:快速找到相似的图像。\n2. **推荐系统**:推荐相关的产品或内容。\n3. **数据挖掘**:发现相似的数据点。\n4. **机器学习**:在特征空间中进行相似性搜索。\n\n总之,HNSW 是一种强大的工具,用于解决大规模数据集中的最近邻搜索问题。", "usage": "{\"prompt_tokens\":13,\"completion_tokens\":217,\"total_tokens\":230}\n" }, "message": "success", "request_id": "02172742276364600000000000000000000ffff0a00406fa14e0d" }
执行失败返回:
HTTP/1.1 400 OK Content-Length: 43 Content-Type: application/json {"code":1000003, "message":"invalid request:%s", "request_id": "021695029757920fd001de6666600000000000000000002569b8f"}