/api/knowledge/doc/add 接口用于向已创建的知识库导入文档。
说明
完成“对接指南“页面的注册账号、实名认证、AK/SK 密钥获取和签名获取后,可调用 API 接口实现知识库的创建功能。
URI | /api/knowledge/doc/add | 统一资源标识符 |
---|---|---|
请求方法 | POST | 客户端对向量数据库服务器请求的操作类型 |
请求头 | Content-Type: application/json | 请求消息类型 |
Authorization: HMAC-SHA256 *** | 鉴权 |
参数 | 子参数 | 类型 | 是否必选 | 默认值 | 参数说明 |
---|---|---|---|---|---|
collection_name | -- | string | 否 | -- | 知识库名称
|
project | -- | string | 否 | default | 知识库所属项目 |
resource_id | -- | string | 否 | -- | 知识库唯一 id |
add_type | -- | string | 是 | -- | 文档添加的方式,可为以下枚举值:
|
doc_id | -- | string | 否 | -- | 知识库下的文档唯一标识
注:
|
doc_name | -- | string | 否 | -- | 文档名称
|
doc_type | -- | string | 否 | -- | 上传文档的类型,非结构化文档支持类型:txt, doc, docx, pdf, markdown/md, faq.xlsx, pptx ;结构化文档支持类型:xlsx, csv, jsonl
【对于faq格式的说明】
|
lark_file | -- | json | 否 | -- | 飞书文档的地址 |
tos_path | -- | string | 否 | -- | 已授权的 tos 目录(注意需要以/结尾)或指定文件路径
注:
|
url | -- | string | 否 | -- | 上传文档的 url 链接
|
meta | array 或 array 对应的json 字符串 | 否 | -- | meta 信息
| |
field_name | string | 否 | -- | 字段名
| |
field_type | string | 否 | -- | 字段类型
| |
field_value | 与 field_type指定类型一致 | 否 | -- | 字段值 | |
dedup | 否 | -- | 如果任一子参数为 true,表示需要去重,此时如果库中没有重复文档,会当做新文档导入。
注:只会检查 content 和 doc name,其他信息的变更不会检查,覆盖或当做新文档导入以上述标准为准。 | ||
content_dedup | bool | 否 | false | 内容去重
| |
doc_name_dedup | bool | 否 | false | 文档名称去重
|
参数 | 参数说明 | 备注 |
---|---|---|
code | 状态码 | |
message | 返回信息 | |
request_id | 标识每个请求的唯一标识符 | |
data | { | 通过tos目录/飞书导入时,不会返回。 |
状态码 | http状态码 | 返回信息 | 状态码说明 |
---|---|---|---|
0 | 200 | success | 成功 |
1000001 | 401 | unauthorized | 鉴权失败 |
1000002 | 403 | no permission | 权限不足 |
1000003 | 400 | invalid request:%s | 非法参数 |
1000005 | 400 | collection not exist | collection不存在 |
1001010 | 400 | doc num is exceed 10000 | doc数量已满 |
curl -i -X POST \ -H 'Content-Type: application/json' \ -H 'Authorization: HMAC-SHA256 ***' \ https://api-knowledgebase.mlp.cn-beijing.volces.com/api/knowledge/doc/add \ -d '{ "collection_name": "test_collection_name", "project": "", "add_type": "url", "doc_id": "test0123", "doc_name": "张某某盗窃案", "doc_type": "pdf", "url": "https://fwh-my-test-bucket.tos-cn-beijing.volces.com/%E6%96%B0%E6%A9%99%E7%A7%91%E6%8A%80/%E5%91%A8%E6%9D%A8%E7%9B%97%E7%AA%83%E6%A1%88.pdf?X-Tos-Algorithm=TOS4-HMAC-SHA256&X-Tos-Content-Sha256=UNSIGNED-PAYLOAD&X-Tos-Credential=AKTP0UZNtgnE7Lfth5eB2z0Z9qy2gyewikK9nbStjHp0OY%2F20240325%2Fcn-beijing%2Ftos%2Frequest&X-Tos-Date=20240325T114024Z&X-Tos-Expires=3600&X-Tos-SignedHeaders=host&X-Tos-Security-Token=nCgdqdEROend3.ChsKBzNzX056d3cSEGBgA9av-UtVs7ClfMkXS4oQk8WFsAYYo-GFsAYgle7V6QcoAjCSkLEJOhx6aGFpeXVqaWEuMDMyMkBieXRlZGFuY2UuY29tQgN0b3NSHHpoYWl5dWppYS4wMzIyQGJ5dGVkYW5jZS5jb21YBGAB.Nur_XCwZ_1LHmSsfeWGjDUn8SEOo3c6op5hx3lUgLZuxtHN_sqs-Kd0KbKw-51CT6wXKQo3AbmidScqVTu6gLQ&X-Tos-Signature=5c3dff2f8cd67daae99476d54188033cc32932d87f1ff85f4f1afd5862fa35cd", "meta":[ {"field_name":"行业","field_type":"string", "field_value":"企业服务"}, {"field_name":"是否公开","field_type":"bool", "field_value":True}, ] }'
执行成功返回:
HTTP/1.1 200 OK Content-Length: 43 Content-Type: application/json { "code":0, "message":"success", "request_id":"021695029537650fd001de666660000000000000000000230da93", "data":{ "collection_name": "张某某盗窃案", "resource_id": "kb-8349ef57441ab57", "project": "default", "doc_id": _sys_auto_gen_doc_id-17691607628519396693 } }
执行失败返回:
HTTP/1.1 400 OK Content-Length: 43 Content-Type: application/json {"code":1000003, "message":"invalid request:%s", "request_id": "021695029757920fd001de6666600000000000000000002569b8f"}