说明
知识库服务提供了默认公共推理接入点,方便用户快速开启知识问答试用及调试。但在有较高生产级 QPS (Query Per Second,每秒查询并发量)需求,或想要使用精调模型进行对话问答的场景时,建议使用自建推理接入点
在使用大语言模型时,往往需要将模型部署成在线服务,并生成唯一服务访问入口,即为推理接入点
进入【火山方舟】产品控制台 / 在线推理 模块,点击【创建推理接入点】
在创建接入点时,可以按照业务实际需求,填写业务名称及描述信息。重点关注以下参数配置:
在创建推理接入点,可以选择使用【模型广场】下的官方 Doubao 模型进行构建,也可以按需切换到【模型仓库】使用精调后的模型进行构建。
在进行检索测试时,开启【大模型回答】,先选择想要使用的模型,再选择模型对应私有接入点即可
此外,通过 API 调用私有接入点可参考 search_knowledge(新)