说明
知识库服务提供了默认公共推理接入点,方便用户快速开启知识问答试用及调试。但在有较高生产级 QPS (Query Per Second,每秒查询并发量)需求,或想要使用精调模型进行对话问答的场景时,建议使用自建推理接入点
在使用大语言模型时,往往需要将模型部署成在线服务,并生成唯一服务访问入口,即为推理接入点
进入【火山方舟】产品控制台 / 在线推理 模块,点击【创建推理接入点】
在创建接入点时,可以按照业务实际需求,填写业务名称及描述信息。重点关注以下参数配置:
说明
重排模型暂未对全量客户开放构建私有推理接入点,如有需要,请先联系火山客服对重排模型进行加白
在工作人员操作模型加白后,您将会受到一条共享邀约通知:
您会在火山方舟的模型仓库收到一条邀约提醒,点击“立即处理”前往「资源共享」平台。
接受共享邀约
在【资源管理】平台左侧导航栏选择【共享给我】,可查看收到的资源共享。
点击“接受”共享邀请,就可以访问该共享资源。您可以前往火山方舟【模型仓库】查看接受的共享模型。
请确保您已经拥有重排模型的访问权限,并参考如下步骤进行接入点构建:
在创建推理接入点,需选择【模型仓库】下的 “共享” rerank 模型进行创建
注意:不要选择其他模型,非 rerank 模型的接入点,无法在检索测试时选到
在进行检索测试时,若开启【重排模型】可点击模型卡片,并在展开下拉框里选择已创建的推理接入点,若未创建过,也可以直接点击【创建接入点】跳转至火山方舟控制台进行新建
在创建推理接入点,可以选择使用【模型广场】下的官方 Doubao 模型进行构建,也可以按需切换到【模型仓库】使用精调后的模型进行构建。
在进行检索测试时,开启【大模型回答】,先选择想要使用的模型,再选择模型对应私有接入点即可
此外,通过 API 调用私有接入点可参考 search