说明
知识库服务提供了默认公共推理接入点,方便用户快速开启知识问答试用及调试。但在有较高生产级 QPS (Query Per Second,每秒查询并发量)需求,建议使用自建的推理接入点。
创建推理接入点请参考【+创建推理接入点】。在创建时,重点关注以下参数配置:
说明
重排模型暂未对全量客户开放构建私有推理接入点,如有需要,请先请先联系「联系我们」协调资源加白
在工作人员操作模型加白后,您将会收到一条共享邀约通知:
您会在火山方舟的模型仓库收到一条邀约提醒,点击“立即处理”前往「资源共享」平台。
接受共享邀约
在【资源管理】平台左侧导航栏选择【共享给我】,可查看收到的资源共享。
点击“接受”共享邀请,就可以访问该共享资源。您可以前往火山方舟【模型仓库】查看接受的共享模型。
请确保您已经拥有重排模型的访问权限,并参考如下步骤进行接入点构建:
在创建推理接入点,需选择【模型仓库】下的 “共享” rerank 模型进行创建
注意:不要选择其他模型,非 rerank 模型的接入点,无法在检索测试时选到
在进行检索测试时,若开启【重排模型】可点击模型卡片,并在展开下拉框里选择已创建的推理接入点,若未创建过,也可以直接点击【创建接入点】跳转至火山方舟控制台进行新建