推理服务启用后,您可以查看推理服务的信息,包含推理服务的配置信息、模型的访问地址和调用信息,以及推理服务的运行日志。
功能入口
- 登录云搜索服务控制台。
- 在顶部导航栏,选择目标项目和地域。
- 在左侧导航栏选择 ML 服务,查找并单击目标服务名称。
- 在左侧导航栏选择推理服务,然后单击目标推理服务的名称。
查看推理服务的配置信息
在基本信息页签下,您可以查看推理服务的配置信息,包括服务名称、可用区、资源配置、自定义参数等信息。
查看模型访问地址和调用信息
- 在访问信息区域,您可以查看推理服务关联模型的私网访问地址和调用信息。支持在此处配置 ML 服务的公网访问,包括开启公网访问、关闭公网访问以及配置 IP 白名单,详情请参见配置 ML 服务公网访问。
- 单击查看调用信息,即可查看并获取模型的 OpenSearch 插件调用地址信息。如何使用插件地址调用模型,请参见Text Embedding 模型使用案例。
- 单击私网调用信息或公网调用信息,查看模型的调用信息。替换掉调用信息中的**$API_KEY**,即可在 ECS 中直接调用模型。
- 对于了 RAG 类型模型,您可以单击效果测试,系统将为打开一个 Web 页面用于测试。
更多信息,请参见结果验证:访问 RAG 推理服务(智能问答)。
查看模型服务的运行日志
在日志页签下,您可以查看推理服务的运行日志。支持根据时间范围、日志等级、关键字等方式,精准查看日志。
说明
只能查询 7 日内的日志。在日志保留期间,可以查看历史日志。