在 ML 服务中,系统预置了公共模型,同时也支持创建自定义模型。本文介绍创建自定义模型的操作步骤。
前提条件 已启用 ML 服务且为运行状态。如何启用,请参见创建 ML 服务 。 创建自定义模型时,需要准备好模型文件。您可以提前将模型文件存放到 TOS Bucket,也可以在创建自定义模型时直接上传本地的模型文件。注意
从 TOS Bucket 中读取模型文件,需要当前账号拥有 Bucket 的读
权限,即至少拥有GetObject
权限;上传本地模型文件会被存储到指定的 TOS Bucket,需要当前账号拥有 Bucket 的写
权限,即至少拥有PutObject
权限。
如何为 IAM 用户授予指定 Bucket 的读写权限,请参见授予 IAM 用户指定桶上传和下载对象的权限 。
创建模型 登录云搜索服务控制台 。
在顶部导航栏,选择目标项目和地域。
在左侧导航栏选择 ML 服务 ,查找并单击目标服务名称。
在左侧导航栏选择模型管理 > 我的模型 ,然后单击创建模型 。
在创建模型 对话框,设置模型相关参数,然后单击确定 。
参数
说明
模型名称
自定义设置模型名称。
首字符仅支持字母或下划线(_)。 可包含字母、数字、特殊字符仅支持英文句号(.)、下划线(_)、短横线(-)、反斜杠(/),长度为 1~128 个字符。 最多只能包含一个反斜杠(/)字符。 模型类型
请根据实际情况选择模型类型。
Text Embedding :文本嵌入,将文本转化为计算机可以理解的数字向量的方法,这些向量能捕捉文本的语义信息。Rerank :重排序,是一种排列搜索结果的技术,依据相关性进行排列,将最相关的结果放在最前面以便用户更快找到他们需要的信息。RAG :把 OpenSearch 的混合检索与大模型生成结果相结合,得到更具语义连贯性和信息准确性的结果。Image Embedding :是将图像转换为低维的向量表示,以便于在各种机器学习任务中进行处理、分析和比较。Sparse Embedding :稀疏嵌入模型是一种处理高维稀疏数据的技术,通过将稀疏特征映射到低维空间的方式来节省存储空间、提高计算效率。说明
目前支持 Sentence Transformer 和 Transformer 模型框架。
对象存储桶
从下拉列表中选择一个用于存放模型文件的对象存储桶。
如果没有可用的 TOS 存储桶,请单击创建存储桶 ,前往对象存储控制台进行创建。
模型文件
选择模型文件的配置方式。
对象存储文件:此时需要选择对象存储桶中的目标文件夹,表示中模型文件已提前保存到 Bucket。 上传本地文件:从本地选择模型文件或文件夹,然后上传到对象存储桶的目标文件夹。上传文件时,仅支持上传名称为model.zip
的模型文件。 注意
如果当前账号没有对应 Bucket 的读
权限(至少拥有GetObject
权限),则无法获取到 Bucket 中的文件列表。 如果当前账号没有对应 Bucket 的写
权限(至少拥有PutObject
权限),则无法将模型文件存放到对象存储桶。 需要确保当前账号拥有 TOS Bucket 的读写权限。如何为 IAM 用户授予指定 Bucket 的读写权限,请参见授予 IAM 用户指定桶上传和下载对象的权限 。
对象存储文件夹
模型文件的存放位置,即从该文件夹读取模型文件,或者上传本地模型文件到该文件夹。
描述
设置模型的描述语句。
后续步骤 模型创建后,您需要继续创建推理服务。创建推理服务时,需要与目标模型进行关联,并根据业务需求配置网络、资源、以及自定义参数等内容。