模型管理服务(Model Management Service,MMS)是一套可对用户加密模型实现在线发布和自动化部署的服务,能够保障用户私有模型在云上的安全性。
PCC规格 | 说明 |
---|---|
基础版 | 支持小尺寸的模型,如1.5B,具体以实际验证为准。 |
高级版 | 支持中尺寸的模型,如32B,具体以实际验证为准。 |
旗舰版 | 支持大尺寸的模型,如DeepSeek R1-671B(满血版),具体以实际验证为准。 |
PCC当前已支持DeepSeek等常用开源模型的快速部署。
点击「发布模型」,切换「模型类型」为“开源模型”,填写模型名称、模型版本、模型描述,并指定开源模型后,点击「确定」完成发布。
发布完成后,在模型列表选择该模型点击「部署」,并确认PCC规格、推理框架和实例个数等,PCC将根据默认参数进行部署。需要说明的是,不同尺寸模型,部署耗时会有差异。
PCC支持将私有模型加密后做部署。
export VERSION=0.1.7.24
pip3 install bytedance.jeddak_secure_channel-${VERSION}-py3-none-any.whl
Bash
from bytedance.jeddak_secure_model.model_encryption import EncryptionConfig, JeddakModelEncrypter
if __name__ == "__main__":
model_path = "/root/pcc/Qwen32B" # 模型的文件夹路径
bucket_name = "llmmodels" # 创建TOS的存储桶
# 火山账号的ak sk
volc_ak = "your access key"
volc_sk = "your secret key"
region = "cn-beijing" # 存储桶的区域,对应的映射关系见步骤5
endpoint = "tos-cn-beijing.volces.com"
ring_id = "" # 选填,如已有密钥环,在此填写密钥环ID;如未填,则会根据`ring_name` 自动创建密钥环
ring_name = "Qwen32B-Ring" # 自定义密钥环名称
ring_desc = "Ring for Qwen32B" # 添加对密钥环的描述
key_name = "Qwen32BKey" # 自定义密钥名称
key_desc = "Key for Qwen32B" # 添加对可信密钥的描述
app_id = "your account id" # 火山页面查看自己账号的app_id
service = "pcc"
# 目前参数传空的
config = EncryptionConfig("", "")
encrypter = JeddakModelEncrypter(config)
res = encrypter.encrypt_model_and_upload(
model_path=model_path,
bucket_name=bucket_name,
volc_ak=volc_ak,
volc_sk=volc_sk,
region=region,
endpoint=endpoint,
ring_id=ring_id,
ring_name=ring_name,
ring_desc=ring_desc,
key_name=key_name,
key_desc=key_desc,
app_id=app_id,
service=service
)
print(res)
Bash
python3 sdk.py
Bash
属性 | 释义 |
---|---|
ring_id | 加密模型的可信密钥环ID |
key_id | 加密模型的可信密钥ID |
baseline | 加密模型的基线值 |
model_name | 加密模型的名称 |
通过模型管理服务「发布模型」入口,弹窗填写相关字段信息后,完成加密模型发布。模型名称、模型版本、加密密钥、基线值、TOS地址等信息均已在「准备工作」环节获取。
对于已发布且处于【待部署】状态的模型,点击「部署」后,选择PCC规格、推理框架和实例个数等,PCC将根据默认参数进行部署。需要说明的是,不同尺寸模型,部署耗时会有差异。
完成部署的模型,可点击「测试」,对模型可用性做检测,检测通过则状态从【未测试】更新为【测试成功】。