参数名 | 示例 | 含义 |
---|---|---|
serverless.ray.entrypoint.bundle.path | tos://some-bucket/demo.zip | 代码zip包 tos地址 |
serverless.ray.entrypoint.cmd | python test.py | 代码入口 |
serverless.ray.image | emr-serverless-online-cn-beijing.cr.volces.com/emr-serverless-ray/ray:2.30.0-cu11.8.0-py3.11-ubuntu20.04-233 | ray镜像 |
serverless.ray.version | 2.30.0 | 镜像ray版本 |
serverless.customized.image.enabled | true | 是否使用自定义镜像。当使用客户账号的镜像时,需要设为 true |
serverless.ray.runtime.env.json | {"pip":["requests==2.26.0","pendulum==2.1.2","s3fs"],"env_vars":{"counter_name":"test_counter"}} | ray runtime env |
serverless.ray.head.cpu | 4 | head cpu资源限制 |
serverless.ray.head.memory | 16Gi | head 内存资源限制 |
serverless.ray.head.gpu.amount | 1 | head gpu资源限制,使用gpu队列时可用 |
serverless.ray.head.gpu.vendor | nvidia.com | head gpu厂商,使用gpu队列时可用 |
serverless.ray.worker.cpu | 4 | worker cpu资源限制 |
serverless.ray.worker.memory | 16Gi | worker 内存资源限制 |
serverless.ray.worker.gpu.amount | 1 | worker gpu资源限制,使用gpu队列时可用 |
serverless.ray.worker.gpu.vendor | nvidia.com | worker gpu厂商,使用gpu队列时可用 |
serverless.ray.worker.replicas | 1 | worker 数量。开启自动扩缩容时为初始worker数量 |
serverless.ray.enable.autoscaling | true | 是否开启自动扩缩容 |
serverless.ray.worker.min.replicas | 1 | 自动扩缩容worker最小数量 |
serverless.ray.worker.max.replicas | 10 | 自动扩缩容worker最大数量 |
serverless.ray.autoscaler.options.idle.timeout.seconds | 60 | 自动缩容空闲时间阈值 |
serverless.ray.autoscaler.options.cpu | 500m | autoscaler cpu资源限制。默认 500m,通常无需修改 |
serverless.ray.autoscaler.options.memory | 512Mi | autoscaler 内存资源限制。默认 512Mi,通常无需修改 |
serverless.ray.head.pod.env | [{"name":"ENV_K1","value":"ENV_V1"}] | head 环境变量 |
serverless.ray.worker.pod.env | [{"name":"ENV_K1","value":"ENV_V1"}] | worker 环境变量 |
serverless.ray.burst.vci | true | 是否允许弹性到vci,开启将采取按量计费,使用时建议联系火山EMR同学 |
serverless.ray.node.selector | some-node-label | ray节点选择,使用时建议联系火山EMR同学 |
serverless.ray.toleration | some-node-toleration | ray污点容忍,使用时建议联系火山EMR同学 |