You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

产品优势

高效通信

极致可扩展算力

高性能计算集群内的实例间最高支持3.2 Tbps RDMA网络高速互联,微秒级别超低时延,为大规模训练提供高线性加速比。
智能运维

持续稳定运行

一键自动检测工具达到分钟级故障定位,毫秒级监控帮助精准分析异常。故障后自动发送事件通知,多种处理方式降低业务影响。
亲和调度

通信最优选路

训练任务亲和调度到同交换机下通信,配合多导轨物理网络架构,让数据少绕路训练更高效。
算力底座

无缝对接火山方舟

提供稳定高效的算力底座,与机器学习平台、火山方舟一起打造从基础设施到模型生态的完整解决方案,助力AI赋能千行百业。

产品功能

HPC集群

HPC集群

高性能计算集群内所有计算节点通过RDMA高速网络互联,且支持通过RDMA 直接访问vePFS 文件存储。
高速存储

高速存储

提供高吞吐、低延时、可扩展并行的文件存储,与计算集群间高达400GB/s通信网络,10分钟级完成训练数据拉取。
开箱即用

开箱即用

GPU云服务器支持丰富的系统环境和软件支持,涵盖各类主流镜像,封装多版本CUDA和驱动,提供开箱即用的AI基础架构能力。
容器共享

容器共享

在保证性能和故障隔离的基础上, 支持启动多个容器共享一张 GPU ,实现GPU算力与显存的灵活切分与隔离,提升 GPU 使用率。
HPC集群

HPC集群

高性能计算集群内所有计算节点通过RDMA高速网络互联,且支持通过RDMA 直接访问vePFS 文件存储。
高速存储

高速存储

提供高吞吐、低延时、可扩展并行的文件存储,与计算集群间高达400GB/s通信网络,10分钟级完成训练数据拉取。
开箱即用

开箱即用

GPU云服务器支持丰富的系统环境和软件支持,涵盖各类主流镜像,封装多版本CUDA和驱动,提供开箱即用的AI基础架构能力。
容器共享

容器共享

在保证性能和故障隔离的基础上, 支持启动多个容器共享一张 GPU ,实现GPU算力与显存的灵活切分与隔离,提升 GPU 使用率。

应用场景

大语言模型训练

AI内容生成推理

自动驾驶

科学计算

架构图
大语言模型训练
提供稳定高性价比的算力, 3.2Tbps RDMA高速网络,高性能文件存储,轻松应对大规模分布式训练场景。

架构优势

高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络

相关产品

架构图

架构优势

高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络
架构图
AI内容生成推理
采用ECS+VKE+TOS等多项产品服务组合方案,为客户提供灵活、弹性、高性价比的推理服务GPU集群,迅速满足业务需求。

架构优势

提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力

相关产品

架构图

架构优势

提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力
自动驾驶
自动驾驶
在智能驾驶的源数据上云、数据预处理/预标注、自驾训练等环节中,提供弹性灵活的ECS和GPU算力、高性能存储vePFS和RDMA网络,协助用户完成自驾业务的快速升级和迭代。

架构优势

全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化

相关产品

自动驾驶

架构优势

全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化
科学计算
科学计算
在科研和工程仿真领域,火山云可以在生命科学、宇宙天文、量子物理、计算化学和天体物理材料设计、气候气象,海洋探测等学科中匹配上层应用的高性能计算集群。

架构优势

高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新

相关产品

科学计算

架构优势

高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新

大语言模型训练

架构图

架构优势

高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络
架构图

架构优势

提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力
自动驾驶

架构优势

全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化
科学计算

架构优势

高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新

产品动态