We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
文档
备案
控制台
登录
立即注册
GPU云服务器
GPU 云服务器(GPU Cloud Computing)是提供 GPU 算力的弹性计算服务,具有高效稳定的计算能力,适用于生成式AI、自动驾驶、图像处理、科学计算等多种应用场景。
GPU 云服务器提供高效稳定的多场景算力服务。
3.5
倍
AI性能提升
3.2
Tbps RDMA
超低延迟网络
vRDMA
高速互联
立即使用
规格清单
产品文档
产品优势
产品功能
应用场景
客户案例
使用指南
产品动态
产品优势
立即咨询
高效通信
极致可扩展算力
高性能计算集群内的实例间最高支持3.2 Tbps RDMA网络高速互联,微秒级别超低时延,为大规模训练提供高线性加速比。
智能运维
持续稳定运行
一键自动检测工具达到分钟级故障定位,毫秒级监控帮助精准分析异常。故障后自动发送事件通知,多种处理方式降低业务影响。
亲和调度
通信最优选路
训练任务亲和调度到同交换机下通信,配合多导轨物理网络架构,让数据少绕路训练更高效。
算力底座
无缝对接火山方舟
提供稳定高效的算力底座,与机器学习平台、火山方舟一起打造从基础设施到模型生态的完整解决方案,助力AI赋能千行百业。
产品功能
立即咨询
HPC集群
高性能计算集群内所有计算节点通过RDMA高速网络互联,且支持通过RDMA 直接访问vePFS 文件存储。
高速存储
提供高吞吐、低延时、可扩展并行的文件存储,与计算集群间高达400GB/s通信网络,10分钟级完成训练数据拉取。
开箱即用
GPU云服务器支持丰富的系统环境和软件支持,涵盖各类主流镜像,封装多版本CUDA和驱动,提供开箱即用的AI基础架构能力。
容器共享
在保证性能和故障隔离的基础上, 支持启动多个容器共享一张 GPU ,实现GPU算力与显存的灵活切分与隔离,提升 GPU 使用率。
HPC集群
高性能计算集群内所有计算节点通过RDMA高速网络互联,且支持通过RDMA 直接访问vePFS 文件存储。
高速存储
提供高吞吐、低延时、可扩展并行的文件存储,与计算集群间高达400GB/s通信网络,10分钟级完成训练数据拉取。
开箱即用
GPU云服务器支持丰富的系统环境和软件支持,涵盖各类主流镜像,封装多版本CUDA和驱动,提供开箱即用的AI基础架构能力。
容器共享
在保证性能和故障隔离的基础上, 支持启动多个容器共享一张 GPU ,实现GPU算力与显存的灵活切分与隔离,提升 GPU 使用率。
应用场景
大语言模型训练
AI内容生成推理
自动驾驶
科学计算
大语言模型训练
提供稳定高性价比的算力, 3.2Tbps RDMA高速网络,高性能文件存储,轻松应对大规模分布式训练场景。
架构优势
高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络
立即咨询
相关产品
容器服务
对象存储
架构优势
高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络
相关产品
容器服务
对象存储
AI内容生成推理
采用ECS+VKE+TOS等多项产品服务组合方案,为客户提供灵活、弹性、高性价比的推理服务GPU集群,迅速满足业务需求。
架构优势
提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力
立即咨询
相关产品
云服务器
容器服务
对象存储
架构优势
提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力
相关产品
云服务器
容器服务
对象存储
自动驾驶
在智能驾驶的源数据上云、数据预处理/预标注、自驾训练等环节中,提供弹性灵活的ECS和GPU算力、高性能存储vePFS和RDMA网络,协助用户完成自驾业务的快速升级和迭代。
架构优势
全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化
立即咨询
相关产品
云服务器
容器服务
文件存储 vePFS
对象存储
架构优势
全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化
相关产品
云服务器
容器服务
文件存储 vePFS
对象存储
科学计算
在科研和工程仿真领域,火山云可以在生命科学、宇宙天文、量子物理、计算化学和天体物理材料设计、气候气象,海洋探测等学科中匹配上层应用的高性能计算集群。
架构优势
高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新
立即咨询
相关产品
云服务器
文件存储 vePFS
架构优势
高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新
相关产品
云服务器
文件存储 vePFS
大语言模型训练
架构优势
高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络
相关产品
容器服务
对象存储
AI内容生成推理
架构优势
提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力
相关产品
云服务器
容器服务
对象存储
自动驾驶
架构优势
全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化
相关产品
云服务器
容器服务
文件存储 vePFS
对象存储
科学计算
架构优势
高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新
相关产品
云服务器
文件存储 vePFS
客户案例
火山引擎与月之暗面深度合作,
提供AI训练和推理加速解决方案。
查看详情
火山引擎携手毫末智行,
共同冲刺自动驾驶3.0时代。
查看详情
火山引擎助深势科技,
发布行业首个三维分子预训练模型Uni-Mol。
查看详情
彼真科技&火山引擎,
打造虚拟演出全新体验。
查看详情
使用指南
产品简介
提供GPU算力,适用于AI训练、AI推理、科学计算、视频渲染等场景。
什么是GPU云服务器
产品优势
应用场景
GPU实例规格介绍
GPU计算型
高性能计算GPU型
快速入门
准备工作
购买GPU计算型实例
购买高性能计算GPU型实例
用户指南
实例操作指引
NVIDIA驱动安装指引
最佳实践
实例选型最佳实践
HPC-制作RDMA容器镜像
HPC-基于LLaMA的RDMA配置指南
搭建应用
GPU-部署Pytorch应用
GPU-搭建AIGC能力(Linux)
HPC-配置NCCL
产品动态
2023-09-05
单个HPC集群支持挂载5个vePFS
HPC GPU高性能计算集群与vePFS智算版并行文件系统互通RDMA,绑定数量从1:1增加到1:5。
2023-07-10
支持查询实例的RDMA网络交换机信息
可以通过openAPI查询高性能计算GPU型实例所在物理位置的RDMA网络交换机信息,以此进行训练任务调度和排序。
2023-06-21
实例监控新增RDMA相关指标
高性能计算GPU型实例监控新增RDMA相关指标,您可通过云监控服务实时监控RDMA CNP、ECN和QP等相关指标数据。
2023-06-20
GPU实例硬件相关FAQ发布
围绕GPU实例的常见故障,梳理处理建议和FAQ,提升用户体验。
2023-06-19
Windows 2022镜像支持内置GRID
GPU渲染型实例新增支持Windows 2022数据中心版with GRID 镜像,内置GPU驱动和VWS授权。
2023-06-12
GPU支持ENI trunking特性
通过对接ENI trunking,单个GPU规格切分之后,可以支持更高密度的容器。
2023-06-12
GPU支持ENI trunking特性
通过对接ENI trunking,单个GPU规格切分之后,可以支持更高密度的容器。
2023-04-27
A800实例 ebmhpcpni2l 邀测上线
火山引擎邀测发布基于NVIDIA A800 Tensor Core GPU的高性能计算GPU型实例ebmhpcpni2l
2023-04-27
A10实例gni2、gni2-vws邀测上线
GPU云服务器正式发布基于NVIDIA A10 Tensor Core GPU的云服务器gni2、gni2-vws实例。
2023-09-05
单个HPC集群支持挂载5个vePFS
HPC GPU高性能计算集群与vePFS智算版并行文件系统互通RDMA,绑定数量从1:1增加到1:5。
2023-07-10
支持查询实例的RDMA网络交换机信息
可以通过openAPI查询高性能计算GPU型实例所在物理位置的RDMA网络交换机信息,以此进行训练任务调度和排序。
2023-06-21
实例监控新增RDMA相关指标
高性能计算GPU型实例监控新增RDMA相关指标,您可通过云监控服务实时监控RDMA CNP、ECN和QP等相关指标数据。
2023-06-20
GPU实例硬件相关FAQ发布
围绕GPU实例的常见故障,梳理处理建议和FAQ,提升用户体验。