大数据文件存储(Cloud File System , 简称 CloudFS)是火山引擎面向大数据和机器学习生态的文件存储和加速服务,支持标准的 HDFS 协议访问和数据湖透明访问模式,为您提供低成本、高性能、高吞吐和高可用的大数据文件访问服务。
在传统的大数据生态,HDFS (Hadoop Distributed File System) 协议是文件存储访问标准,业界有大量的大数据业务系统基于标准的 HDFS 协议构建;同时,随着以对象存储为底座的数据湖生态的普及,越来越多的大数据和机器学习应用选择基于对象存储来构建。火山引擎大数据文件存储基于上述两个场景的核心需求,依托对象存储的超大容量和成本优势,支持标准的 HDFS 协议访问,提供统一的服务化弹性加速能力,为上层数据生态的计算应用提供灵活的使用模式和统一的访问入口,让上层业务更多的聚焦在核心业务逻辑的构建,实现更大的业务价值。
火山引擎 CloudFS 提供 Serverless 的服务化使用模式,您开通大数据文件存储服务后,即可在火山引擎云服务器 ECS 或容器 VKE 集群上通过 SDK 和 CLI 访问使用。此外,CloudFS 也和批式计算 Spark 版、流式计算 Flink 版等数据生态无缝打通,您可以轻松地接入其他数据产品。