大数据文件存储(CloudFS)支持私有化部署,搭建高可靠,低成本,无限容量的分布式文件系统,并可与火山引擎流式计算 Flink、批式计算 Spark等产品结合部署使用。
大数据文件存储(CloudFS)是面向大数据和机器学习生态的文件存储产品和服务,支持完整的HDFS语义,无需修改代码即可使用高可靠、低成本、高可用的分布式文件系统,在文件存储场景无缝兼容HDFS使用方式,在数据湖场景提供多元格式数据的存储与使用能力。
大数据文件存储(CloudFS)支持私有化部署,与公有云保持同源演进,针对私有化部署的大数据文件存储进行云原生改造,实现线下大数据引擎云原生部署和全生命周期管理,为客户构建新一代大数据存储底座。
金融、制造、医疗等行业进行大数据流、批处理和数据分析,用于报表生成,客户分析等。
客户痛点:存算一体架构资源扩缩难;存储可靠性差;成本高
关键特性:计算&缓存资源动态伸缩、海量的存储空间、稳定可靠的存储服务
金融、制造、医疗等行业大量使用AI服务业务,如:用户分析、智能推荐、病灶检查等
客户痛点:数据量级大,处理、移动困难;数据的IO要求高,TOS 无法满足;小文件数量多;数据格式复杂。
关键特性:数据统一管理、小文件场景优化、为模型训练提供充沛的 I/O 能力。