Bio-OS 生信操作系统是火山引擎面向生信从业者推出的全新的基于云原生化架构的生物医学信息分析平台,提供生物医学数据传输、数据存储、数据管理、生物信息分析等核心能力,端到端贯穿生信分析 Preprocessing-Processing-Postprocessing 全生命周期,Bio-OS 以 workspace 为工作核心,基于开放兼容的技术架构,帮助生物信息从业人员实现分析流程可重入、研究结果可复现、操作过程可追溯、知识可沉淀和传播的目标。
平台支持全球基因组学与健康联盟GA4GH社区开放标准和规范,持续积累和沉淀公开标准的数据集和工具资源,用户能够即取即用,快速开展任意数据规模的基因分析任务。
基因分析平台产品功能架构如下:
生信工作流分析: Bio-OS 生信操作系统支持全球基因组学和健康联盟GA4GH下的WES API规范,面向开放兼容的架构体系,支持WDL、CWL等热门、标准的工作流规范,支持大规模生信分析工作流运行、工作流程可重入、工作流程可复现、工作流程可移植等特性,助力生信从业者快速、灵活、便捷的开启生信分析工作和研究。
生信数据管理: Bio-OS 生信操作系统中的数据均存储在“云端”,秉承数据只存一份的理念,以对象存储作为存储介质,能够实现随时随地的获取、传输和使用;此外平台提供生信数据模型管理,通过数据表格的形式对生信数据进行整理、组织和展示,也为工作流批量运行实现向量化计算提供基础,同时能够同时作为工作流统一呈现输入数据和输出结果,是工作流的起点和终点。
生信数据实时交互分析: Bio-OS 生信操作系统集成了 Jupyter hub开源组件,提供符合生信人员使用习惯的实时交互分析环境,助力生信从业人员开展生信数据预处理、数据统计及数据可视化展示等工作。
多云异构环境支持: Bio-OS 生信操作系统支持多云异构的环境管理,根据任务类型、任务量级能够灵活方便的将任务投递到私有云环境和公有云环境;支持根据用户使用习惯,将任务投递到容器集群和HPC集群,将资源利用率和灵活性最大化。