Bio-OS中的数据存储在云端,用户能够通过链接的形式进行直接使用,而不用下载到本地存储,从而节省传输时间成本和存储成本。在数据中有实体数据模型,Workspace数据模型以及文件。
数据模型是通过数据表格的形式对生信数据进行整理、组织和展示,也为工作流批量运行实现向量化计算提供基础,同时能够同时作为工作流统一呈现输入数据和输出结果,是工作流的起点和终点。
在这里你可以通过点击下载CSV文件模板,并进行编辑数据,csv中至少包含一个实体行,完后编辑后上传CSV文件,拖拽到对应位置可完成文件上传。
最后点击导入数据表完成数据模型的创建
生成实体集合主要是将两个及以上数据行组合生成新的实体集合,无需用户自己创建数组内容
在实体数据模型页,勾选所需数据样本(2个以上)后,点击生成实体集合,数据实体集名称,即作为数据实体集表的ID。ID默认为:实体集名称_set-年份-月份-日-小时-分钟-秒
Workspace级别数据是针对整个Workspace中不同工作流所需用到的公共数据进行统一管理,不再需要对于实体表中每一例样本都需要在附加这些共同的资源,如用到的公共的参考数据、镜像地址等等。一般来说您可以将如参考基因组的数据关联到Workspace数据模型。
点击导入,弹窗后拖拽已编辑的CSV文件进行上传。您也可以对已导入的文件进行下载和删除。
文件列表所对应的即为当前Workspace的对象存储TOS桶
说明
文件夹最多支持上传2000个文件,每个文件最大限额为2G。大文件建议使用CLI工具进行上传下载。
文件列表中的 notebook/ 文件夹用于存放Notebook是中的ipynb文件,请勿在此文件夹中进行修改和上传。
点击左侧菜单数据, 选择文件列表-上传文件/上传文件夹,支持用户拖拽上传或点击选择本地文件上传。
需要注意的是,如果需要在notebook中使用文件列表中上传的图片或文件,需要修改文件权限,具体操作如下,修改为公共读后的文件方可在notebook中使用。