数据

实体数据模型

数据模型是通过数据表格的形式对生信数据进行整理、组织和展示,也为工作流批量运行实现向量化计算提供基础,同时能够同时作为工作流统一呈现输入数据和输出结果,是工作流的起点和终点。

创建新数据模型

  1. 点击实体数据模型右侧的蓝色 + 按键,弹出导入实体表弹窗

  1. 在这里你可以通过点击【下载CSV文件模板】,并进行编辑数据,csv中至少包含一个实体行,完后编辑后上传CSV文件,拖拽到对应位置可完成文件上传。

  2. 最后点击导入表完成数据模型的创建。

生成实体集合

生成实体集合主要是将两个数据行组合生成新的实体集合,无需用户自己创建数组内容在实体数据模型页,勾选所需数据样本(2个以上)后,点击生成实体集合,数据实体集名称,即作为数据实体集表的ID。ID默认为:实体集名称_set--年份-月份-日-小时-分钟-秒

Workspace数据模型

Workspace级别数据是针对整个Workspace中不同工作流所需用到的公共数据进行统一管理,不再需要对于实体表中每一例样本都需要在附加这些共同的资源,如用到的公共的参考数据、镜像地址等等。一般来说您可以将如参考基因组的数据关联到Workspace数据模型。点击导入,弹窗后拖拽已编辑的CSV文件进行上传。您也可以对已导入的文件进行下载和删除。

NAS文件存储数据

workspace支持挂载NAS用于存放参考数据与样本数据。

  1. ssh远程连接集群管理节点;

  1. 返回节点根目录

  1. 进入nfs目录:

  1. 进入bioos-storage目录,并找到workspace所挂载的文件路径:

  1. 使用scp上传数据至workspace对应的nas挂载路径;

  1. 上传完成之后,将参考数据与样本数据的NAS地址用于制作数据模型。

Last updated