手动任务为通过控制台或 OpenAPI 手动创建的数据流动任务。本文介绍在 vePFS 控制台上创建及管理手动任务的操作步骤。
前提条件
- 已创建文件系统,并配置数据流动带宽,具体步骤,请参见创建文件系统、配置数据流动带宽。
- 已在文件系统中创建数据流动的目录,可为 Fileset 或子目录,若为 Fileset,请先创建 Fileset,具体操作步骤请参见创建 Fileset。
- 已创建数据流动的 TOS 桶,具体操作步骤请参见创建存储桶。
注意事项
- 配置的 Fileset(子目录)或目录、前缀不能与其他手动任务(状态为创建中、运行中或取消中)中的配置存在嵌套。
- 请确认手动输入目录的准确性,若目录不存在则会直接创建该目录。
操作步骤
- 登录 vePFS 控制台。
- 在顶部菜单栏,选择目标文件系统所在地域。
- 在左侧导航栏,选择文件系统 > 实例列表,在实例列表页面,单击目标文件系统名称。
- 在实例概览页,单击数据流动页签,进入数据流动页签。
- 在数据流动页签,单击数据流动任务>手动任务页签。
- 在手动任务页面,单击创建任务,在右侧面板中,设置数据流动路径和数据流动任务参数。
数据流动路径:参数说明如下。
配置路径
自定义数据流动路径。
| 参数 | 是否必选 | 说明 |
---|
文件存储路径 | 文件系统ID | 是 | 无需手动填写,系统自动带出当前流动所属文件系统ID用于确认 |
文件系统路径 | 是 | 设置当前文件系统中需要进行数据流动的路径,可选: - 文件系统根目录
- 即整个文件系统的根目录“/”
- 子目录:按需填写目录在文件系统中的绝对路径,需遵守下述路径设置规范。
- 输入目录文件系统中的绝对路径,以
/ 开头和结尾。 - 不能与其他任务(状态为创建中、运行中或取消中)中的 Flieset(子目录)或文件系统目录存在嵌套。
- Fileset
- 推荐选择 Fileset,Fileset 具备文件数量 Quota、性能 QoS 配置等能力。
- 选择 Fileset,按需设置 Fileset 子目录路径,约束限制如下:
- 输入子目录在 Fileset 中的相对路径,以
/ 开头和结尾。 - 不能与其他任务(状态为创建中、运行中或取消中)中的 Flieset(子目录)或文件系统目录存在嵌套。
注意 请确认手动输入目录路径的准确性,若目录不存在则会直接创建该目录。 |
对象存储路径 | TOS 桶 | 是 | 选择关联的 TOS 存储桶,可选同地域下的存储桶。 说明 - 界面上自动展示所选存储桶的版本控制功能开启状态,若状态为未开启或暂停,您可单击设置,启用所选存储桶的版本控制功能,具体操作步骤,参见开启和暂停版本控制。
- 建议在所选 TOS 存储桶中开启版本控制功能,当桶内文件被覆盖时,可通过版本控制功能,将文件恢复至任意历史版本。
|
TOS 桶前缀 | 否 | 指定所选存储桶中,与文件系统进行数据流动的前缀,约束限制如下: - 以
/ 开头和结尾。 - 不能包含
./ 。 - 不能包含
../ 。 - 不能包含
// 。 - 长度需大于 1 字符。
- 不能与其他策略或手动任务(状态为创建中、运行中或取消中)中的前缀存在嵌套。
|
数据流动任务:
- 任务类型支持支持预热、沉降及对账任务,各任务参数说明如下。
- 预热:将对象存储数据导入文件系统。
- 沉降:将文件系统数据导出到对象存储。
- 对账:仅针对文件系统与对象存储设定目录内的文件进行对账,不执行任何文件的导入导出动作。
- 同名文件冲突策略:设置在数据流动过程中,对文件系统和 TOS 存储桶中同名文件的处理方式,可选:
* 保持最新文件:比较两者最后修改时间,保留最新版本。若两者最后修改时间相同,则跳过同名文件。
* 跳过同名文件:跳过同名文件,对目标侧同名文件不做处理。
* 覆盖同名文件:使用待预热或沉降的文件覆盖对端的同名文件。
* 数据类型:默认选择元数据和数据,即同时导入导出数据和元数据。
- 同名文件冲突策略:设置在数据流动过程中,对文件系统和 TOS 存储桶中同名文件的处理方式,可选:
* 保持最新文件:比较两者最后修改时间,保留最新版本。若两者最后修改时间相同,则跳过同名文件。
* 跳过同名文件:跳过同名文件,对目标侧同名文件不做处理。
* 覆盖同名文件:使用待预热或沉降的文件覆盖对端的同名文件。
* 软链接处理策略:
* 跳过软链接文件:软链接文件将不会导出到对象存储
* 导出为独立文件:将软链接文件作为实际文件导出至TOS,并作为独立的文件存储,与源文件无链接关系
* 数据类型:默认选择元数据和数据,即同时导入导出数据和元数据。
- 数据类型:默认选择元数据和数据。
* 对账范围:默认进行文件系统与对象存储的双向对账。
设置文件筛选条件
- 筛选范围:选择导入的数据范围,说明如下。
- 所有文件:将对配置路径内的所有文件执行数据流动任务。
- 指定文件列表:
- 上传文件列表:单击点击上传 txt 文件,上传包含多个前缀的
.txt
文件,导入此文件中列出的所有文件。 - 使用 TOS 中的文件列表:输入 TOS 中的文件路径,导入此文件中列出的所有文件。
文件中列出的前缀要求如下,详情可参考vePFS 数据流动目录配置最佳实践
- 预热任务:
- 为数据流动路径中指定的TOS 桶前缀的子前缀。
- 填写不包含 TOS 桶名称的完整前缀。
- 不同前缀之间使用回车键隔开。
- 沉降任务:
- 为数据流动路径中指定 Fileset 或 目录的子目录。
- 若为 Fileset 子目录,填写子目录相对 Fileset 的路径,否则,请填写目录的绝对路径。
- 不同目录路径之间使用回车键隔开。
:::
- 单击确定,保存当前数据流动任务。