日志服务提供便捷高效的数据导入功能,支持 Elasticsearch 等多种数据源。数据导入功能可以将您在 Elasticsearch 中的数据进行结构化,并保存在日志服务中,以便后续的查询分析、多平台消费处理。本文档介绍从 Elasticsearch 中导入数据到日志服务的操作步骤。
Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎。在服务上云、应用迁站等数据迁移场景中,您可以将数据从原有的 ELK 系统中快速导入到日志服务中。目前支持的数据源包括火山引擎 Elasticsearch、自建 Elasticsearch 集群、其他云厂商的 Elasticsearch 集群等。从 Elasticsearch 导入数据时,支持通过查询语句过滤数据、设置时间字段等。创建导入任务后还可以在日志服务控制台中查看导入进度及状态信息,或通过服务日志分析查看进度和状态的详细数据。
此外,日志服务还会为导入的日志数据添加以下元数据字段:
字段 | 说明 |
---|---|
| 该日志所属来源索引。 |
| 该日志所属文档 ID。 |
| 导入索引的对应 url,即索引所在 Elasticsearch 集群的服务地址。 |
_
)开头,则日志服务会默认为其添加 tag 前缀,以便后续开启索引、日志检索与分析。限制项 | 说明 |
---|---|
单条数据大小 | 支持导入的单条数据最大为 1MiB。导入时,如果数据大小超过此限制,该数据会被丢弃。 |
数据导入配置数量 | 每个日志项目最多可创建 100 个不同类型的数据导入任务。 |
导入数据范围 | 仅支持导入历史数据,即成功创建导入任务之后写入 Elasticsearch 的数据暂不支持导入到日志服务中。历史数据导入完成后,导入任务自动结束。 |
并发任务数量 | 导入任务采用 Scroll 模式拉取 Elasticsearch 数据,而 Elasticsearch 服务端存在 Scroll 请求数量限制,因此每个 Elasticsearch 集群所有导入任务对应的分区总数不能超过该限制,否则部分导入任务将失败。 |
修改导入任务 | 创建日志导入任务后,不可修改任务的数据源等配置。如果配置错误,请删除配置后重新创建。 |
ElasticSearch 数据导入功能的服务性能与多种因素有关。主要因素包括:
从 ElasticSearch 导入数据涉及日志服务的数据存储费用和内网读流量费用。具体的价格信息请参考日志服务计费项。
计费项 | 说明 |
---|---|
写流量 | ElasticSearch 数据写入到日志服务中,在日志服务中涉及写流量费用。流量费用根据压缩后的数据量进行计费。 |
日志存储 | 日志保存到日志服务后,后端会自动对其进行压缩,存储费用以压缩后的实际大小为准。 |
其他 |
|
登录日志服务控制台。
在顶部导航栏中,选择日志服务所在的地域。
在左侧导航栏中,选择常用功能 > 日志接入。
在数据导入区域选择 Elasticsearch。
填写基础信息配置。
配置 | 说明 |
---|---|
日志项目 | 用于存储 Elasticsearch 数据的日志项目。 |
日志主题名称 | 用于存储 Elasticsearch 数据的日志主题。 说明 云产品日志、服务日志等专属日志主题不支持导入数据。 |
填写数据源配置。
配置 | 说明 |
---|---|
任务名称 | 日志导入任务的名称。 |
ES接入URL | Elasticsearch 集群的服务地址,URL 格式,即 |
用户名 | Elasticsearch 用户名。 |
密码 | Elasticsearch 用户密码。 |
索引列表 | 待导入到日志服务中的索引。可设置多个索引,索引之间使用英文逗号(,)分隔,例如 |
ES 查询语句 | 用于过滤数据的查询语句,符合查询条件的数据才会导入到日志服务中。指定为 |
指定时间段 | 是否用指定 Elasticsearch 列作为日志时间。默认情况下,日志服务采用数据导入时的系统时间作为日志时间。您也可以开启指定时间段设置,开启后需要指定 Elasticsearch 索引中表示时间的列名,日志服务会用该字段值作为日志时间。
|
导入模式 | 选择数据导入的模式。目前仅支持导入历史日志,即成功创建导入任务之后写入 ES 的数据暂不支持导入到日志服务中。历史数据导入完成后,导入任务自动结束。 |
预览 | 单击预览,可查看基于当前配置的数据导入结果。如果预览到的数据不符合预期,请修改配置后重试。 |
确认配置后单击下一步。
登录日志服务控制台。
在顶部导航栏中,选择日志服务所在的地域。
在左侧导航栏中,选择常用功能 > 日志接入。
在数据导入页签中的任务列表区域,单击目标导入任务的名称。
查看任务的配置信息。
日志导入任务的详情页中展示了导入任务的基本信息、数据源配置信息。
展示项 | 说明 | |
---|---|---|
基本信息 | 任务名称 | ES 数据导入任务的名称。 |
任务ID | ES 数据导入任务的 ID。 | |
导入任务状态 | 导入任务的状态。详细说明请参考任务状态说明。 | |
任务类型 | 导入任务的类型, | |
所属日志主题ID | 导入的数据存储的日志主题。您可以根据页面提示配置索引,以便后续的查询分析与数据统计。 | |
创建时间 | 导入任务的创建时间。 | |
数据源配置 | ES接入URL | Elasticsearch 集群的服务地址。 |
用户名 | Elasticsearch 用户名。 | |
密码 | Elasticsearch 密码。 | |
索引列表 | 待导入到日志服务中的索引。 | |
ES 查询语句 | 用于过滤数据的查询语句 | |
导入模式 | 数据导入的模式。目前仅支持导入历史日志,即成功创建导入任务之后写入 ES 的数据暂不支持导入到日志服务中 | |
指定时间段 | 是否指定 Elasticsearch 索引中表示时间的列名,用该字段值作为日志时间。 | |
时间字段名称 | 时间字段的 Key。 | |
时间字段格式 | 时间字段的格式。 | |
导入时间范围 | 待导入数据的起始时间和结束时间。 | |
时区 | 时间字段对应的时区。 |
导入任务的状态说明如下:
状态 | 说明 |
---|---|
导入中 | 导入任务执行中。您可以通过服务日志中 BytesTransferred 和 BytesTotal 字段判断当前的任务执行进度。 |
导入完成 | 导入任务已执行完毕。符合导入规则的所有数据已被成功导入到日志服务的指定日志主题中。 |
导入异常 | 导入任务异常。 |
如果数据导入任务遇到了故障或异常,您可以删除故障的导入任务,重新导入数据。如果已完成存量日志数据的迁移,或者不再需要导入日志到火山引擎日志服务,您可以参考以下步骤删除日志导入任务。
说明
常见问题 | 可能原因 | 解决方法 |
---|---|---|
预览日志时出现报错 time out。 |
|
|
预览日志时出现报错 invalid arguement。 |
|
|
预览时,日志时间不符合预期。 | 未配置日志时间字段,或者字段格式不正确。 | 开启指定时间段配置,并正确设置时间字段格式。支持的时间格式设置请参考时间格式。 |
导入数据后,部分日志检索不到。 | 开始导入之后再创建日志索引,导致索引对开启前导入的日志不生效。 | 日志索引仅对开启索引设置之后采集的日志有效,修改索引后新索引配置也是如此。建议后续创建新的导入任务时,提前为目标 Topic 设置索引。 |