为日志字段设置键值索引时,您需要为每个开启键值索引的字段设置数据类型(text、long、double 或 json)。字段的索引数据类型决定了您可以使用何种方式检索该字段,同时影响检索的精度和准确性。本文介绍各个数据类型的配置说明及注意事项。
常见场景下,日志的字段值通常为文本类型或数值类型,您可以设置字段的索引数据类型为 text(字符串)、long(整型)或 double(浮点型),以满足日志检索需求。对于 JSON 等相对复杂的结构化数据,您可以设置索引的数据类型为 json。日志服务支持展开标准合法的 JSON 字段,您可以设置叶子节点的索引数据类型为 text、long 或 double ,以满足 JSON 嵌套结构的叶子节点字段检索需求。
各索引字段的数据类型说明如下:
类型 | 说明 |
---|---|
text | 适用于字符串类型的字段。 |
long | 适用于数值类型的字段,例如整型(Int 64)。设置字段的索引数据类型为 long 之后,您可以通过数值范围查询日志字段,例如使用 |
double | 适用于数值类型的字段,例如浮点型(64 bit)。设置字段的索引数据类型为 double 之后,您可以通过数值范围查询日志字段,例如使用 |
json | 适用于 JSON 类型的字段。日志服务支持对标准 JSON 类型字段建立索引,设置字段的索引数据类型为 json 后,您还可以设置其展开后每个子字段的索引数据类型。 |
text 类型适用于字符串类型的字段。
*
或?
对该字段进行模糊检索。__time__
以外所有字段)设置为 text 类型。long 类型适用于数值类型的字段,例如整型(Int 64)。设置字段的索引数据类型为 long 之后,您可以通过数值范围查询日志字段,例如使用>
等范围操作符进行检索。
double 类型适用于数值类型的字段,例如浮点型(64 bit)。设置字段的索引数据类型为 double 之后,您可以通过数值范围查询日志字段,例如使用>
等范围操作符进行检索。
json 类型适用于值为 JSON 对象的字段。日志服务支持对标准 JSON 类型字段建立索引,设置字段的索引数据类型为 json 后,您还可以设置其展开后每个子字段的数据类型(text、long 或 double)。
.
来表示 JSON 数据中字段之间的层级关系,例如 key1.key2.key3
表示 key3
是 key2
的子字段, key2
是 key1
的子字段。索引配置中,子字段的名称不包含最顶层父字段名。key1.key2
和 key1.key2.key3
两个子字段,但您可同时配置 key1.key2.key3
和 key1.key2.key4
两个子字段。说明
not key: *
语句中使用。详细说明,请参考JSON 自动索引和手动配置索引的区别?。例如在应用服务日志的采集场景下,每一条日志表示一次用户请求,其中,info 字段为 JSON 对象格式的字段,表示某次服务请求的详细信息,info 字段中还嵌套了 JSON 对象格式的字段 response 和 developers。
日志样例如下:
{ "product":"NewApp", "total_users":1000000, "avg_pv_per_day":1000000.0, "regions":[ "cn-beijing", "cn-shanghai" ], "info":{ "api":"CreateIndex", "ip":[ "192.168.1.101", "192.168.1.102" ], "request_time":1667232000, "latency_time":0.01, "response":{ "request_id":"a**********", "status":200, "error_msg":"" }, "developers":[ { "name":"张三", "email":"zhangsan@test.com" }, { "name":"李四", "email":"lisi@test.com" } ] } }
索引配置如下:
检索分析示例如下:
分析场景 | 检索语句 |
---|---|
检索包含 NewApp 的日志 |
|
检索总用户量大于 10000 且日均访问量大于 10000.0 的日志 |
|
查看全部日志 |
|
筛选产品名称为 NewApp 的日志 |
|
筛选总用户量大于 10000,且日均访问量大于 10000.0 的日志 |
|
筛选请求 API 为 CreateIndex 的日志 |
|
统计响应状态码不为200的日志数量 |
|
统计按照请求 NewApp API 进行聚合的日志数量 |
|