全部产品
Search
文档中心

日志服务:构建字典与表格做数据富化

更新时间:Dec 18, 2024

字典和表格是对数据进行富化时主要使用的两种数据结构,本文档主要介绍这两种数据结构的常见构建方式,并对比不同构建方式的优缺点。

字典构建

  • 直接构建

    e_dict_map({"400": "error", "200": "ok", "*": "other"}, "status", "message")
  • 从任务配置资源构建

    e_dict_map(res_local("http_code_map"), "status", "message")

    其中http_code_map是任务高级配置项,值为:

    {"400": "error", "200": "ok", "*": "other"}
  • 从表格构建

    使用tab_to_dict从表格构建。而表格的构建参见本文后面的表格构建。

    e_dict_map(tab_to_dict(tab_parse_csv("status_code,status_info\n400,error\n200,ok\n*,other"), "status_code", "status_info"), "status", "message")
  • 从字典函数构建

    e_dict_map(dct_make("400", "error", "200",  "ok", "*",  "other"), "status", "message")
  • 从其他表达式构建

    e_dict_map(json_parse(v("http_code_map")), "status", "message")

    此处从源日志的http_code_map字段中获取映射关系。

不同字典构建方式对比。

构建方式

优点

缺点

直接构建

直观、简单、方便。

如果内容较多,规则会相对冗长。且静态不灵活。

从任务配置资源构建

内容较多且经常修改时推荐使用,易于维护。

不易于扩展和跨任务复用,不支持自动刷新。

从表格构建

高级场景下使用,维护机制更灵活。

需要构建和维护对应的表格,过程相对繁琐。

从字典函数构建

基于逻辑动态构建字典,特定场景下适用。

较为高级,不易于维护。

从其他表达式构建

从日志事件的字段中动态提取映射关系,特定场景下适用。

较为高级,不易于维护。

表格构建

  • 从文本构建

    e_table_map(tab_parse_csv("city,name,age\nshanghai,aliyun,10\ncity:nanjing,Maki,18"), "name",["city", "age"])
  • 从RDS资源中构建

    e_table_map(tab_parse_csv(res_rds_mysql(...database="db", table="city")), "name",["city", "age"])

    RDS表格city的内容为:

    content,name,age
    shanghai,aliyun,10
    nanjing,Maki,18
  • 从其他Logstore资源构建

    e_table_map(res_log_logstore_pull(..., project="project_name", logstore="logstore_name", fields=["city","name","age"]),, "name",["city", "age"])

    对应Logstore中日志事件为:

    "日志1"
    {
      "city": "shanghai",
      "name": "aliyun",
      "age": "10"
    }
    "日志2"
    {
      "city": "city:nanjing and data > 100",
      "name": "Maki",
      "age": "18"
    }

不同表格构建方式对比:

构建方式

优点

缺点

从文本构建

直观、简单、方便。

如果内容较多,规则会相对冗长。不易于维护、扩展和复用。

从RDS资源构建

  • 内容较多且经常修改时推荐使用,易于维护。

  • 支持自动刷新。

  • 支持跨任务复用。

需要连接外部RDS资源,配置过程相对比较繁琐。

从其他Logstore资源构建

支持实时读取,维护机制更灵活,高级场景下使用。

需要连接其他Logstore,配置过程相对比较繁琐。