数仓分层检查器用于规范目标分层中模型及指标的命名,制定模型及指标的命名规范,在模型和指标创建时,系统会根据该规范自动生成表名,模型发布成表后,使用方也能通过表名快速了解表的业务信息。本文为您介绍如何配置及使用数仓分层检查器。
前提条件
已创建数仓分层,创建数仓分层详情请参见创建数仓分层。
配置数仓分层检查器
在数仓分层页面,单击已创建的分层,进入数仓分层详情页。
配置数仓分层检查器。
在检查器管理区域,新建检查器。
您可选择创建模型检查器或指标检查器,用于规范当前数仓分层中模型或指标的命名。
说明一个数仓分层允许添加多条模型或指标命名规则。
检查器参数配置说明如下表。
配置项
描述
规则名称
新建检查器的规则名称。
规则类型
模型规则:默认为表名(表英文名),在创建模型时,可通过选择对应的检查器自动生成表名。
指标规则:可配置为中文名称或英文缩写,在创建指标时,自动生成派生指标名称。
规则定义
定义模型或指标的命名规范。后续使用该规范检测分层中模型或指标的名称。
模型规则:
输入表的前缀信息,通过表前缀进行检测。例如,数仓分层要求表名称以
dim
开头,则可输入dim
。也可单击图标,使用业务大类英文缩写、数据集市英文缩写、主题域英文缩写等多种类别的来定义规则。可自由组合。
说明不同模型(例如,应用表、维度表)定义规则时可选类别存在差异,具体请以实际界面为准。
指标规则:选择修饰词、原子指标、统计周期来定义规则。可自由组合。
描述
检查器的描述说明。
设置默认检查器。
您可为模型或指标设置默认检查器,后续创建模型或指标时,默认使用该检查器为模型或指标自动生成表名。下图以模型检查器为例,为您展示配置界面。
设置检查器规则的强弱。
您可为创建的检查器设置规则的强弱程度。下图以模型检查器为例,为您展示配置界面。
所有模型或指标检查器统一使用一种强弱程度的规则,即统一为强规则,或统一为弱规则。后续在维度建模新建对象(模型或指标)时,不同规则的操作限制如下:
弱规则:命名检查器被设置为弱规则时,用户在创建模型或指标时,可选择使用该规范创建模型或指标名称,也可不遵守该规范创建模型或指标名称。
强规则:命名检查器被设置为强规则时,用户在创建模型或指标时,必须要使用该规范创建模型或指标名称,否则无法保存模型或指标。
触发检测并查看检测结果。
检查器配置完成后,单击触发检测,根据检查器的配置内容,检测分层中所有模型的命名是否符合当前分层中指定的规范,系统会将不符合规范的模型展示出来。您可根据检测结果进行相关处理操作。
说明检测操作仅触发启用状态的检查器。
新建的检查器默认为启用状态。若您无需使用检查器,则可将其关闭,关闭后将不会触发该检查器执行检测任务。
检查结束后,单击查看结果,即可查看本次检测结果。
数仓分层检查器使用示例
示例一
某公司希望目标数仓分层中的表以
dim_
开头。当数仓分层中包含命名为dim_sku、dim_store、dimension_warehouse、fact_order的表时,触发检测后,检测结果如下表所示。表名称
是否符合数仓分层的命名规范
dim_sku
匹配
dim_store
匹配
ension_warehouse
不匹配。名称不符合以
dim_
开头的规范。fact_order
不匹配。名称不符合以
dim_
开头的规范。示例二
某公司希望DWD数仓分层中的表使用
dwd_数据域_自定义表命名标签缩写_存储策略
格式命名。其中,表需以dwd
开头,数据域为sale
,自定义表命名标签缩写为order
,存储策略为df/di
。当该数仓分层中包含命名为dwd_sale_order_df、dwd_sale_order_di、dwd_sale_order、dws_sale_order_df的表时,触发检测后,检测结果如下表所示。
表名称
是否符合数仓分层的命名规范
dwd_sale_order_df
匹配
dwd_sale_order_di
匹配
dwd_sale_order
不匹配。表名称缺少存储策略
df/di
。dws_sale_order_df
不匹配。表的开头
dws
不符合命名规范。示例三
某公司的模型委员会希望在创建派生指标时统一并规范指标的名称,因此在DWS数仓分层中设置了按照
时间周期_修饰词_原子指标
顺序来组织指标中文名称的强规则。当开发者在该数仓分层中新建中文名称为近1天_A门店_用户数量
、近30天_北京市_B商品_销售金额
、A门店_用户数量_近7天
、A门店_用户数量
的派生指标时,保存指标将触发命名规则的检测,检测结果如下表所示。指标名称
是否符合数仓分层的命名规范
近1天_A门店_用户数量
匹配
近30天_北京市_B商品_销售金额
匹配
A门店_用户数量_近7天
不匹配
A门店_用户数量
不匹配
后续步骤
数仓分层检查器配置完成后,您可继续进行数仓规划中的数据域、业务过程与业务分类的规划和创建。详情请参见数据域、业务过程和业务分类。