欄位標準是對含義相同但欄位名稱不同的資料進行統一規範管理的資料準則,欄位標準可定義欄位的取值範圍、度量單位等內容。當欄位標準發生變化時可快速定位或變更對應的表,極大地提升了應用效率和準確率。本文將為您介紹欄位標準的建立方法。
背景資訊
欄位標準又稱為資料字典,可理解為全域欄位管理。可將多個表中含義相同但欄位名不同的內容進行關聯,並對該欄位制定相關的取值範圍、度量單位、標準代碼等內容。後期欄位標準發生變化時,可快速定位和變更關聯的表,極大程度提升構建效率、應用效率、準確性和後期治理效果。
相關樣本如下:
現有註冊表和登入表,註冊表中儲存了會員ID,欄位名為user_id,登入表中也儲存了會員ID,欄位名為userid。此時兩個表中包含的會員ID均是同一內容,但是使用了兩種不同的欄位名進行描述,欄位出現了歧義便需要人工介入理解進行確認。
解決方案如下:
我們可通過DataWorks資料建模建立新的欄位標準,預先在模型中定義會員ID標準,然後在建立註冊表和登入表時,將對應會員ID的欄位引用該標準。在後期分析中可自動推薦兩張表的關聯關係和關聯欄位,極大地提升應用效率和準確性。
注意層級關係
欄位標準在建立時需要放在根目錄、目錄或標準集下方,相關說明如下。
根目錄:目錄中最頂級的目錄,所有的目錄、標準集、標準只能放置在根目錄下。
目錄:用於存放標準和標準集,類似作業系統的檔案夾目錄。
標準集:和目錄類似,但標準集內只能存放標準。
欄位標準之間可存在繼承關係,如買家ID標準和賣家ID標準均可繼承於會員ID標準。
建立目錄與標準集
進入資料標準。
登入DataWorks控制台,切換至目標地區後,單擊左側導覽列的 ,在下拉框中選擇對應工作空間後單擊進入資料建模。
在智能資料建模頁面的頂部功能表列,單擊資料標準,進入資料標準頁面。
在資料標準頁面左側導覽列,單擊欄位標準,進入欄位標準頁面。
建立根目錄。
在欄位標準頁面,單擊表徵圖,選擇建立根目錄。
在彈出的建立根目錄對話方塊中,輸入名稱,單擊確定。
根目錄建立成功後,可在左側欄位標準地區下方的分類樹中查看已建立的根目錄。
(可選)建立子目錄。
在左側分類樹,按右鍵已建立的根目錄,選擇建立子目錄。
在彈出的建立子目錄對話方塊中,輸入名稱,單擊確定。
(可選)建立標準集。
在左側分類樹,選擇已建立完成的根目錄或子目錄。
按右鍵目錄名稱,選擇建立標準集。
在彈出的建立標準集對話方塊中,輸入名稱,單擊確定。
建立標準
在左側分類樹,按右鍵目標目錄或標準集,選擇建立標準。
在彈出的建立標準對話方塊中,配置如下內容。
參數項
參數描述
標準編碼
自訂編碼。
英文縮寫
欄位標準的英文縮寫。
英文名稱
欄位標準的英文名稱。
中文名稱
欄位標準的中文名稱。
資料類型
對應欄位的資料類型,包括如下:
BIGINT、DOUBLE、DECIMAL、STRING、DATETIME、BOOLEAN。
長度
資料類型關聯參數。
例如,選擇DECIMAL類型,則長度對應DECIMAL(20,4)中的20。
精度
資料類型關聯參數。
例如,選擇DECIMAL類型,則長度對應DECIMAL(20,4)中的4。
非空
引用該標準的欄位值是否可以為空白。預設為空白。
預設值
引用該標準的欄位值未填寫時的預設值。最大長度不可超過2048個字元。
業務定義
對業務的定義描述,最大長度不可超過2048個字元。
所屬路徑
標準所屬的目錄,您可從已建立的目錄、子目錄、標準集中選擇。
父級標準
可選擇已建立的標準作為父級標準,選擇後與該標準產生繼承關係,協助您更好地識別欄位的關聯關係。
例如,買家ID和賣家ID均屬於會員ID,則買家ID標準和賣家ID標準的父級標準就是會員ID標準。
引用代碼
您可從已建立的標準代碼中,引用指定標準代碼來限制欄位的取值範圍,標準代碼請參見標準代碼。
刪除
刪除標準
說明欄位標準如已被引用,則無法刪除,需在對應部分刪除引用。
單擊標準所在的標準集或目錄名稱。
在標準列表頁,單擊對應標準操作列的刪除。
刪除標準集、子目錄、根目錄
在左側分類樹直接按右鍵標準集、子目錄或根目錄的名稱,選擇刪除。
說明不支援跨層級刪除目錄。
後續步驟
建立完成後,您可在資料建模配置事實表與維度資料表欄位時進行關聯,關聯方法請參見發布模型至引擎。