全部產品
Search
文件中心

DataWorks:數倉規劃概述

更新時間:Jun 19, 2024

使用DataWorks進行資料建模時,數倉架構師或者模型小組成員可以在數倉規劃頁面對資料分層、業務分類、資料域、業務過程、資料集市、主題域進行設計。完成設計後,模型設計師在建模過程中可以依賴數倉規劃中的資料分層、業務分類、資料域、業務過程等對所建模型進行分層化域管理。

數倉分層

您可以結合業務情境、資料情境綜合考慮設計數倉的資料分層,DataWorks為您預設建立業界通用的五層數倉分層:

  • 資料引入層 ODS(Operational Data Store)

  • 詳細資料層 DWD(Data Warehouse Detail)

  • 摘要資料層 DWS(Data Warehouse Summary)

  • 應用資料層 ADS(Application Data Service)

  • 公用維度層 DIM(Dimension)

您也可以根據業務需求建立其他分層資料層,建立資料分層的操作請參見建立數倉分層

分層歸屬

DataWorks為您提供了貼源層公用層應用程式層等分層歸屬,您可以將不同功能作用的分層掛載至相應歸屬,通過層級化結構呈現輸出。下圖以預設的五層資料分層為例,資料分層規劃完成後,後續的表資料存放區可根據規劃分別儲存至不同的資料分層中。資料分層

  • 貼源層:用於資料庫、日誌、訊息等基礎來源資料的引入。來源資料經過一系列ETL操作進入貼源層,該層級只能掛載貼源表。

  • 公用層:用於加工、整合貼源層輸入的公用資料,建立統一的指標維度,構建可複用面向分析和統計的明細事實資料和摘要資料。該層級可掛載明細表、維度資料表、匯總表。

  • 應用程式層:基於實際應用需求,擷取公用層加工整合後的資料,面向具體應用情境或指定產品進行的個人化資料統計。該層級可以掛載應用表、維度資料表。

業務分類

當企業業務比較複雜,不同類型業務彼此間需要共用資料域,但是又希望能在模型設計和應用過程中快速定位本業務的資料時,您可結合真實業務情況,規劃不同的業務分類,在後續建模的維度資料表和明細表中,將其關聯到對應的業務分類中。建立業務分類的操作可參見業務分類

資料域與業務過程

資料域與業務過程通常位於公用層,根據業務類別、資料來源、資料用途等多個維度,對公用層資料進列區域及地區下商務活動進行劃分。

  • 資料域

    資料域是一個較高層次的資料歸類標準,是對企業業務過程進行抽象、提煉、組合的集合,是企業業務人員在使用資料時第一個分組入口,可以協助企業業務人員快速的從海量的資料中快速圈定到自己的業務資料。

    詳情請參見資料域

  • 業務過程

    業務過程是對商務活動流程的描述,例如在電商領域,加購、下單、支付等都可以是一個業務過程。進行業務效果分析時,業務過程有非常典型的應用,例如常用漏鬥分析,即將購買商品的商務活動分解為瀏覽商品、加入購物車、下訂單、付款、確認收貨等業務過程,統計每個業務過程的“訂單數”,將可以針對“訂單數”這一指標做漏鬥分析。使用DataWorks建立業務過程的操作請參見業務過程

資料集市與主題域

資料集市與主題域通常位於應用程式層,面向使用者的實際業務需求,對指定的某類業務進行情境或產品的細粒度劃分,制定不同分析視角,基於公用層的整合資料進行業務個人化的資料統計。

  • 資料集市

    資料集市是對某個業務分類制定細化的業務主題,並通過主題域,基於不同分析視角對目的地組市中的資料進行主題劃分,最終面向業務應用統計分析資料。例如,營運平台資料集市。

    詳情請參見資料集市

  • 主題域

    主題域用於將資料集市按照分析視角進行劃分,通常是聯絡較為緊密的資料主題的集合。您可以根據業務的關注點,將這些資料主題劃分至不同的主題域。例如,電商行業通常分為交易域、會員域、商品域等。詳情請參見主題域

維度管理

維度管理用於標準化定義維度,協助您對資料建模過程中產生的維度進行統一建設和管理,保證維度唯一,避免重複建設。後續建立維度資料表時可關聯相應維度,關聯後即可通過不同維度分析呈現不同視角的業務資料狀況。詳情請參見建立概念性模型:維度

建模空間

當您所需要管理多個DataWorks工作空間且需要複用一套數倉規劃時,面對跨多個工作空間的複雜資料體系,可以通過設計空間來共用一套資料建模工具,針對整個資料體系進行統一地數倉規劃、維度建模及指標定義等工作。

DataWorks智能資料建模在進行跨多個工作空間資料的統一建模情況下,為您提供了模型設計工作空間資料研發工作空間的概念,通過建模空間功能實現模型跨工作空間應用。

建模空間2

建模空間的詳細介紹請參見建模空間