資料湖構建(Data Lake Formation,DLF)產品主要使用流程如下。
前提條件
註冊阿里雲帳號,並完成實名認證。
建立資料來源
建立資料湖的入湖來源,當前支援阿里雲RDS MySQL和PolarDB作為資料來源。
您需要輸入RDS MySQL串連的使用者名稱和密碼。
選擇RDS MySQL所在的VPC、交換器和安全性群組。
詳細操作請參見資料來源管理。
建立入湖模板
建立入湖模板,可以定時或者手動的執行資料幫浦任務,將資料來源中指定的資料幫浦到資料湖。
當前入湖模板支援5種資料幫浦方式,可以根據資料幫浦的情境選擇並建立入湖模板。
入湖模板需要指定抽取資料的具體位置。
指定RAM角色,資料湖構建服務所代理的角色,預設為AliyunDLFWorkFlowDefaultRole。
選擇運行抽取任務所需的資源,並指定任務運行方式。
詳細操作請參見入湖模板。
建立資料湖的中繼資料
添加中繼資料庫
建立中繼資料表,指定表中資料的儲存位置和儲存格式
詳細操作請參見中繼資料管理。