全部產品
Search
文件中心

Data Lake Formation:快速入門

更新時間:Jul 13, 2024

資料湖構建(Data Lake Formation,DLF)產品主要使用流程如下。

前提條件

註冊阿里雲帳號,並完成實名認證

建立資料來源

建立資料湖的入湖來源,當前支援阿里雲RDS MySQL和PolarDB作為資料來源。

  • 您需要輸入RDS MySQL串連的使用者名稱和密碼。

  • 選擇RDS MySQL所在的VPC、交換器和安全性群組。

詳細操作請參見資料來源管理。

建立入湖模板

  • 建立入湖模板,可以定時或者手動的執行資料幫浦任務,將資料來源中指定的資料幫浦到資料湖。

  • 當前入湖模板支援5種資料幫浦方式,可以根據資料幫浦的情境選擇並建立入湖模板。

  • 入湖模板需要指定抽取資料的具體位置。

  • 指定RAM角色,資料湖構建服務所代理的角色,預設為AliyunDLFWorkFlowDefaultRole。

  • 選擇運行抽取任務所需的資源,並指定任務運行方式。

詳細操作請參見入湖模板。

建立資料湖的中繼資料

  • 添加中繼資料庫

  • 建立中繼資料表,指定表中資料的儲存位置和儲存格式

詳細操作請參見中繼資料管理。