全部產品
Search
文件中心

E-MapReduce:Delta Lake資料來源

更新時間:Jul 01, 2024

Delta Lake Catalog是一種External Catalog。通過Delta Lake Catalog,您可以直接查詢Delta Lake中的資料。本文為您介紹如何在E-MapReduce的StarRocks叢集上建立和查看Delta Lake Catalog。

前提條件

  • 已建立包含Delta Lake服務的叢集,例如DataLake或Custom叢集,詳情請見建立叢集

  • 已建立包含StarRocks服務的叢集,例如OLAP或Custom叢集,並成功串連到叢集,詳情請參見建立叢集快速入門

建立Delta Lake Catalog

文法

CREATE EXTERNAL CATALOG <catalog_name>
PROPERTIES
( 
  "key"="value", 
  ...
);

參數說明

  • catalog_name:Delta Lake Catalog的名稱,必選參數。命名要求如下:

    • 必須由字母(a~z或A~Z)、數字(0~9)或底線(_)組成,且只能以字母開頭。

    • 總長度不能超過64個字元。

  • PROPERTIES:Delta Lake Catalog的屬性,必選參數。Delta Lake使用的中繼資料服務不同,該參數的配置也不同。不同中繼資料服務的配置方法如下:

    • Hive MetaStore

      屬性

      是否必選

      說明

      type

      資料來源類型,取值為deltalake

      hive.metastore.uris

      Hive MetaStore的URI。格式為thrift://<Hive metastore的IP地址>:<連接埠號碼>,連接埠號碼預設為9083。

    • DLF

      使用DLF查看資料來源,詳情請參見使用DLF中繼資料

樣本

以下樣本建立了一個名為delta_catalog的Delta Lake Catalog。

CREATE EXTERNAL CATALOG delta_catalog
PROPERTIES
(
    "type" = "deltalake",
    "hive.metastore.uris" = "thrift://xx.xx.xx.xx:9083"
);

查看Delta Lake表資料

您可以通過SELECT查詢目標資料庫中的目標表。

SELECT * FROM <catalog_name>.<database_name>.<table_name>;

相關文檔

Delta Lake更多介紹,請參見Delta Lake概述