全部產品
Search
文件中心

E-MapReduce:快速入門

更新時間:Jul 01, 2024

本文主要通過樣本為您介紹,如何快速使用E-MapReduce上的StarRocks叢集進行基本的建表和查詢操作。

前提條件

已建立StarRocks叢集,詳情請參見建立StarRocks叢集

使用樣本

  1. 使用SSH方式登入StarRocks叢集,詳情請參見登入叢集

  2. 執行以下命令,串連StarRocks叢集。

    mysql -h127.0.0.1  -P 9030 -uroot
  3. 執行以下命令,建立資料庫並選擇資料庫。

    CREATE DATABASE IF NOT EXISTS load_test;
    USE load_test;
  4. 執行以下命令,建立表。

     CREATE TABLE insert_wiki_edit
    (
        event_time DATETIME,
        channel VARCHAR(32) DEFAULT '',
        user VARCHAR(128) DEFAULT '',
        is_anonymous TINYINT DEFAULT '0',
        is_minor TINYINT DEFAULT '0',
        is_new TINYINT DEFAULT '0',
        is_robot TINYINT DEFAULT '0',
        is_unpatrolled TINYINT DEFAULT '0',
        delta INT SUM DEFAULT '0',
        added INT SUM DEFAULT '0',
        deleted INT SUM DEFAULT '0'
    )
    AGGREGATE KEY(event_time, channel, user, is_anonymous, is_minor, is_new, is_robot, is_unpatrolled)
    PARTITION BY RANGE(event_time)
    (
        PARTITION p06 VALUES LESS THAN ('2015-09-12 06:00:00'),
        PARTITION p12 VALUES LESS THAN ('2015-09-12 12:00:00'),
        PARTITION p18 VALUES LESS THAN ('2015-09-12 18:00:00'),
        PARTITION p24 VALUES LESS THAN ('2015-09-13 00:00:00')
    )
    DISTRIBUTED BY HASH(user) BUCKETS 10
    PROPERTIES("replication_num" = "1");
  5. 執行以下命令,匯入測試資料。

    INSERT INTO insert_wiki_edit VALUES("2015-09-12 00:00:00","#en.wikipedia","GELongstreet",0,0,0,0,0,36,36,0),("2015-09-12 00:00:00","#ca.wikipedia","PereBot",0,1,0,1,0,17,17,0);
  6. 執行以下命令,查詢資料。

    select * from insert_wiki_edit;

    返回資訊如下所示。

    +---------------------+---------------+--------------+--------------+----------+--------+----------+----------------+-------+-------+---------+
    | event_time          | channel       | user         | is_anonymous | is_minor | is_new | is_robot | is_unpatrolled | delta | added | deleted |
    +---------------------+---------------+--------------+--------------+----------+--------+----------+----------------+-------+-------+---------+
    | 2015-09-12 00:00:00 | #en.wikipedia | GELongstreet |            0 |        0 |      0 |        0 |              0 |    36 |    36 |       0 |
    | 2015-09-12 00:00:00 | #ca.wikipedia | PereBot      |            0 |        1 |      0 |        1 |              0 |    17 |    17 |       0 |
    +---------------------+---------------+--------------+--------------+----------+--------+----------+----------------+-------+-------+---------+
    2 rows in set (0.16 sec)

使用Catalog管理內部和外部資料

EMR-5.8.0及後續版本的StarRocks叢集支援使用Catalog(資料目錄)管理內部和外部資料。StarRocks 2.3及以上版本提供以下兩種資料目錄:

  • Internal Catalog:內部資料目錄,用於儲存StarRocks內部所有的資料庫和資料表。您可以使用內部資料目錄管理內部資料。例如,執行CREATE DATABASECREATE TABLE語句建立的資料庫和資料表都會儲存在內部資料目錄中。 每個StarRocks叢集都有一個預設的內部資料目錄default_catalog。StarRocks暫不支援修改預設的內部資料目錄的名稱,也不支援建立新的內部資料目錄。

  • External Catalog:外部資料目錄,用於管理外部資料源中的資料。建立外部資料目錄時需指定外部資料源訪問資訊。建立後,無需建立外部表格即可查詢外部資料。

Catalog更多資訊,請參見Catalog概述