全部产品
Search
文档中心

开源大数据平台E-MapReduce:快速入门

更新时间:May 29, 2023

本文主要通过示例为您介绍,如何快速使用E-MapReduce上的StarRocks集群进行基本的建表和查询操作。

前提条件

已创建StarRocks集群,详情请参见创建StarRocks集群

使用示例

  1. 使用SSH方式登录StarRocks集群,详情请参见登录集群

  2. 执行以下命令,连接StarRocks集群。

    mysql -h127.0.0.1  -P 9030 -uroot
  3. 执行以下命令,创建数据库并选择数据库。

    CREATE DATABASE IF NOT EXISTS load_test;
    USE load_test;
  4. 执行以下命令,创建表。

     CREATE TABLE insert_wiki_edit
    (
        event_time DATETIME,
        channel VARCHAR(32) DEFAULT '',
        user VARCHAR(128) DEFAULT '',
        is_anonymous TINYINT DEFAULT '0',
        is_minor TINYINT DEFAULT '0',
        is_new TINYINT DEFAULT '0',
        is_robot TINYINT DEFAULT '0',
        is_unpatrolled TINYINT DEFAULT '0',
        delta INT SUM DEFAULT '0',
        added INT SUM DEFAULT '0',
        deleted INT SUM DEFAULT '0'
    )
    AGGREGATE KEY(event_time, channel, user, is_anonymous, is_minor, is_new, is_robot, is_unpatrolled)
    PARTITION BY RANGE(event_time)
    (
        PARTITION p06 VALUES LESS THAN ('2015-09-12 06:00:00'),
        PARTITION p12 VALUES LESS THAN ('2015-09-12 12:00:00'),
        PARTITION p18 VALUES LESS THAN ('2015-09-12 18:00:00'),
        PARTITION p24 VALUES LESS THAN ('2015-09-13 00:00:00')
    )
    DISTRIBUTED BY HASH(user) BUCKETS 10
    PROPERTIES("replication_num" = "1");
  5. 执行以下命令,导入测试数据。

    INSERT INTO insert_wiki_edit VALUES("2015-09-12 00:00:00","#en.wikipedia","GELongstreet",0,0,0,0,0,36,36,0),("2015-09-12 00:00:00","#ca.wikipedia","PereBot",0,1,0,1,0,17,17,0);
  6. 执行以下命令,查询数据。

    select * from insert_wiki_edit;

    返回信息如下所示。

    +---------------------+---------------+--------------+--------------+----------+--------+----------+----------------+-------+-------+---------+
    | event_time          | channel       | user         | is_anonymous | is_minor | is_new | is_robot | is_unpatrolled | delta | added | deleted |
    +---------------------+---------------+--------------+--------------+----------+--------+----------+----------------+-------+-------+---------+
    | 2015-09-12 00:00:00 | #en.wikipedia | GELongstreet |            0 |        0 |      0 |        0 |              0 |    36 |    36 |       0 |
    | 2015-09-12 00:00:00 | #ca.wikipedia | PereBot      |            0 |        1 |      0 |        1 |              0 |    17 |    17 |       0 |
    +---------------------+---------------+--------------+--------------+----------+--------+----------+----------------+-------+-------+---------+
    2 rows in set (0.16 sec)

使用Catalog管理内部和外部数据

EMR-5.8.0及后续版本的StarRocks集群支持使用Catalog(数据目录)管理内部和外部数据。StarRocks 2.3及以上版本提供以下两种数据目录:

  • Internal Catalog:内部数据目录,用于存储StarRocks内部所有的数据库和数据表。您可以使用内部数据目录管理内部数据。例如,执行CREATE DATABASECREATE TABLE语句创建的数据库和数据表都会存储在内部数据目录中。 每个StarRocks集群都有一个默认的内部数据目录default_catalog。StarRocks暂不支持修改默认的内部数据目录的名称,也不支持创建新的内部数据目录。

  • External Catalog:外部数据目录,用于管理外部数据源中的数据。创建外部数据目录时需指定外部数据源访问信息。创建后,无需创建外部表即可查询外部数据。

Catalog更多信息,请参见Catalog概述