本文介绍如何通过Hive在E-MapReduce集群上创建库和表等操作。

前提条件

已创建集群,详情请参见创建集群

进入Hive命令行

  1. 使用SSH方式登录集群,详情请参见登录集群
  2. 执行以下命令,切换为hadoop用户。
    su hadoop
  3. 执行以下命令,进入Hive命令行。
    hive

库操作

本文示例中的数据库以testdb为例介绍。

  1. 创建库
    create database if not exists testdb;

    当返回信息包含OK时,表示创建库testdb成功。

  2. 查看库
    desc database testdb;
  3. 使用数据库
    use testdb;
  4. 删除库
    drop database if exists testdb;

    当返回信息包含OK时,表示删除库成功。

表操作

本文示例中的表以t为例介绍。

  1. 创建表
    create table if not exists t (id bigint, value string);

    当返回信息包含OK时,表示创建表t成功。

  2. 查看表信息
    desc formatted t;
  3. 查看所有表
    show tables;
    返回信息如下所示。
    OK
    t
  4. 删除表
    drop table if exists t;

    当返回信息包含OK时,表示删除表成功。

SQL操作

  1. 插入记录
    insert into table t select 1, 'value-1';
    当返回信息包含OK时,表示插入信息成功。
    OK
    Time taken: 14.73 seconds
  2. 查询表中的前10条信息
    select * from t limit 10;
    返回信息如下所示。
    OK
    1       value-1
    Time taken: 11.48 seconds, Fetched: 1 row(s)
  3. 聚合操作
    select value, count(id) from t group by value;
    返回信息如下所示。
    OK
    value-1 1
    Time taken: 20.11 seconds, Fetched: 1 row(s)