本文介紹如何通過Hive在E-MapReduce叢集上建立庫和表等操作。
前提條件
已建立叢集,詳情請參見建立叢集。
進入Hive命令列
- 使用SSH方式登入叢集,詳情請參見登入叢集。
- 執行以下命令,切換為hadoop使用者。
su hadoop
- 執行以下命令,進入Hive命令列。
hive
庫操作
本文樣本中的資料庫以testdb為例介紹。
- 建立庫
create database if not exists testdb;
當返回資訊包含OK時,表示建立庫testdb成功。
- 查看庫
desc database testdb;
- 使用資料庫
use testdb;
- 刪除庫
drop database if exists testdb;
當返回資訊包含OK時,表示刪除庫成功。
表操作
本文樣本中的表以t為例介紹。
- 建立表
create table if not exists t (id bigint, value string);
當返回資訊包含OK時,表示建立表t成功。
- 查看錶資訊
desc formatted t;
- 查看所有表
show tables;
返回資訊如下所示。OK t
- 刪除表
drop table if exists t;
當返回資訊包含OK時,表示刪除表成功。
SQL操作
- 插入記錄
insert into table t select 1, 'value-1';
當返回資訊包含OK時,表示插入資訊成功。OK Time taken: 14.73 seconds
- 查詢表中的前10條資訊
select * from t limit 10;
返回資訊如下所示。OK 1 value-1 Time taken: 11.48 seconds, Fetched: 1 row(s)
- 彙總操作
select value, count(id) from t group by value;
返回資訊如下所示。OK value-1 1 Time taken: 20.11 seconds, Fetched: 1 row(s)