ALTER TABLE - 云原生大数据计算服务 MaxCompute

修改表的所有人

修改表的所有人，即表Owner。

命令格式

alter table <table_name> changeowner to <new_owner>;

参数说明
- table_name：必填。待修改Owner的表名。
- new_owner：必填。修改后的Owner账号。

使用示例

--将表test1的所有人修改为ALIYUN$xxx@aliyun.com。
alter table test1 changeowner to 'ALIYUN$xxx@aliyun.com';

修改表的注释

修改表的注释内容。

命令格式

alter table <table_name> set comment '<new_comment>';

参数说明
- table_name：必填。待修改注释的表的名称。
- new_comment：必填。修改后的注释名称。
使用示例
```
alter table sale_detail set comment 'new coments for table sale_detail';
```
您可以通过MaxCompute的desc table_name命令查看表中comment的修改结果。

修改表的修改时间

MaxCompute SQL提供touch操作用来修改表的LastModifiedTime，可将表的LastModifiedTime修改为当前时间。此操作会改变表的LastModifiedTime的值，MaxCompute会认为表的数据有变动，生命周期的计算会重新开始。

命令格式
```
alter table <table_name> touch;
```
参数说明
table_name：必填。待修改表的修改时间的表名称。
使用示例
```
alter table sale_detail touch;
```

修改表的聚簇属性

对于分区表，MaxCompute支持通过alter table语句增加或者去除聚簇属性。

命令格式
- 增加表的Hash聚簇属性的语法格式如下：
```
alter table <table_name> [clustered by (<col_name> [, <col_name>, ...]) [sorted by (<col_name> [asc | desc] [, <col_name> [asc | desc] ...])] into <number_of_buckets> buckets];
```
- 去除表的Hash聚簇属性的语法格式如下：
```
alter table <table_name> not clustered;
```
- 增加表的Range聚簇属性，Bucket数不是必须的，可以省略，此时系统会根据数据量自动决定最佳的Bucket数目。语法格式如下：
```
alter table <table_name> [range clustered by (<col_name> [, <col_name>, ...]) [sorted by (<col_name> [asc | desc] [, <col_name> [asc | desc] ...])] into <number_of_buckets> buckets];
```
- 去除表或分区的Range聚簇属性的语法格式如下：
```
alter table <table_name> not clustered;
alter table <table_name> partition [<pt_spec>] not clustered;
```
  说明
  - 通过alter table改变聚簇属性，只对分区表有效，非分区表一旦建立聚簇属性就无法改变。alter table语句适用于存量表，在增加了新的聚簇属性后，新的分区将按设置的聚簇属性存储。
  - alter table只会影响分区表的新建分区（包括insert overwrite生成的），新分区将按新的聚簇属性存储，老数据分区的聚簇属性和存储保持不变。即在一张曾经做过聚簇属性设置的表上，关闭了聚簇属性，再增加聚簇设置，可以在新分区设置不同于之前的聚簇列、排序列及分桶数。
  - 由于alter table只影响新分区，所以该语句不可以再指定分区。
参数说明
详情请参见CREATE TABLE。

使用示例

-- 创建一个分区表
create table if not exists sale_detail(
 shop_name     STRING,
 customer_id   STRING,
 total_price   DOUBLE)
partitioned by (sale_date STRING, region STRING);

-- 修改表格的cluster属性
alter table sale_detail clustered by (customer_id) sorted by (customer_id) into 10 buckets;

更多关于cluster属性的介绍请参见Hash Clustering、Range Clustering。

重命名表

重命名表的名称。仅修改表的名字，不改动表中的数据。

命令格式

alter table <table_name> rename to <new_table_name>;

参数说明
- table_name：必填。待修改名称的表。
- new_table_name：必填。修改后的表名称。如果已存在与new_table_name同名的表，会返回报错。

使用示例

alter table sale_detail rename to sale_detail_rename;

修改表的生命周期

修改已存在的分区表或非分区表的生命周期。

命令格式

alter table <table_name> set lifecycle <days>;

参数说明
- table_name：必填。需要修改生命周期的表名。
- days：必填。修改后的生命周期时间，只能为正整数，单位为天。

使用示例

--修改test_lifecycle表，将生命周期设为50天。
alter table test_lifecycle set lifecycle 50;

禁止或恢复生命周期

禁止或恢复指定表或分区的生命周期。

命令格式

alter table <table_name> partition [<pt_spec>] {enable|disable} lifecycle;

参数说明
- table_name：必填。待禁止或恢复生命周期的表的名称。
- pt_spec：可选。待禁止或恢复生命周期的表的分区信息。格式为partition_col1=col1_value1, partition_col2=col2_value1...。对于有多级分区的表，必须指明全部的分区值。
- enable：恢复表或指定分区的生命周期功能。
  - 表及其分区重新参与生命周期回收，默认使用当前表及分区上的生命周期配置。
  - 开启表生命周期前可以修改表及分区的生命周期配置，防止开启表生命周期后因使用之前的配置导致数据被误回收。
- disable：禁止表或指定分区的生命周期功能。
  - 禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用table disable lifecycle时，pt_spec enable lifecycle设置无效。
  - 禁止表的生命周期功能后，表的生命周期配置及其分区的enable和disable标记会被保留。
  - 禁止表的生命周期功能后，仍然可以修改表及分区的生命周期配置。
使用示例
- 示例1：禁止表trans的生命周期功能。
```
alter table trans disable lifecycle;
```
- 示例2：禁止表trans中时间为20141111分区的生命周期功能。
```
alter table trans partition (dt='20141111') disable lifecycle;
```

添加分区

为已存在的分区表新增分区。

限制条件
- MaxCompute单表支持的分区数量上限为6万个。
- 对于有多级分区的表，如果需要添加新的分区值，必须指明全部的分区。
- 仅支持新增分区值，不支持新增分区字段。

命令格式

alter table <table_name> add [if not exists] partition <pt_spec> [partition <pt_spec> partition <pt_spec>...];

参数说明
- table_name：必填。待新增分区的分区表名称。
- if not exists：可选。如果未指定if not exists而同名的分区已存在，会执行失败并返回报错。
- pt_spec：必填。新增的分区，格式为(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)。partition_col是分区字段，partition_col_value是分区值。分区字段不区分大小写，分区值区分大小写。
使用示例
- 示例1：给表sale_detail添加一个分区，用来存储2013年12月杭州地区的销售记录。
```
alter table sale_detail add if not exists partition (sale_date='201312', region='hangzhou');
```
- 示例2：给表sale_detail同时添加两个分区，用来存储2013年12月北京和上海地区的销售记录。
```
alter table sale_detail add if not exists partition (sale_date='201312', region='beijing') partition (sale_date='201312', region='shanghai');
```
- 示例3：给表sale_detail添加分区，仅指定一个分区字段sale_date，返回报错，需要同时指定2个分区字段sale_date和region。
```
alter table sale_detail add if not exists partition (sale_date='20111011');
```

删除分区

为已存在的分区表删除分区。

MaxCompute支持通过条件筛选方式删除分区。如果您希望一次性删除符合某个规则条件的多个分区，可以使用表达式指定筛选条件，通过筛选条件匹配分区并批量删除分区。

限制条件
- 每个分区过滤子句只能访问一个分区列。
- 表达式用到的函数必须是内建的Scalar函数。
注意事项
- 删除分区之后，MaxCompute项目的存储量会降低。
- 您可以结合MaxCompute提供的生命周期功能，实现自动回收旧分区的能力。更多生命周期信息，请参见生命周期。

命令格式

未指定筛选条件

--一次删除一个分区。
alter table <table_name> drop [if exists] partition <pt_spec>;
--一次删除多个分区。
alter table <table_name> drop [if exists] partition <pt_spec>,partition <pt_spec>[,partition <pt_spec>....];

指定筛选条件

alter table <table_name> drop [if exists] partition <partition_filtercondition>;

参数说明
- table_name：必填。待删除分区的分区表名称。
- if exists：可选。如果未指定if exists且分区不存在，则返回报错。
- pt_spec：必填。删除的分区。格式为(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)。partition_col是分区字段，partition_col_value是分区值。分区字段不区分大小写，分区值区分大小写。
- partition_filtercondition：指定筛选条件时必填。分区筛选条件，不区分大小写。格式为：
```
partition_filtercondition
    : partition (<partition_col> <relational_operators> <partition_col_value>)
    | partition (scalar(<partition_col>) <relational_operators> <partition_col_value>)
    | partition (<partition_filtercondition1> AND|OR <partition_filtercondition2>)
    | partition (NOT <partition_filtercondition>)
    | partition (<partition_filtercondition1>)[,partition (<partition_filtercondition2>), ...]
```
  - partition_col：分区名称。
  - relational_operators：关系运算符，详情请参见运算符。
  - partition_col_value：分区列比较值或正则表达式，与分区列数据类型保持一致。
  - scalar()：Scalar函数。Scalar函数基于输入值生成对应的标量，对分区列的值（partition_col）进行处理后再按照指定的关系运算符relational_operators与partition_col_value做比较。
  - 分区过滤条件支持逻辑运算符NOT、AND和OR。支持通过NOT过滤条件子句，取过滤规则的补集。支持多个过滤条件子句以AND或OR的关系组成整体分区匹配规则。
  - 支持多个分区过滤子句，当多个分区过滤子句以英文逗号（,）分隔时，每个过滤子句的逻辑以OR的关系组成整体分区匹配规则。

使用示例

未指定筛选条件

--从表sale_detail中删除一个分区，2013年12月杭州分区的销售记录。
alter table sale_detail drop if exists partition(sale_date='201312',region='hangzhou'); 
--从表sale_detail中同时删除两个分区，2013年12月杭州和上海分区的销售记录。
alter table sale_detail drop if exists partition(sale_date='201312',region='hangzhou'),partition(sale_date='201312',region='shanghai');

指定筛选条件

--创建分区表。
create table if not exists sale_detail(
shop_name     STRING,
customer_id   STRING,
total_price   DOUBLE)
partitioned by (sale_date STRING);
--添加分区。
alter table sale_detail add if not exists
partition (sale_date= '201910')
partition (sale_date= '201911')
partition (sale_date= '201912')
partition (sale_date= '202001')
partition (sale_date= '202002')
partition (sale_date= '202003')
partition (sale_date= '202004')
partition (sale_date= '202005')
partition (sale_date= '202006')
partition (sale_date= '202007');
--批量删除分区。
alter table sale_detail drop if exists partition(sale_date < '201911');
alter table sale_detail drop if exists partition(sale_date >= '202007');
alter table sale_detail drop if exists partition(sale_date LIKE '20191%');
alter table sale_detail drop if exists partition(sale_date IN ('202002','202004','202006'));
alter table sale_detail drop if exists partition(sale_date BETWEEN '202001' AND '202007');
alter table sale_detail drop if exists partition(substr(sale_date, 1, 4) = '2020');
alter table sale_detail drop if exists partition(sale_date < '201912' OR sale_date >= '202006');
alter table sale_detail drop if exists partition(sale_date > '201912' AND sale_date <= '202004');
alter table sale_detail drop if exists partition(NOT sale_date > '202004');
--支持多个分区过滤表达式，表达式之间是OR的关系。
alter table sale_detail drop if exists partition(sale_date < '201911'), partition(sale_date >= '202007');
--添加其他格式分区。
alter table sale_detail add IF NOT EXISTS
partition (sale_date= '2019-10-05') 
partition (sale_date= '2019-10-06') 
partition (sale_date= '2019-10-07');
--批量删除分区，使用正则表达式匹配分区。
alter table sale_detail drop if exists partition(sale_date RLIKE '2019-\\d+-\\d+');
--创建多级分区表。
create table if not exists region_sale_detail(
shop_name     STRING,
customer_id   STRING,
total_price   DOUBLE)
partitioned by (sale_date STRING , region STRING );
--添加分区。
alter table region_sale_detail add IF NOT EXISTS
partition (sale_date= '201910',region = 'shanghai')
partition (sale_date= '201911',region = 'shanghai')
partition (sale_date= '201912',region = 'shanghai')
partition (sale_date= '202001',region = 'shanghai')
partition (sale_date= '202002',region = 'shanghai')
partition (sale_date= '201910',region = 'beijing')
partition (sale_date= '201911',region = 'beijing')
partition (sale_date= '201912',region = 'beijing')
partition (sale_date= '202001',region = 'beijing')
partition (sale_date= '202002',region = 'beijing');
--执行如下语句批量删除多级分区，两个匹配条件是或的关系，会将sale_date小于201911或region等于beijing的分区都删除掉。
alter table region_sale_detail drop if exists partition(sale_date < '201911'),partition(region = 'beijing');
--如果删除sale_date小于201911且region等于beijing的分区，可以使用如下方法。
alter table region_sale_detail drop if exists partition(sale_date < '201911', region = 'beijing');

批量删除多级分区时，在一个partition过滤子句中，不能根据多个分区列编写组合条件匹配分区，如下语句会报错FAILED: ODPS-0130071:[1,82] Semantic analysis exception - invalid column reference region, partition expression must have one and only one column reference。

--分区过滤子句只能访问一个分区列，如下语句报错。
alter table region_sale_detail drop if exists partition(sale_date < '201911' AND region = 'beijing');

修改分区的更新时间

MaxCompute SQL提供touch操作，用于修改分区表中分区的LastModifiedTime。此操作会将LastModifiedTime修改为当前时间。此时，MaxCompute会认为数据有变动，重新计算生命周期。

使用限制
对于有多级分区的表，必须指明全部的分区。

命令格式

alter table <table_name> touch partition (<pt_spec>);

参数说明
- table_name：必填。待修改分区更新时间的分区表名称。如果表不存在，则返回报错。
- pt_spec：必填。需要修改更新时间的分区信息。格式为(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)。partition_col是分区字段，partition_col_value是分区值。如果指定的分区字段或分区值不存在，则返回报错。

使用示例

--修改表sale_detail的分区sale_date='201312', region='shanghai'的LastModifiedTime。
alter table sale_detail touch partition (sale_date='201312', region='shanghai');

修改分区值

MaxCompute SQL支持通过rename操作更改分区表的分区值。

使用限制
- 不支持修改分区列的列名，只能修改分区列对应的值。
- 对于有多级分区的表，必须指明全部的分区。

命令格式

alter table <table_name> partition (<pt_spec>) rename to partition (<new_pt_spec>);

参数说明
- table_name：必填。待修改分区值的表名称。
- pt_spec：必填。需要修改分区值的分区信息。格式为(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)。partition_col是分区字段，partition_col_value是分区值。如果指定的分区字段或分区值不存在，则返回报错。
- new_pt_spec：必填。修改后的分区信息。格式为(partition_col1 = new_partition_col_value1, partition_col2 = new_partition_col_value2, ...)。partition_col是分区字段，new_partition_col_value是新分区值。

使用示例

--修改表sale_detail的分区值。
alter table sale_detail partition (sale_date = '201312', region = 'hangzhou') rename to partition (sale_date = '201310', region = 'beijing');

合并分区

MaxCompute SQL提供merge partition对分区表的分区进行合并，即将同一个分区表下的多个分区合并成一个分区，同时删除被合并的分区维度的信息，把数据移动到指定分区。

使用限制
- 不支持外部表，聚簇表合并后的分区会消除聚簇属性。
- 一次性合并分区数量限制为4000个。

命令格式

alter table <table_name> merge [if exists] partition (<predicate>) [, partition(<predicate2>) ...] overwrite partition (<fullpartitionSpec>) [purge];

参数说明
- table_name：必填。待合并分区的分区表名称。
- if exists：可选。如果未指定if exists，且分区不存在，会执行失败并返回报错。如果指定if exists后不存在满足merge条件的分区，则不生成新分区。如果运行过程中出现源数据被并发修改（包括insert、rename或drop）时，即使指定if exists也会报错。
- predicate：必填。筛选待合并分区需要满足的条件。
- fullpartitionSpec：必填。目标分区信息。
- purge：可选关键字。选择该字段，则会清理session目录，默认清理3天内的日志。详情请参见Purge。

使用示例

示例1：合并满足指定条件的分区到目标分区。

--查看分区表的分区。
show partitions intpstringstringstring;

ds=20181101/hh=00/mm=00
ds=20181101/hh=00/mm=10
ds=20181101/hh=10/mm=00
ds=20181101/hh=10/mm=10

--合并所有满足hh='00'的分区到hh='00'，mm='00'中。
alter table intpstringstringstring merge partition(hh='00') overwrite partition(ds='20181101', hh='00', mm='00');

--查看合并后的分区。
show partitions intpstringstringstring;

ds=20181101/hh=00/mm=00
ds=20181101/hh=10/mm=00
ds=20181101/hh=10/mm=10

示例2：合并指定的多个分区到目标分区。

--合并多个指定分区。
alter table intpstringstringstring merge if exists partition(ds='20181101', hh='00', mm='00'), partition(ds='20181101', hh='10', mm='00'),  partition(ds='20181101', hh='10', mm='10') overwrite partition(ds='20181101', hh='00', mm='00') purge;
--查看分区表的分区。
show partitions intpstringstringstring;

ds=20181101/hh=00/mm=00

添加列或注释

为已存在的非分区表或分区表添加列或注释。

说明

MaxCompute已支持添加STRUCT类型的列，例如struct<x: string, y: bigint>、map<string, struct<x: double, y: double>>。

命令格式

alter table <table_name> add columns (<col_name1> <type1> comment ['<col_comment>'][, <col_name2> <type2> comment '<col_comment>'...]);

参数说明
- table_name：必填。待新增列的表名称。添加的新列不支持指定顺序，默认在最后一列。
- col_name：必填。新增列的名称。
- type：必填。新增列的数据类型。
- col_comment：可选。新增列的注释。

使用示例

示例1：给表sale_detail添加两个列。

alter table sale_detail add columns (customer_name STRING, education BIGINT);

示例2：给表sale_detail添加两个列并同时添加列注释。

alter table sale_detail add columns (customer_name STRING comment '客户', education BIGINT comment '教育' );

示例3：给表sale_detail添加一个复杂数据类型列。

alter table sale_detail add columns (region struct<province:string, area:string>);

删除列

为已存在的非分区表或分区表删除指定的单个或多个列。

说明

在下列场景中，如果执行了删除列操作，会使表的读写行为发生变化：

作业类型是MapReduce 1.0时，Graph任务无法读写修改的表。
CUPID作业只有Spark以下版本可以读表，但是不可以写表：
- Spark-2.3.0-odps0.34.0
- Spark-3.1.1-odps0.34.0
PAI作业可以读表，但不可以写表。
Hologres作业在1.3版本之前，Hologres引用修改的表作为外部表时，无法读写该表。
表做过删除列操作后，不支持CLONE TABLE。

此外，Streaming Tunnel在写入表时，不可以修改表结构。

命令格式

alter table <table_name> drop columns <col_name1>[, <col_name2>...];

参数说明
- table_name：必填。待删除列的表名称。
- col_name：必填。待删除的列名称。

使用示例

--删除表sale_detail的列customer_id。输入yes确认后，即可删除列。
alter table sale_detail drop columns customer_id;
--删除表sale_detail的列shop_name和customer_id。输入yes确认后，即可删除列。
alter table sale_detail drop columns shop_name, customer_id;

更改列数据类型

为已存在的列更改数据类型。

说明

在下列场景中，如果执行了更改列数据类型操作，会使表的读写行为发生变化：

作业类型是MapReduce 1.0时，Graph任务无法读写修改的表。
CUPID作业只有Spark以下版本可以读表，但是不可以写表：
- Spark-2.3.0-odps0.34.0
- Spark-3.1.1-odps0.34.0
PAI作业可以读表，但不可以写表。
Hologres作业在1.3版本之前，Hologres引用修改的表作为外部表时，无法读写该表。
表做过更改列数据类型操作后，不支持CLONE TABLE。

此外，Streaming Tunnel在写入表时，不可以修改表结构。

命令格式。

alter table <table_name> change [column] <old_column_name> <new_column_name> <new_data_type>;

参数说明。
- table_name：必填。待修改列数据类型的表名称。
- old_column_name：必填。待修改列数据类型的列名称。
- new_column_name：必填。修改列数据类型后的列名称。old_column_name可以与new_column_name保持一致，表示不修改列名称。但是new_column_name不能与除old_column_name之外的列名称相同。
- new_data_type：必填。待修改的列修改后的数据类型。

使用示例。

--将mf_evol_t3表的id字段由int转化为bigint
alter table mf_evol_t3 change id id bigint;
--将mf_evol_t3表的id字段类型由bigint转化为string
alter table mf_evol_t3 change column id id string;

数据类型支持转换表。
说明
Y表示支持转换；N表示不支持转换；-表示不涉及；Y（）表示满足括号内的条件支持转换。

修改列的顺序

为已存在的非分区表或分区表修改列顺序。

说明

在下列场景中，如果执行了更改表的列顺序、添加新列并修改列顺序操作，会使表的读写行为发生变化：

作业类型是MapReduce 1.0时，Graph任务无法读写修改的表。
CUPID作业只有Spark以下版本可以读表，但是不可以写表：
- Spark-2.3.0-odps0.34.0
- Spark-3.1.1-odps0.34.0
PAI作业可以读表，但不可以写表。
Hologres作业在1.3版本之前，Hologres引用修改的表作为外部表时，无法读写该表。
表做过更改表的列顺序操作后，不支持CLONE TABLE。

此外，Streaming Tunnel在写入表时，不可以修改表结构。

命令格式

alter table <table_name> change <old_column_name> <new_column_name> <column_type> after <column_name>;

参数说明
- table_name：必填。待修改列顺序的表名称。
- old_column_name：必填。待修改顺序的列的原始名称。
- new_col_name：必填。修改后的列名称。new_col_name可以与old_column_name保持一致，表示不修改列名称。但new_col_name不能与除old_column_name的之外的列名称相同。
- column_type：必填。待修改的列的原始数据类型。不可修改。
- column_name：必填。将待调整顺序的列调整至column_name之后。

使用示例

--修改表sale_detail的列customer_id为customer并位于total_price之后。
alter table sale_detail change customer_id customer string after total_price;
--修改表sale_detail的列customer_id位于total_price之后，不修改列名称。
alter table sale_detail change customer_id customer_id string after total_price;

修改列名

为已存在的非分区表或分区表修改列名称。

命令格式

alter table <table_name> change column <old_col_name> rename to <new_col_name>;

参数说明
- table_name：必填。待修改列名的表名称。
- old_col_name：必填。待修改的列名称。old_col_name必须是已存在的列。
- new_col_name：必填。修改后的列名称。表中不能有名为new_col_name的列。

使用示例

--修改表sale_detail的列名customer_name为customer。
alter table sale_detail change column customer_name rename to customer;

修改列注释

为已存在的非分区表或分区表修改列注释。

语法格式

alter table <table_name> change column <col_name> comment '<col_comment>';

参数说明
- table_name：必填。待修改列注释的表名称。
- col_name：必填。待修改注释的列名称。col_name必须是已存在的列。
- col_comment：必填。修改后的注释信息。注释内容为长度不超过1024字节的有效字符串，否则报错。

使用示例

--修改表sale_detail的列customer的注释。
alter table sale_detail change column customer comment 'customer';

修改列名及注释

修改非分区表或分区表的列名或注释。

命令格式

alter table <table_name> change column <old_col_name> <new_col_name> <column_type> comment '<col_comment>';

参数说明
- table_name：必填。需要修改列名以及注释的表名称。
- old_col_name：必填。需要修改的列名称。old_col_name必须是已存在的列。
- new_col_name：必填。新的列名称。表中不能有名为new_col_name的列。
- column_type：必填。列的数据类型。
- col_comment：可选。修改后的注释信息。内容最长为1024字节。

使用示例

--修改表sale_detail的列名customer_name为customer_newname，注释“客户”为“customer”。
alter table sale_detail change column customer_name customer_newname STRING comment 'customer';

修改表的列非空属性

修改表的非分区列的非空属性。即如果表的非分区列值禁止为NULL，您可以通过本命令修改分区列值允许为NULL。

您可以通过desc extended table_name;命令查看Nullable属性值，判断列的非空属性。如果Nullable为true，表示允许为NULL；如果Nullable为false，表示禁止为NULL。

使用限制
修改分区列值允许为NULL后，不可回退，不支持再修改分区列值禁止为NULL，请谨慎操作。

命令格式

alter table <table_name> change column <old_col_name> null;

参数说明
- table_name：必填。待修改列非空属性的表名称。
- old_col_name：必填。待修改的非分区列的名称。old_col_name必须是已存在的非分区列。

使用示例

--创建一张分区表，id列禁止为NULL。
create table null_test(id int not null, name string) partitioned by (ds string);
--修改id列允许为NULL。
alter table null_test change column id null;

合并Transactional表文件

Transactional表底层物理存储为不支持直接读取的Base文件和Delta文件。对Transactional表执行update或delete操作，不会修改Base文件，只会追加Delta文件，所以会出现更新或删除次数越多，表实际占用存储越大的情况，多次累积的Delta文件会产生较高的存储和后续查询费用。

对同一表或分区，执行多次update或delete操作，会生成较多Delta文件。系统读数据时，需要加载这些Delta文件来确定哪些行被更新或删除，较多的Delta文件会影响数据读取效率。此时您可以将Base文件和Delta合并，减少存储以便提升数据读取效率。

命令格式

alter table <table_name> [partition (<partition_key> = '<partition_value>' [, ...])] compact {minor|major};

参数说明
- table_name：必填。待合并文件的Transactional表名称。
- partition_key：可选。当Transactional表为分区表时，指定分区列名。
- partition_value：可选。当Transactional表为分区表时，指定分区列名对应的列值。
- major|minor：至少选择其中一个。二者的区别是：
  - minor：只将Base文件及其下所有的Delta文件合并，消除Delta文件。
  - major：不仅将Base文件及其下所有的Delta文件合并，消除Delta文件，还会把表对应的Base文件中的小文件进行合并。当Base文件较小（小于32 MB）或有Delta文件的情况下，等价于重新对表执行insert overwrite操作，但当Base文件足够大（大于等于32 MB ），且不存在Delta文件的情况下，不会重写。

使用示例

示例1：基于Transactional表acid_delete，合并表文件。命令示例如下：

alter table acid_delete compact minor;

返回结果如下：

Summary:
Nothing found to merge, set odps.merge.cross.paths=true if cross path merge is permitted.
OK

示例2：基于Transactional表acid_update_pt，合并表文件。命令示例如下：

alter table acid_update_pt partition (ds = '2019') compact major;

返回结果如下：

Summary:
table name: acid_update_pt /ds=2019  instance count: 2  run time: 6
  before merge, file count:        8  file size: 2613  file physical size: 7839
   after merge, file count:        2  file size: 679  file physical size: 2037

OK

合并小文件

分布式文件系统按块Block存放，文件大小比块大小（64 M）小的文件称之为小文件。分布式系统不可避免会产生小文件，比如SQL或其他分布式引擎计算结果，tunnel数据采集都会产生小文件，小文件合并可以提高计算性能。

命令格式

ALTER TABLE <tablename> [PARTITION(<partition_key>=<partition_value>)] MERGE SMALLFILES;

参数说明
- table_name：必填。待合并文件的表名称。
- partition_key：可选。当表为分区表时，指定分区列名。
- partition_value：可选。当表为分区表时，指定分区列名对应的列值。

使用示例

set odps.merge.cross.paths=true;
set odps.merge.smallfile.filesize.threshold=128;
set odps.merge.max.filenumber.per.instance = 2000;
alter table tbcdm.dwd_tb_log_pv_di partition (ds='20151116') merge smallfiles;

使用合并小文件功能需要用到计算资源，如果您购买的实例是按量计费，会产生相关费用，具体计费规则与SQL按量计费保持一致，详情请参见计算费用。

更多详情，请参见合并小文件。

关于阿里云

阿里云全球基础设施

快速入门

全球办事处

2024年巴黎奥运会 New

罗兰加洛斯球场 - 岁月沉淀的辉煌 New

协和广场 - “打破”障碍 New

马恩河畔韦尔水上运动体育场 - 可持续的体育运动 New

国际广播中心 - 优质图像、声音和数据触达数十亿观众 New

客户成功案例 New

阿里云信任中心

合规计划

云合规资源

合规常见问题

云产品快报 New

Cloud Forward

新闻报道

阿里云电子期刊 New

阿里云调研分析报告

公告

阿里云出海业务 New

“橙”云出海服务联盟

Asia Accelerator Hot

信息合规

China Gateway - MLPS 2.0 合规 New

China Gateway - 网络

China Gateway - 全球应用加速 New

China Gateway - 安全

China Gateway - 数据安全 New

ICP支持服务 Hot

China Gateway - 全域数据中台 New

China Gateway - 一方数据中台 New

China Gateway - 业务中台 New

China Gateway - 智能客服解决方案 New

China Gateway - 在线教育

China Gateway - 域名注册

在阿里云工作

经验丰富的专业人士

学生和毕业生

免费试用

定价

优惠中心

降价

花钱更少，部署更多

FinOps

云服务器 ECS

轻量应用服务器 SAS

GPU 云服务器

无影云电脑 EDS

对象存储 OSS

云企业网 CEN

Web应用防火墙 WAF

域名

智能编码助手通义灵码

容器计算服务 ACS

办公安全平台 SASE

智能媒体服务 IMS

边缘安全加速 ESA（原DCDN）

智能媒体管理 IMM

专属钉钉

宜搭

大模型服务平台（百炼）

Apsara Prime - 轻松选择云产品

阿里云 ECS-满足您所有云主机需求

1TB CDN — 立即获取免费的 1 TB 出站流量套餐

安全 — 受到攻击？ 获取免费安全支持

短信服务 - 现已免费开放测试

云服务器 ECS Hot

云盒

计算巢服务

专有宿主机 Hot

弹性裸金属服务器（神龙）

GPU 云服务器 Featured

轻量应用服务器 SAS Hot

弹性伸缩

无影云手机 Beta

无影云电脑 EDS Featured

批量计算

弹性高性能计算 E-HPC

超级计算集群 SCC

安全 — 受到攻击？获取免费安全支持