本文将介绍如何创建并使用列存索引(CCI)功能。
版本限制
注意事项
仅PolarDB-X 2.0企业版的主实例上支持创建列存索引。更多信息,请参见列存索引创建指南。
创建CCI时的相关约束:
不支持通过任何方式使用前缀索引。
创建CCI时必须指定索引名。
创建CCI默认包含主表的所有列,且创建后会随着主表的列调整而自动调整,不支持手动调整列。
创建CCI不会额外创建任何局部索引。
索引定义中,排序键的
LENGTH
参数将被忽略。
主实例、只读实例、列存只读实例都支持
SHOW INDEX
等查询命令。更多信息,请参见SHOW COLUMNAR INDEX、SHOW COLUMNAR OFFSET、SHOW COLUMNAR STATUS。DDL相关限制,请参见使用限制。
语法
PolarDB-X对MySQL DDL的语法进行了扩展,增加定义CCI的语法,使用方式与在MySQL上创建索引一致,其语法如下所示:
CREATE
CLUSTERED COLUMNAR INDEX index_name
ON tbl_name (index_sort_key_name,...)
[partition_options]
# 分区策略定义
partition_options:
PARTITION BY
HASH({column_name | partition_func(column_name)})
| KEY(column_list)
| RANGE({column_name | partition_func(column_name)})
| RANGE COLUMNS(column_list)
| LIST({column_name | partition_func(column_name)})
| LIST COLUMNS(column_list)} }
partition_list_spec
# 分区函数定义
partition_func:
YEAR
| TO_DAYS
| TO_SECOND
| UNIX_TIMESTAMP
| MONTH
# 分区列表定义
partition_list_spec:
hash_partition_list
| range_partition_list
| list_partition_list
# Hash/Key分区表列定义
hash_partition_list:
PARTITIONS partition_count
# Range/Range Columns分区表列定义
range_partition_list:
range_partition [, range_partition ...]
range_partition:
PARTITION partition_name VALUES LESS THAN {(expr | value_list)} [partition_spec_options]
# List/List Columns分区表列定义
list_partition_list:
list_partition [, list_partition ...]
list_partition:
PARTITION partition_name VALUES IN (value_list) [partition_spec_options]
示例
执行如下代码创建表t_order
,再基于t_order
创建列存索引cc_i_seller
:
CREATE TABLE t_order (
`id` bigint(11) NOT NULL AUTO_INCREMENT,
`order_id` varchar(20) DEFAULT NULL,
`buyer_id` varchar(20) DEFAULT NULL,
`seller_id` varchar(20) DEFAULT NULL,
`order_snapshot` longtext DEFAULT NULL,
`order_detail` longtext DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `l_i_order` (`order_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 partition by hash(`order_id`) partitions 16;
CREATE CLUSTERED COLUMNAR INDEX `cc_i_seller` ON t_order (`seller_id`) partition by hash(`order_id`) partitions 16;
创建列存索引代码详解如下:
CLUSTERED COLUMNAR:关键字,用于指定添加的索引类型为CCI。
主表:
t_order
是分区表,分区的拆分方式为按照order_id
列进行哈希分区。索引名:索引的名称,用于在SQL语句中指定该索引。
排序键:索引的排序键,即数据在索引文件中按照该列有序存储。
索引分区子句:索引的分区算法,与
CREATE TABLE
中分区子句的语法一致,其中order_id
为哈希列。索引定义子句:
CLUSTERED COLUMNAR INDEX `cc_i_seller` ON t_order (`seller_id`) partition by hash(`order_id`) partitions 16
。
如何在查询中使用CCI
CCI创建完成后,可以通过如下方式指定查询使用的索引表:
通过HINT指定索引的方式
语法:
FORCE INDEX({index_name})
示例:
SELECT a.*, b.order_id
FROM t_seller a
JOIN t_order b FORCE INDEX(cc_i_seller) ON a.seller_id = b.seller_id
WHERE a.seller_nick="abc";
索引选择的方式
对于带有列存索引的主表查询,PolarDB-X会自动选择出优化器认为代价最低的索引表(目前仅支持在列存只读实例上使用列存索引查询)。
不使用指定索引(IGNORE INDEX)
语法:
IGNORE INDEX({index_name},...)
以下代码可以指定优化器不使用索引cc_i_seller
:
SELECT t_order.id,t_order.order_snapshot FROM t_order IGNORE INDEX(cc_i_seller) WHERE t_order.seller_id = 's1';
使用指定索引(USE INDEX)
语法:
USE INDEX({index_name},...)
以下代码可以指定优化器使用索引cc_i_seller
:
SELECT t_order.id,t_order.order_snapshot FROM t_order USE INDEX(cc_i_seller) WHERE t_order.seller_id = 's1';
使用限制
使用限制主要分为以下三类:
创建CCI时,主键、排序键和分区键的数据类型具有一定限制。
在包含CCI的表中,执行DDL具有一定限制,目前仅支持常见的DDL语句。
执行DDL变更列数据类型时,支持有限的数据类型。
数据类型限制
数据类型 | 主键 | 排序键 | 分区键 | |
数值类型 | BIT (UNSIGNED) | 支持 | 支持 | 不支持 |
TINYINT (UNSIGNED) | 支持 | 支持 | 支持 | |
SMALLINT (UNSIGNED) | 支持 | 支持 | 支持 | |
MEDIUMINT (UNSIGNED) | 支持 | 支持 | 支持 | |
INT (UNSIGNED) | 支持 | 支持 | 支持 | |
BIGINT (UNSIGNED) | 支持 | 支持 | 支持 | |
时间类型 | DATE | 支持 | 支持 | 支持 |
DATETIME | 支持 | 支持 | 支持 | |
TIMESTAMP | 支持 | 支持 | 支持 | |
TIME | 支持 | 支持 | 不支持 | |
YEAR | 支持 | 支持 | 不支持 | |
字符串类型 | CHAR | 支持 | 支持 | 支持 |
VARCHAR | 支持 | 支持 | 支持 | |
TEXT | 支持 | 支持 | 不支持 | |
BINARY | 支持 | 支持 | 支持 | |
VARBINARY | 支持 | 支持 | 支持 | |
BLOB | 支持 | 支持 | 不支持 | |
浮点数类型 | FLOAT | 不支持 | 不支持 | 不支持 |
DOUBLE | 不支持 | 不支持 | 不支持 | |
DECIMAL | 不支持 | 不支持 | 不支持 | |
NUMERIC | 不支持 | 不支持 | 不支持 | |
特殊类型 | JSON | 不支持 | 不支持 | 不支持 |
ENUM | 不支持 | 不支持 | 不支持 | |
SET | 不支持 | 不支持 | 不支持 | |
POINT | 不支持 | 不支持 | 不支持 | |
GEOMETRY | 不支持 | 不支持 | 不支持 |
因为不同分区算法支持的数据类型稍有不同,所以详细区别,请详见数据类型说明。
DDL语句限制
您可以使用如下语句来控制是否允许在包含CCI的表中执行DDL(true
为允许、false
为不允许):
SET [GLOBAL] forbid_ddl_with_cci = [true | false];
含CCI的主表及CCI本身的DDL支持情况如下:
操作类别
操作名称
示例SQL
支持情况
主表
删除表
DROP TABLE tbl_name;
支持
清空表
TRUNCATE TABLE tbl_name;
支持
重命名表
ALTER TABLE old_tbl_name RENAME TO new_tbl_name;
RENAME TABLE old_tbl_name TO new_tbl_name;
支持
重命名多个表
RENAME TABLE tbl_name_a to tbl_name_b, tbl_name_c to tbl_name_d;
支持
添加列
ALTER TABLE tbl_name ADD col_name TYPE;
支持
删除列
ALTER TABLE tbl_name DROP COLUMN col_name;
支持
修改列类型
ALTER TABLE tbl_name MODIFY col_name TYPE;
支持
重命名(修改)列
ALTER TABLE tbl_name CHANGE old_col new_col TYPE;
支持
修改列默认值
ALTER TABLE tbl_name ALTER COLUMN col_name SET DEFAULT default_value
;ALTER TABLE tbl_name ALTER COLUMN col_name DROP DEFAULT;
支持
无锁变更列类型
ALTER TABLE tbl_name MODIFY col_name TYPE, ALGORITHM = omc;
支持
ALTER TABLE
多重操作ALTER TABLE tbl_name MODIFY col_name_a, DROP COLUMN col_name_b;
支持
生成列
-
不支持
分区变更
-
不支持
列存索引(CCI)
新建CCI
CREATE CLUSTERED COLUMNAR INDEX cci_name;
ALTER TABLE tbl_name ADD CLUSTERED COLUMNAR INDEX cci_name;
支持
删除CCI
DROP INDEX cci_name ON TABLE tbl_name;
ALTER TABLE tbl_name DROP INDEX cci_name;
支持
更改CCI名称
ALTER TABLE tbl_name RENAME INDEX cci_name_a TO cci_name_b;
支持
增加CCI Range分区
ALTER TABLE `tbl_name`.`cci_name` ADD PARTITION;
支持
其他CCI分区变更
-
不支持
ALTER TABLE
变更列时,相关约束如下:语句
是否支持变更主键
是否支持变更索引分区键
是否支持变更排序键
ADD COLUMN
不支持
不涉及
不涉及
ALTER COLUMN SET DEFAULT、ALTER COLUMN DROP DEFAULT
不支持
不支持
不支持
CHANGE COLUMN
不支持
不支持
不支持
DROP COLUMN
不支持
不支持
不支持
MODIFY COLUMN
不支持
不支持
不支持
说明除了主键列、主表/索引分区键列、排序键列这些列之外,其他列都支持
ADD COLUMN
、ALTER COLUMN SET DEFAULT
、ALTER COLUMN DROP DEFAULT
、CHANGE COLUMN
、DROP COLUMN
、MODIFY COLUMN
操作。MODIFY/CHANGE COLUMN
语句的类型限制如下:支持类型
不支持类型
数值类型:BIT (UNSIGNED),TINYINT (UNSIGNED),SMALLINT (UNSIGNED),MEDIUMINT (UNSIGNED),INT (UNSIGNED),BIGINT (UNSIGNED)
时间类型:DATETIME
浮点数类型:FLOAT,DOUBLE,DECIMAL、NUMERIC
字符串类型:CHAR,VARCHAR
字符串类型:TEXT,BINARY,VARBINARY,BLOB
时间类型:TIMESTAMP、TIME、YEAR
特殊类型:JSON、ENUM、SET、POINT、GEOMETRY
说明如果遇到不支持的类型,您可以先使用
DROP INDEX
删除列存索引,变更列类型后再重新创建列存索引。ALTER TABLE
语句变更索引的支持情况如下:语句
是否支持
ALTER TABLE ADD PRIMARY KEY
支持
ALTER TABLE ADD [UNIQUE/FULLTEXT/SPATIAL/FOREIGN] KEY
支持
ALTER TABLE DROP INDEX
支持
ALTER TABLE DROP FOREIGN KEY fk_symbol
支持
ALTER TABLE DROP PRIMARY KEY
禁止
ALTER TABLE RENAME INDEX
支持修改CCI名称
ALTER TABLE ALTER INDEX index_name {VISIBLE | INVISIBLE}
不支持修改CCI
ALTER TABLE {DISABLE | ENABLE} KEYS
不支持修改CCI
常见问题
创建列存索引时能否不指定排序键?
答:不能。必须在
CREATE CLUSTERED COLUMNAR INDEX
语句中显式指定排序键。排序键与分区键可以是完全不同的列。例如在t_order
表上创建CCI时,可以指定seller_id
作为排序键,order_id
作为分区键。创建列存索引时能否不指定分区键?
答:可以。如果没有指定分区键,则默认选择主键作为分区键,并选择HASH作为分区策略。
如何查看创建列存索引的进度?
答:可以通过DDL管理语句查看列存索引当前的状态和DDL任务的执行进度。详细信息,请参见SHOW COLUMNAR INDEX和SHOW DDL。
如何删除列存索引?
答:可以通过DROP INDEX删除已经成功创建的列存索引。