本文将介绍HASH函数使用方式。
描述
- 若分库和分表使用不同拆分键进行HASH时,则根据分库键的键值直接按分库数取余。如果键值是字符串,则字符串会先被换算成哈希值再进行路由计算。
例如HASH(8)等价于8%D(D是分库数目), 而HASH("ABC")等价于hashcode("ABC").abs()%D(D是分库数目)。
- 若分库和分表都使用同一个拆分键进行HASH时,则根据拆分键的键值按总的分表数取余。
例如有2个分库,每个分库4张分表,那么0库上保存分表0~3,1库上保存分表4~7。某个键值为15,那么根据该路由方式,则该键值15将被分到1库的表7上((15 % (2 * 4) =7))。
注意事项
HASH函数要求拆分列的值的自身分布均衡才能保证哈希均衡。
使用限制
- 拆分键的数据类型必须是整数类型或字符串类型。
- 字符串类型的拆分键路由时区分大小写。
使用场景
HASH函数主要适用于如下场景:
示例- 需要按用户ID或订单ID进行分库的场景;
- 拆分键是字符串类型的场景。
假设需要对ID列按HASH函数进行分库不分表,则您可以使用如下DDL语句进行建表:
create table test_hash_tb (
id int,
name varchar(30) DEFAULT NULL,
create_time datetime DEFAULT NULL,
primary key(id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 dbpartition by HASH(ID);