您可以使用ROLLUP
语法实现只借助一条查询语句,就计算出数据在不同维度上划分组之后得到的统计结果以及所有数据的总体值。本文将介绍如何使用ROLLUP
语法。
前提条件
PolarDB集群版本需为PolarDB MySQL版 8.0且Revision version为8.0.1.1.0或以上,您可以参见查询版本号确认集群版本。
语法
ROLLUP
语法可以看作是GROUP BY
语法的拓展,您只需要在原本的GROUP BY
列之后加上WITH ROLLUP
即可,例如:
SELECT year, country, product, SUM(profit) AS profit
FROM sales
GROUP BY year, country, product WITH ROLLUP;
除了产生按照GROUP BY所指定的列聚合产生的结果外,ROLLUP
还会从右至左依次计算更高层次的聚合结果,直至所有数据的聚合。例如上述语句就会先按照GROUP BY year, country, product
计算总收益,再按照GROUP BY year, country
以及GROUP BY year
计算总收益,最后按照不带任何GROUP BY
条件计算整个sales表的总收益。
使用ROLLUP
语法主要有如下优势:
方便对数据进行多维度的统计分析,简化原本对不同维度各自进行SQL查询的编程复杂度。
实现更快更高效的查询处理。
ROLLUP
可以将所有的聚合工作转移到服务端,只用读一次数据就能够完成原本多次查询才能完成的统计工作,减轻了客户端的处理负载和网络流量。
并行查询ROLLUP增强性能测试
PolarDB还实现了针对ROLLUP
语法的并行查询(Parallel Query)增强,支持多个线程并发计算聚合结果并输出汇总后的结果,大大提升语句执行效率。
使用TPCH进行测试,以Q1为例,在原始的语句上加入ROLLUP
语法:
说明 本文的TPC-H的实现基于TPC-H的基准测试,并不能与已发布的TPC-H基准测试结果相比较,本文中的测试并不符合TPC-H基准测试的所有要求。
select
l_returnflag,
l_linestatus,
sum(l_quantity) as sum_qty,
sum(l_extendedprice) as sum_base_price,
sum(l_extendedprice * (1 - l_discount)) as sum_disc_price,
sum(l_extendedprice * (1 - l_discount) * (1 + l_tax)) as sum_charge,
avg(l_quantity) as avg_qty,
avg(l_extendedprice) as avg_price,
avg(l_discount) as avg_disc,
count(*) as count_order
from
lineitem
where
l_shipdate <= date_sub('1998-12-01', interval ':1' day)
group by
l_returnflag,
l_linestatus
with rollup
order by
l_returnflag,
l_linestatus;
不开启并行查询时,耗时318.73秒。
开启并行查询后,耗时22.30秒,语句执行效率提升14倍以上。