SQL分析支援的彙總函式 - IoT Platform

彙總（Aggregate）函數的輸入與輸出是多對一的關係，即將多條輸入記錄彙總成一條輸出值，可以與group by語句配合使用。本文為您提供SQL分析支援的彙總函式的命令格式、參數說明及樣本，指導您使用彙總函式完成開發。

SQL分析支援的彙總函式如下。

函數	功能
ANY_VALUE	在指定範圍內任選一個值返回。
APPROX_DISTINCT	返回輸入的非重複值的近似數目。
ARG_MAX	返回指定列的最大值對應行的列值。
ARG_MIN	返回指定列的最小值對應行的列值。
AVG	計算平均值。
BITWISE_AND_AGG	計算輸入Value的bit AND彙總值。
BITWISE_OR_AGG	計算輸入Value的bit OR彙總值。
COUNT	計算記錄數。
COUNT_IF	計算指定運算式為True的記錄數。
MAX	計算最大值。
MAX_BY	返回指定列的最大值對應行的列值。
MEDIAN	計算中位元。
MIN	計算最小值。
MIN_BY	返回指定列的最小值對應行的列值。
STDDEV	計算總體標準差。
STDDEV_SAMP	計算樣本標準差。
SUM	計算匯總值。
WM_CONCAT	用指定的分隔字元連接字串。

ANY_VALUE

命令格式。
```
any_value(<colname>)
```
命令說明。
在指定範圍內任選一個值返回。
參數說明。
colname：必填。可以為任意類型。
傳回值說明。
傳回值類型同colname對應實值型別。colname值為NULL時，該行不參與計算。

樣本。

樣本1：在所有職工中任選一名。命令樣本如下：

select any_value(ename) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| SMITH      |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，並在各組中任選一名。命令樣本如下：

select deptno, any_value(ename) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | CLARK      |
| 20         | SMITH      |
| 30         | ALLEN      |
+------------+------------+

APPROX_DISTINCT

命令格式。
```
approx_distinct(<colname>)
```
命令說明。
計算指定列的非重複值的近似數目。
參數說明。
colname：必填。需要統計去重的列。
傳回值說明。
返回BIGINT類型。此函數會產生5%的標準誤差。colname值為NULL時，該行不參與計算。

樣本。

樣本1：統計薪資（sal）列非重複值的近似數目。命令樣本如下：

select approx_distinct(sal) from emp;

返回結果如下：

+-------------------+
| numdistinctvalues |
+-------------------+
| 12                |
+-------------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，統計薪資（sal）列非重複值的近似數目。命令樣本如下：

select deptno, approx_distinct(sal) from emp group by deptno;

返回結果如下：

+------------+-------------------+
| deptno     | numdistinctvalues |
+------------+-------------------+
| 10         | 3                 |
| 20         | 4                 |
| 30         | 5                 |
+------------+-------------------+

ARG_MAX

命令格式。

arg_max(<valueToMaximize>, <valueToReturn>)

命令說明。
返回valueToMaximize最大值對應行的valueToReturn。
參數說明。
- valueToMaximize：必填。可以為任意類型。
- valueToReturn：必填。可以為任意類型。
傳回值說明。
傳回值類型和valueToReturn類型相同，如果存在多行最大值時，隨機返回最大值中的一行對應的值。valueToMaximize值為NULL時，該行不參與計算。

樣本。

樣本1：返回薪資最高的員工姓名。命令樣本如下：

select arg_max(sal, ename) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| KING       |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，並返回各組中薪資最高職工姓名。命令樣本如下：

select deptno, arg_max(sal, ename) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | KING       |
| 20         | SCOTT      |
| 30         | BLAKE      |
+------------+------------+

ARG_MIN

命令格式。

arg_min(<valueToMinimize>, <valueToReturn>)

命令說明。
返回valueToMinimize最小值對應行的valueToReturn。
參數說明。
- valueToMinimize：必填。可以為任意類型。
- valueToReturn：必填。可以為任意類型。
傳回值說明。
傳回值類型和valueToReturn類型相同，如果存在多行最小值時，隨機返回最小值其中的一行對應的值。valueToMinimize值為NULL時，該行不參與計算。

樣本。

樣本1：返回薪資最低的員工姓名。命令樣本如下：

select arg_min(sal, ename) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| SMITH      |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，並返回各組中薪資最低職工姓名。命令樣本如下：

select deptno, arg_min(sal, ename) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | MILLER     |
| 20         | SMITH      |
| 30         | JAMES      |
+------------+------------+

AVG

命令格式。
```
DECIMAL｜DOUBLE  avg(<colname>)
```
命令說明。
計算平均值。
參數說明。
colname：必填。列值支援所有資料類型，可以轉換為DOUBLE類型後參與運算。
傳回值說明。
如果colname值為NULL時，該行不參與計算。其他類型返回規則如下：
輸入類型
傳回型別
TINYINT
DOUBLE
SMALLINT
DOUBLE
INT
DOUBLE
BIGINT
DOUBLE
FLOAT
DOUBLE
DOUBLE
DOUBLE
DECIMAL
DECIMAL

樣本。

樣本1：計算所有職工的平均薪資（sal）。命令樣本如下：

select avg(sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 2222.0588235294117 |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，計算各部門員工的平均薪資（sal）。命令樣本如下：

select deptno, avg(sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 2916.6666666666665 |
| 20         | 2175.0     |
| 30         | 1566.6666666666667 |
+------------+------------+

BITWISE_AND_AGG

函式宣告。
```
bigint bitwise_and_agg(bigint value)
```
命令說明。
對於輸入的value，按照bit AND操作計算彙總值。
參數說明。
value：必填。BIGINT類型的值，NULL值不參與計算。
傳回值說明。
返回BIGINT類型。

樣本。

select id, bitwise_and_agg(v) from
    values (1L, 2L), (1L, 1L), (2L, null), (1L, null) t(id, v) group by id;

返回結果如下。

+------------+------------+
| id         | _c1        |
+------------+------------+
| 1          | 0          |
| 2          | NULL       |
+------------+------------+

BITWISE_OR_AGG

函式宣告。
```
bigint bitwise_or_agg(bigint value)
```
命令說明。
對於輸入的value，按照bit OR操作計算彙總值。
參數說明。
value：必填。BIGINT類型的值，NULL值不參與計算。
傳回值說明。
返回BIGINT類型。

樣本。

select id, bitwise_or_agg(v) from
    values (1L, 2L), (1L, 1L), (2L, null), (1L, null) t(id, v) group by id;

返回結果如下。

+------------+------------+
| id         | _c1        |
+------------+------------+
| 1          | 3          |
| 2          | NULL       |
+------------+------------+

COUNT

命令格式。
```
bigint count([distinct|all] <colname>)
```
命令說明。
計算記錄數。
參數說明。
- distinct|all：可選。表示在計數時是否去除重複記錄，預設為all，即計算全部記錄。如果指定distinct，則只計算唯一值數量。
- colname：必填。列值可以為任意類型。colname可以為*，即count(*)，返回所有行數。
傳回值說明。
返回BIGINT類型。colname值為NULL時，該行不參與計算。

樣本。

樣本1：計算所有部門的總職工人數。命令樣本如下：

select count(*) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 17         |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，計算各部門（deptno）的職工人數。命令樣本如下：

select deptno, count(*) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 6          |
| 20         | 5          |
| 30         | 6          |
+------------+------------+

樣本3：通過distinct去重，計算部門數量。命令樣本如下：

select count(distinct deptno) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 3          |
+------------+

COUNT_IF

命令格式。
```
bigint count_if(boolean <expr>)
```
命令說明。
計算expr值為True的記錄數。
參數說明。
expr：必填。BOOLEAN類型運算式。
傳回值說明。
返回BIGINT類型。expr值為False或expr中指定的列的值為NULL時，該行不參與計算。

樣本。

select count_if(sal > 1000), count_if(sal <=1000) from emp;

返回結果如下：

+------------+------------+
| _c0        | _c1        |
+------------+------------+
| 15         | 2          |
+------------+------------+

MAX

命令格式。
```
max(<colname>)
```
命令說明。
計算最大值。
參數說明。
colname：必填。列值可以為除BOOLEAN外的任意類型。
傳回值說明。
傳回值的類型與colname類型相同。返回規則如下：
- colname值為NULL時，該行不參與計算。
- colname為BOOLEAN類型時，不允許參與運算。

樣本。

樣本1：計算所有職工的最高薪資（sal）。命令樣本如下：

select max(sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 5000       |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，計算各部門員工的最高薪資（sal）。命令樣本如下：

select deptno, max(sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 5000       |
| 20         | 3000       |
| 30         | 2850       |
+------------+------------+

MAX_BY

命令格式。

max_by(<valueToReturn>,<valueToMaximize>)

命令說明。
說明
MAX_BY函數與ARG_MAX函數功能相同，只是參數順序不同，為了相容開源文法，新增MAX_BY函數以便您適配開源寫法。
返回valueToMaximize最大值對應行的valueToReturn。
參數說明。
- valueToMaximize：必填。可以為任意類型。
- valueToReturn：必填。可以為任意類型。
傳回值說明。
傳回值類型和valueToReturn類型相同，如果存在多行最大值時，隨機返回最大值其中的一行對應的值。valueToMaximize值為NULL時，該行不參與計算。

樣本。

樣本1：返回薪資最高的員工姓名。命令樣本如下：

select max_by(ename,sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| KING       |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，並返回各組中薪資最高職工的姓名。命令樣本如下：

select deptno, max_by(ename,sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | KING       |
| 20         | SCOTT      |
| 30         | BLAKE      |
+------------+------------+

MEDIAN

命令格式。

double median(double <colname>)
decimal median(decimal <colname>)

命令說明。
計算中位元。
參數說明。
colname：必填。列值可以為DOUBLE或DECIMAL類型。如果輸入為STRING或BIGINT類型，會隱式轉換為DOUBLE類型後參與運算。
傳回值說明。
如果colname值為NULL時，該行不參與計算。其他類型返回規則如下：
輸入類型
傳回型別
TINYINT
DOUBLE
SMALLINT
DOUBLE
INT
DOUBLE
BIGINT
DOUBLE
FLOAT
DOUBLE
DOUBLE
DOUBLE
DECIMAL
DECIMAL

樣本。

樣本1：計算所有職工的薪資（sal）中位元。命令樣本如下：

select median(sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 1600.0     |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，計算各部門員工的薪資（sal）中位元。命令樣本如下：

select deptno, median(sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 2450.0     |
| 20         | 2975.0     |
| 30         | 1375.0     |
+------------+------------+

MIN

命令格式。
```
min(<colname>)
```
命令說明。
計算最小值。
參數說明。
colname：必填。列值可以為除BOOLEAN外的任意類型。
傳回值說明。
傳回值的類型與colname類型相同。返回規則如下：
- colname值為NULL時，該行不參與計算。
- colname為BOOLEAN類型時，不允許參與運算。

樣本。

樣本1：計算所有職工的最低薪資（sal）。命令樣本如下：

select min(sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 800        |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，計算各部門員工的最低薪資（sal）。命令樣本如下：

select deptno, min(sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 1300       |
| 20         | 800        |
| 30         | 950        |
+------------+------------+

MIN_BY

命令格式。

min_by(<valueToReturn>,<valueToMinimize>)

命令說明。
說明
MIN_BY函數與ARG_MIN函數功能相同，只是參數順序不同，為了相容開源文法，新增MIN_BY函數以便您適配開源寫法。
返回valueToMinimize最小值對應行的valueToReturn。
參數說明。
- valueToMinimize：必填。可以為任意類型。
- valueToReturn：必填。可以為任意類型。
傳回值說明。
傳回值類型和valueToReturn類型相同，如果存在多行最小值時，隨機返回最小值其中的一行對應的值。valueToMinimize值為NULL時，該行不參與計算。

樣本。

樣本1：返回薪資最低的員工姓名。命令樣本如下：

 select min_by(ename,sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| SMITH      |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，並返回各組中薪資最低職工姓名。命令樣本如下：

select deptno, min_by(ename,sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | MILLER     |
| 20         | SMITH      |
| 30         | JAMES      |
+------------+------------+

STDDEV

命令格式。

double stddev(double <colname>)
decimal stddev(decimal <colname>)

命令說明。
計算總體標準差。
參數說明。
colname：必填。DOUBLE或DECIMAL類型。如果輸入為STRING或BIGINT類型，會隱式轉換為DOUBLE類型後參與運算。
傳回值說明。
如果colname值為NULL時，該行不參與計算。其他類型返回規則如下：
輸入類型
傳回型別
TINYINT
DOUBLE
SMALLINT
DOUBLE
INT
DOUBLE
BIGINT
DOUBLE
FLOAT
DOUBLE
DOUBLE
DOUBLE
DECIMAL
DECIMAL

樣本。

樣本1：計算所有職工的薪資（sal）的總體標準差。命令樣本如下：

select stddev(sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 1262.7549932628976 |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，計算各部門員工的薪資（sal）總體標準差。命令樣本如下：

select deptno, stddev(sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 1546.1421524412158 |
| 20         | 1004.7387720198718 |
| 30         | 610.1001739241043 |
+------------+------------+

STDDEV_SAMP

命令格式。

double stddev_samp(double <colname>)
decimal stddev_samp(decimal <colname>)

命令說明。
計算樣本標準差。
參數說明。
colname：必填。列值可以為DOUBLE或DECIMAL類型。如果輸入為STRING或BIGINT類型，會隱式轉換為DOUBLE類型後參與運算。
傳回值說明。
如果colname值為NULL時，該行不參與計算。其他類型返回規則如下：
輸入類型
傳回型別
TINYINT
DOUBLE
SMALLINT
DOUBLE
INT
DOUBLE
BIGINT
DOUBLE
FLOAT
DOUBLE
DOUBLE
DOUBLE
DECIMAL
DECIMAL

樣本。

樣本1：計算所有職工的薪資（sal）的樣本標準差。命令樣本如下：

select stddev_samp(sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 1301.6180541247609 |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，計算各部門員工的薪資（sal）樣本標準差。命令樣本如下：

select deptno, stddev_samp(sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 1693.7138680032901 |
| 20         | 1123.3320969330487 |
| 30         | 668.3312551921141 |
+------------+------------+

SUM

命令格式。

DECIMAL｜DOUBLE｜BIGINT  sum(<colname>)

命令說明。
計算匯總值。
參數說明。
colname：必填。列值支援所有資料類型，可以轉換為DOUBLE類型後參與運算。列值可以為DOUBLE、DECIMAL或BIGINT類型。如果輸入為STRING類型，會隱式轉換為DOUBLE類型後參與運算。
傳回值說明。
如果colname值為NULL時，該行不參與計算。其他類型返回規則如下：
輸入類型
傳回型別
TINYINT
BIGINT
SMALLINT
BIGINT
INT
BIGINT
BIGINT
BIGINT
FLOAT
DOUBLE
DOUBLE
DOUBLE
DECIMAL
DECIMAL

樣本。

樣本1：計算所有職工的薪資（sal）總和。命令樣本如下：

select sum(sal) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| 37775      |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，計算各部門員工的薪資（sal）總和。命令樣本如下：

select deptno, sum(sal) from emp group by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 17500      |
| 20         | 10875      |
| 30         | 9400       |
+------------+------------+

WM_CONCAT

命令格式。

string wm_concat(string <separator>, string <colname>)

命令說明。
用指定的separator做分隔字元，串連colname中的值。
參數說明。
- separator：必填。STRING類型常量，分隔字元。
- colname：必填。STRING類型。如果輸入為BIGINT、DOUBLE或DATETIME類型，會隱式轉換為STRING類型後參與運算。
傳回值說明（使用group by分組，組內傳回值不排序）。
返回STRING類型。返回規則如下：
- separator非STRING類型常量時，返回報錯。
- colname非STRING、BIGINT、DOUBLE或DATETIME類型時，返回報錯。
- colname值為NULL時，該行不會參與計算。
說明
select wm_concat(',', name) from table_name;語句中，如果table_name為空白集合，該語句返回NULL值。

樣本。

樣本1：對所有職工的姓名（ename）進行合并。命令樣本如下：

select wm_concat(',', ename) from emp;

返回結果如下：

+------------+
| _c0        |
+------------+
| SMITH,ALLEN,WARD,JONES,MARTIN,BLAKE,CLARK,SCOTT,KING,TURNER,ADAMS,JAMES,FORD,MILLER,JACCKA,WELAN,TEBAGE |
+------------+

樣本2：與group by配合使用，對所有職工按照部門（deptno）進行分組，並將同組的職工姓名（ename）進行合并。命令樣本如下：

select deptno, wm_concat(',', ename) from emp group by deptno order by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | CLARK,KING,MILLER,JACCKA,WELAN,TEBAGE |
| 20         | SMITH,JONES,SCOTT,ADAMS,FORD |
| 30         | ALLEN,WARD,MARTIN,BLAKE,TURNER,JAMES |
+------------+------------+

樣本3：與group by配合使用，對所有職工按照部門（deptno）進行分組，並將同組的薪資（sal）去重後進行合并。命令樣本如下：

select deptno, wm_concat(distinct ',', sal) from emp group by deptno order by deptno;

返回結果如下：

+------------+------------+
| deptno     | _c1        |
+------------+------------+
| 10         | 1300,2450,5000 |
| 20         | 1100,2975,3000,800 |
| 30         | 1250,1500,1600,2850,950 |
+------------+------------+

樣本4：與 group by、 order by配合使用，對所有職工按照部門（deptno）進行分組，並將同組的薪資（sal）進行合并排序。命令樣本如下：

select deptno, wm_concat(',',sal) within group(order by sal) from emp group by deptno order by deptno;

返回結果如下：

+------------+------------+
|deptno|_c1|
+------------+------------+
|10|1300,1300,2450,2450,5000,5000|
|20|800,1100,2975,3000,3000|
|30|950,1250,1250,1500,1600,2850|
+------------+------------+

輸入類型	傳回型別
TINYINT	DOUBLE
SMALLINT	DOUBLE
INT	DOUBLE
BIGINT	DOUBLE
FLOAT	DOUBLE
DOUBLE	DOUBLE
DECIMAL	DECIMAL