全部產品
Search
文件中心

MaxCompute:CORR

更新時間:Jun 19, 2024

計算兩列資料的皮爾遜係數(Pearson Correlation Coefficien)。此函數為MaxCompute 2.0擴充函數。

命令格式

double corr(<col1>, <col2>)

參數說明

col1col2:必填。待計算皮爾遜係數的表的兩個列名稱。DOUBLE、BIGINT、INT、SMALLINT、TINYINT、FLOAT、DECIMAL類型。col1col2的資料類型可以不相同。

傳回值說明

返回DOUBLE類型。如果某一輸入列的某一行存在NULL值,該行不參與計算。

樣本資料

為便於理解各函數的使用方法,本文為您提供來源資料,基於來源資料提供函數相關樣本。建立表mf_math_fun_t,並添加資料,命令樣本如下。

create table if not exists mf_math_fun_t(
     int_data     int,
     bigint_data  bigint,
     double_data  double,
     decimal_data decimal,
     float_data   float,
     string_data  string
    );
insert into mf_math_fun_t values
(null, -10, 0.525, 0.525BD, cast(0.525 as float), '10'),
(-20, null, -0.1, -0.1BD, cast(-0.1 as float), '-10'),
(0, -1, null, 20.45BD, cast(-1 as float), '30'),
(-40, 4, 0.89, null, cast(0.89 as float), '-30'),
(5, -50, -1, -1BD, null, '50'),
(-60, 6, 1.5, 1.5BD, cast(1.5 as float), '-50'),
(-1, -70, -7.5, -7.5BD, cast(-7.5 as float),null ),
(-80, 1, -10.2, -10.2BD, cast(-10.2 as float), '-1' ),
(9, -90, 2.58, 2.58BD, cast(2.58 as float), '0'),
(-100, 10, -5.8, -5.8BD, cast(-5.8 as float), '-90');

查詢表mf_math_fun_t中的資料,命令樣本如下:

select * from mf_math_fun_t;
--返回結果。
+------------+-------------+-------------+--------------+------------+-------------+
| int_data   | bigint_data | double_data | decimal_data | float_data | string_data |
+------------+-------------+-------------+--------------+------------+-------------+
| NULL       | -10         | 0.525       | 0.525        | 0.525      | 10          |
| -20        | NULL        | -0.1        | -0.1         | -0.1       | -10         |
| 0          | -1          | NULL        | 20.45        | -1.0       | 30          |
| -40        | 4           | 0.89        | NULL         | 0.89       | -30         |
| 5          | -50         | -1.0        | -1           | NULL       | 50          |
| -60        | 6           | 1.5         | 1.5          | 1.5        | -50         |
| -1         | -70         | -7.5        | -7.5         | -7.5       | NULL        |
| -80        | 1           | -10.2       | -10.2        | -10.2      | -1          |
| 9          | -90         | 2.58        | 2.58         | 2.58       | 0           |
| -100       | 10          | -5.8        | -5.8         | -5.8       | -90         |
+------------+-------------+-------------+--------------+------------+-------------+

使用樣本

基於樣本資料,計算double_data和float_data兩列的皮爾遜係數,命令樣本如下。

select corr(double_data,float_data) from mf_math_fun_t;

樣本返回結果為1.0。

相關函數

CORR函數屬於數學函數,更多資料計算、資料轉換的相關函數請參見數學函數