本文介紹數學統計函數的基礎文法及樣本。
Log Service支援如下數學統計函數。
在Log Service分析語句中,表示字串的字元必須使用單引號('')包裹,無符號包裹或被雙引號("")包裹的字元表示欄位名或列名。例如:'status'表示字串status,status或"status"表示日誌欄位status。
函數類型 | 函數名稱 | 文法 | 說明 | 支援SQL | 支援SPL |
相關函數 | corr(x, y) | 計算x和y的相關度。計算結果範圍為[0,1]。 | √ | × | |
方差和標準差函數 | covar_pop(x, y) | 計算x和y的總體共變數。 | √ | × | |
covar_samp(x, y) | 計算x和y的樣本共變數。 | √ | × | ||
stddev(x) | 計算x的樣本標準差。與stddev_samp函數同義。 | √ | × | ||
stddev_samp(x) | 計算x的樣本標準差。 | √ | × | ||
stddev_pop(x) | 計算x的總體標準差。 | √ | × | ||
variance(x) | 計算x的樣本方差。與var_samp函數同義。 | √ | × | ||
var_samp(x) | 計算x的樣本方差。 | √ | × | ||
var_pop(x) | 計算x的總體方差。 | √ | × | ||
線性迴歸函數 | regr_intercept(y, x) | 根據輸入焦點 | √ | × | |
regr_slope(y, x) | 根據輸入焦點 | √ | × | ||
累積分布函數 | beta_cdf(α, β, v) | 用於計算貝塔分布的累積分布函數P(N <= v; α, β),其中α和β是貝塔分布的參數。 | √ | × | |
binomial_cdf(x, y, v) | 用於計算二項分布的累積分布函數P(N <= v),其中x表示實驗的次數,y表示單次實驗成功的機率。 | √ | × | ||
cauchy_cdf(x, y, v) | 用於計算柯西分布的累積分布函數P(N <= v; x, y),其中x表示分布峰值位置的位置參數,y是尺度參數。 | √ | × | ||
chi_squared_cdf(k, v) | 用於計算卡方分布的累積分布函數P(N <= v; k),其中k是卡方分布服從的自由度。 | √ | × | ||
inverse_beta_cdf(α, β, p) | 計算貝塔分布的逆累積分布函數。即求v的值,使得累積分布函數P(N <= v; α, β)的結果為p。 | √ | × | ||
inverse_binomial_cdf(x, y, p) | 計算二項分布的逆累積分布函數。即求v的值,使得累積分布函數P(N <= v)的結果為p。 | √ | × | ||
inverse_cauchy_cdf(x, y, p) | 計算柯西分布的逆累積分布函數。即求v的值,使得累積分布函數P(N <= v; x, y)的結果為p。 | √ | × | ||
inverse_chi_squared_cdf(k, p) | 計算卡方分布的逆累積分布函數。即求v的值,使得累積分布函數P(N <= v; k)的結果為p。 | √ | × | ||
inverse_laplace_cdf(μ, b, p) | 計算拉普拉斯分布的逆累積分布函數。即求v的值,使得累積分布函數P(N <= v; μ, b)的結果為p。 | √ | × | ||
inverse_normal_cdf(x, y, p) | 計算常態分佈的逆累積分布函數。即求v的值,使得累積分布函數P(N < v; x, y)的結果為p。 | √ | × | ||
inverse_poisson_cdf(x, y, p) | 計算泊松分布的逆累積分布函數。即求v的值,使得累積分布函數P(N <= v; λ)的結果為p。 | √ | × | ||
inverse_weibull_cdf(x, y, p) | 計算韋布分布的逆累積分布函數。即求v的值,使得累積分布函數P(N <= v; x, y)的結果為p。 | √ | × | ||
laplace_cdf(μ, b, v) | 計算拉普拉斯分布的累積分布函數P(N <= v; μ, b),其中μ 是位置參數,b 是尺度參數。 | √ | × | ||
normal_cdf(x, y, v) | 計算常態分佈的累積分布函數P(N < v; x, y),其中x和y分別表示常態分佈的均值和標準差。 | √ | × | ||
poisson_cdf(λ, v) | 計算泊松分布的累積分布函數P(N <= v; λ),其中λ表示隨機事件發生的平均機率。 | √ | × | ||
weibull_cdf(x, y, v) | 計算韋布分布的累積分布函數P(N <= v; x, y),其中x表示比例參數,y是形狀參數。 | √ | × |
corr函數
corr函數用於計算x和y的相關度。返回的值越大表示兩列的相關性越高。
文法
corr(x, y)
參數說明
參數 | 說明 |
x | 參數值為double類型。 |
y | 參數值為double類型。 |
傳回值類型
double類型,取值範圍[0,1]。
樣本
計算request_length欄位值與request_time欄位值的相關度。
查詢和分析語句
* | SELECT corr(request_length,request_time)
查詢和分析結果
covar_pop函數
covar_pop函數用於計算x和y的總體共變數。
文法
covar_pop(x, y)
參數說明
參數 | 說明 |
x | 參數值為double類型。 |
y | 參數值為double類型。 |
傳回值類型
double類型。
樣本
計算每分鐘內稅前利潤和稅前營業額的總體共變數。
查詢和分析語句
*| SELECT covar_pop(PretaxGrossAmount, PretaxAmount) AS "總體共變數", time_series(__time__, '1m', '%H:%i:%s', '0') AS time GROUP BY time
查詢和分析結果
covar_samp函數
covar_samp函數用於計算x和y的樣本共變數。
文法
covar_samp(x, y)
參數說明
參數 | 說明 |
x | 參數值為double類型。 |
y | 參數值為double類型。 |
傳回值類型
double類型。
樣本
計算每分鐘內稅前利潤和稅前營業額的樣本共變數。
查詢和分析語句
*| SELECT covar_samp(PretaxGrossAmount, PretaxAmount) AS "樣本共變數", time_series(__time__, '1m', '%H:%i:%s', '0') AS time GROUP BY time
查詢和分析結果
stddev函數
stddev函數用於計算x的樣本標準差。與stddev_samp函數同義。
文法
stddev(x)
參數說明
參數 | 說明 |
x | 參數值為double類型或bigint類型。 |
傳回值類型
double類型。
樣本
查詢稅前收入的樣本標準差和總體標準差,並通過折線圖展示。
查詢和分析語句
* | SELECT stddev(PretaxGrossAmount) as "樣本標準差", stddev_pop(PretaxGrossAmount) as "總體標準差", time_series(__time__, '1m', '%H:%i:%s', '0') AS time GROUP BY time
查詢和分析結果
stddev_samp函數
stddev_samp函數用於計算x的樣本標準差。
文法
stddev_samp(x)
參數說明
參數 | 說明 |
x | 參數值為double類型或bigint類型。 |
傳回值類型
double類型。
樣本
查詢稅前收入的樣本標準差和總體標準差,並通過折線圖展示。
查詢和分析語句
* | SELECT stddev_samp(PretaxGrossAmount) as "樣本標準差", stddev_pop(PretaxGrossAmount) as "總體標準差", time_series(__time__, '1m', '%H:%i:%s', '0') AS time GROUP BY time
查詢和分析結果
stddev_pop函數
stddev_pop函數用於計算x的總體標準差。
文法
stddev_pop(x)
參數說明
參數 | 說明 |
x | 參數值為double類型或bigint類型。 |
傳回值類型
double類型。
樣本
查詢稅前收入的樣本標準差和總體標準差,並通過折線圖展示。
查詢和分析語句
* | SELECT stddev(PretaxGrossAmount) as "樣本標準差", stddev_pop(PretaxGrossAmount) as "總體標準差", time_series(__time__, '1m', '%H:%i:%s', '0') AS time GROUP BY time
查詢和分析結果
variance函數
variance函數用於計算x的樣本方差。與var_samp函數同義。
文法
variance(x)
參數說明
參數 | 說明 |
x | 參數值為double類型或bigint類型。 |
傳回值類型
double類型。
樣本
查詢稅前收入的樣本方差和總體方差,並通過折線圖展示。
查詢和分析語句
* | SELECT variance(PretaxGrossAmount) as "樣本方差", var_pop(PretaxGrossAmount) as "總體方差", time_series(__time__, '1m', '%H:%i:%s', '0') as time GROUP BY time
查詢和分析結果
var_samp函數
var_samp函數用於計算x的樣本方差。
文法
var_samp(x)
參數說明
參數 | 說明 |
x | 參數值為double類型或bigint類型。 |
傳回值類型
double類型。
樣本
查詢稅前收入的樣本方差和總體方差,並通過折線圖展示。
查詢和分析語句
* | SELECT var_samp(PretaxGrossAmount) as "樣本方差", var_pop(PretaxGrossAmount) as "總體方差", time_series(__time__, '1m', '%H:%i:%s', '0') as time GROUP BY time
查詢和分析結果
var_pop函數
var_pop函數用於計算x的總體方差。
文法
var_pop(x)
參數說明
參數 | 說明 |
x | 參數值為double類型或bigint類型。 |
傳回值類型
double類型。
樣本
查詢稅前收入的樣本方差和總體方差,並通過折線圖展示。
查詢和分析語句
* | SELECT variance(PretaxGrossAmount) as "樣本方差", var_pop(PretaxGrossAmount) as "總體方差", time_series(__time__, '1m', '%H:%i:%s', '0') as time GROUP BY time
查詢和分析結果
regr_intercept函數
regr_intercept函數會根據輸入焦點(x,y)
擬合成一個線性方程,然後計算該直線的Y軸截距。x是依賴值,y是獨立值。
文法
regr_intercept(y, x)
參數說明
參數 | 說明 |
y | 參數值為double類型。 |
x | 參數值為double類型。 |
傳回值類型
double類型。
樣本
計算由request_time欄位值和request_length欄位值組成的直線的Y軸截距。
查詢和分析語句
* | SELECT regr_intercept(request_length,request_time)
查詢和分析結果
regr_slope函數
regr_slope函數會根據輸入焦點(x,y)
擬合成一個線性方程,然後計算該直線的斜率。x是依賴值,y是獨立值。
文法
regr_slope(y, x)
參數說明
參數 | 說明 |
y | 參數值為double類型。 |
x | 參數值為double類型。 |
傳回值類型
double類型。
樣本
計算由request_time欄位值和request_length欄位值組成的直線的斜率。
查詢和分析語句
* | SELECT regr_slope(request_length,request_time)
查詢和分析結果
beta_cdf函數
beta_cdf函數是用於計算貝塔分布的累積分布函數。
文法
beta_cdf(α, β, v)
參數說明
參數 | 說明 |
α | 貝塔分布參數,double類型,取值大於0。 |
β | 貝塔分布參數,double類型,取值大於0。 |
v | 累積分布函數的輸入參數,double類型,取值範圍為[0, 1]。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | SELECT beta_cdf(0.1, 0.5, 0.7)
查詢和分析結果
binomial_cdf函數
binomial_cdf函數是用於計算二項分布的累積分布函數。
文法
binomial_cdf(x, y, v)
參數說明
參數 | 說明 |
x | 實驗的次數,integer類型,取值大於0。 |
y | 單次實驗成功的機率,double類型,取值範圍為[0, 1]。 |
v | 累積分布函數的輸入參數,integer類型。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select binomial_cdf(10, 0.1, 1)
查詢和分析結果
cauchy_cdf函數
cauchy_cdf函數是用於計算柯西分布的累積分布函數。
文法
cauchy_cdf(x, y, v)
參數說明
參數 | 說明 |
x | 分布峰值位置的位置參數,double類型。 |
y | 尺度參數,double類型,取值且大於0。 |
v | 累積分布函數的輸入參數,double類型。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select cauchy_cdf(-10, 5, -12)
查詢和分析結果
chi_squared_cdf函數
chi_squared_cdf函數是用於計算卡方分布的累積分布函數。
文法
chi_squared_cdf(k, v)
參數說明
參數 | 說明 |
k | 卡方分布服從的自由度,double類型,取值大於0。 |
v | 累積分布函數的輸入參數,double類型,取值大於等於0。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select chi_squared_cdf(3, 10)
查詢和分析結果
inverse_beta_cdf函數
inverse_beta_cdf函數是用於計算貝塔分布的逆累積分布函數。
文法
inverse_beta_cdf(α, β, p)
參數說明
參數 | 說明 |
α | 貝塔分布參數,double類型,取值大於0。 |
β | 貝塔分布參數,double類型,取值且大於0。 |
p | 逆累積分布函數的輸入參數,double類型,取值範圍為[0, 1]。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select inverse_beta_cdf(0.1, 0.5, 0.8926585878364057)
查詢和分析結果
inverse_binomial_cdf函數
inverse_binomial_cdf函數是用於計算二項分布的逆累積分布函數。
文法
inverse_binomial_cdf(x, y, p)
參數說明
參數 | 說明 |
x | 實驗的次數,integer類型,取值大於0。 |
y | 單次實驗成功的機率,double類型,取值且範圍為[0, 1]。 |
p | 逆累積分布函數的輸入參數,double類型,取值範圍為[0, 1]。 |
傳回值類型
integer類型
樣本
查詢和分析語句
* | select inverse_binomial_cdf(10, 0.1, 0.7360989291000001)
查詢和分析結果
inverse_cauchy_cdf函數
inverse_cauchy_cdf函數是用於計算柯西分布的逆累積分布函數。
文法
inverse_cauchy_cdf(x, y, p)
參數說明
參數 | 說明 |
x | 分布峰值位置的位置參數,double類型。 |
y | 尺度參數,double類型,取值大於0。 |
p | 逆累積分布函數的輸入參數,double類型,取值範圍為[0, 1]。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select inverse_cauchy_cdf(-10, 5, 0.3788810584091566)
查詢和分析結果
inverse_chi_squared_cdf函數
inverse_chi_squared_cdf函數是用於計算卡方分布的逆累積分布函數。
文法
chi_squared_cdf(k, p)
參數說明
參數 | 說明 |
k | 卡方分布服從的自由度,double類型,取值大於0。 |
p | 逆累積分布函數的輸入參數,double類型,取值範圍為[0, 1]。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select inverse_chi_squared_cdf(3, 0.9814338645369567)
查詢和分析結果
inverse_laplace_cdf函數
inverse_laplace_cdf函數是用於計算拉普拉斯分布的逆累積分布函數。
文法
inverse_laplace_cdf(μ, b, p)
參數說明
參數 | 說明 |
μ | 算拉普拉斯分布的位置參數,double類型。 |
b | 算拉普拉斯分布的尺度參數,double類型,取值大於0。 |
p | 逆累積分布函數的輸入參數,double類型,取值範圍為[0, 1]。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select inverse_laplace_cdf(11, 0.5, 0.18393972058572118)
查詢和分析結果
inverse_normal_cdf函數
inverse_normal_cdf函數是用於計算常態分佈的逆累積分布函數。
文法
inverse_normal_cdf(x, y, p)
參數說明
參數 | 說明 |
x | 常態分佈的均值,double類型。 |
y | 常態分佈的標準差,double類型,取值大於0。 |
p | 逆累積分布函數的輸入參數,double類型,取值範圍為(0, 1)。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select inverse_normal_cdf(85, 10, 0.06680720126885803)
查詢和分析結果
inverse_poisson_cdf函數
inverse_poisson_cdf函數是用於計算泊松分布的逆累積分布函數。
文法
inverse_poisson_cdf(λ, p)
參數說明
參數 | 說明 |
λ | 隨機事件發生的平均機率。 |
p | 逆累積分布函數的輸入參數,double類型,取值範圍為[0, 1]。 |
傳回值類型
integer類型
樣本
查詢和分析語句
* | select inverse_poisson_cdf(0.1, 0.9953211598395556)
查詢和分析結果
inverse_weibull_cdf函數
inverse_weibull_cdf函數是用於計算韋布分布的逆累積分布函數。
文法
inverse_weibull_cdf(x, y, p)
參數說明
參數 | 說明 |
x | 韋布分布的比例參數,double類型,取值且大於0。 |
y | 韋布分布的形狀參數,double類型,取值且大於0。 |
p | 逆累積分布函數的輸入參數,double類型,取值範圍為[0, 1]。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select inverse_weibull_cdf(1, 5, 0.3296799539643607)
查詢和分析結果
laplace_cdf函數
laplace_cdf函數是用於計算拉普拉斯分布的累積分布函數。
文法
laplace_cdf(μ, b, v)
參數說明
參數 | 說明 |
μ | 算拉普拉斯分布的位置參數,double類型。 |
b | 算拉普拉斯分布的尺度參數,double類型,取值大於0。 |
v | 累積分布函數的輸入參數,double類型。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select laplace_cdf(11, 0.5, 10.5)
查詢和分析結果
normal_cdf函數
normal_cdf函數是用於計算常態分佈的累積分布函數。
文法
normal_cdf(x, y, v)
參數說明
參數 | 說明 |
x | 常態分佈的均值,double類型。 |
y | 常態分佈的標準差,double類型,取值大於0。 |
v | 累積分布函數的輸入參數,double類型。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select normal_cdf(85, 10, 70)
查詢和分析結果
poisson_cdf函數
poisson_cdf函數是用於計算泊松分布的累積分布函數。
文法
poisson_cdf(λ, v)
參數說明
參數 | 說明 |
λ | 隨機事件發生的平均機率。 |
v | 累積分布函數的輸入參數,integer類型,取值大於等於0。 |
傳回值類型
double類型
樣本
查詢和分析語句
* | select poisson_cdf(0.1, 1)
查詢和分析結果
weibull_cdf函數
weibull_cdf函數是用於計算韋布分布的累積分布函數。
文法
weibull_cdf(x, y, v)
參數說明
參數 | 說明 |
x | 韋布分布的比例參數,double類型,取值大於0。 |
y | 韋布分布的形狀參數,double類型,取值大於0。 |
v | 累積分布函數的輸入參數,double類型。 |
傳回值類型
樣本
查詢和分析語句
* | select weibull_cdf(1, 5, 2)
查詢和分析結果