全部产品
Search
文档中心

日志服务:相关性分析函数

更新时间:Jun 06, 2024

针对系统中的多个观测指标,可以快速找出与某个指标项相关或者时序序列相关的指标名称。

函数列表

函数

说明

ts_association_analysis

针对系统中的多个观测指标,快速找出和某个指标项相关的指标名称。

ts_similar

针对系统中的多个观测指标,快速找出和用户输入的时序序列相关的指标名称。

ts_association_analysis

函数格式:

select ts_association_analysis(stamp, params, names, indexName, threshold)

参数说明如下:

参数

说明

取值

stamp

long 类型,表示UnixTime时间戳。

-

params

array(double)类型,表示待分析的指标维度。

例如:Latency,QPS,NetFlow等。

names

array(varchar )类型,表示待分析的指标名称。

例如:Latency,QPS,NetFlow等。

indexName

varchar 类型,表示分析目标指标的名称。

例如:Latency。

threshold

double 类型,表示其它分析指标与目标指标间的相关性阈值。

取值范围在:[0,1]。

结果输出:

  • name:指标的名称。

  • score:该指标与目标指标之间的相关性值,范围在[0,1]之间。

代码示例

* | select ts_association_analysis(
              time, 
              array[inflow, outflow, latency, status], 
              array['inflow', 'outflow', 'latency', 'status'], 
              'latency', 
              0.1) from log;

结果示例:

| results               |
| --------------------- |
| ['latency', '1.0']    |
| ['outflow', '0.6265'] |
| ['status', '0.2270']  |

ts_similar

函数格式一:

select ts_similar(stamp, value, ts, ds)
select ts_similar(stamp, value, ts, ds, metricType)

参数说明一:

参数

说明

取值

stamp

long 类型,表示UnixTime时间戳。

-

value

double 类型,表示某指标对应的值。

-

ts

array(double)类型,表示指定曲线的时间序列信息。

-

ds

array(double)类型,表示指定曲线的数值序列信息。

-

metricType

varchar 类型,表示度量曲线间相关性的类型。

类型如下:

SHAPERMSEPEARSONSPEARMANR2KENDALL

函数格式二:

select ts_similar(stamp, value, startStamp, endStamp, step, ds)
select ts_similar(stamp, value, startStamp, endStamp, step, ds, metricType )

参数说明二:

参数

说明

取值

stamp

long 类型,表示UnixTime时间戳。

-

value

double 类型,表示某指标对应的值。

-

startStamp

long 类型,表示指定曲线的开始时间戳。

-

endStamp

long 类型,表示指定曲线的结束时间戳。

-

step

long类型,表示时序中相邻两个点之间的时间间隔。

-

ds

array(double)类型,表示指定曲线的数值序列信息。

-

metricType

varchar 类型,表示度量曲线间相关性的类型。

类型如下:

SHAPERMSEPEARSONSPEARMANR2KENDALL

输出结果:

  • score:该指标与目标指标之间的相关性值,范围在[-1, 1]之间。

代码示例:

* | select vhost, metric, ts_similar(time, value, 1560911040, 1560911065, 5, array[5.1,4.0,3.3,5.6,4.0,7.2], 'PEARSON') from log  group by vhost, metric;

结果示例:

| vhost  | metric          | score                |
| ------ | --------------- | -------------------- |
| vhost1 | redolog         | -0.3519082537204182  |
| vhost1 | kv_qps          | -0.15922168009772697 |
| vhost1 | file_meta_write | NaN                  |