全部產品
Search
文件中心

Simple Log Service:時序聚類函數

更新時間:Jun 30, 2024

時序聚類函數針對輸入的多條時序資料進行聚類,自動聚類出不同的曲線形態,進而快速找到相應的聚類中心和異於聚類中的其它形態曲線。

函數列表

函數

說明

ts_density_cluster

使用密度聚類方法對多條時序資料進行聚類。

ts_hierarchical_cluster

使用層次聚類方法對多條時序資料進行聚類。

ts_similar_instance

尋找到指定曲線名稱的相似曲線。

ts_density_cluster

函數格式如下所示:

select ts_density_cluster(x, y, z) 

參數說明如下所示:

參數

說明

取值

x

時間列,從小到大排列。

Unixtime時間戳記,單位為秒。

y

數值列,對應某時刻的資料。

z

某個時刻資料對應的曲線名稱。

字串類型,例如machine01.cpu_usr。

樣本:

  • 查詢分析語句如下所示:

    * and (h: "machine_01" OR h: "machine_02" OR h : "machine_03") | select ts_density_cluster(stamp, metric_value,metric_name ) from ( select '("__time__" - ("__time__" % 600))' as stamp, avg(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY metric_name, stamp ) 
  • 輸出結果如下所示:輸出結果

顯示項目如下所示:

顯示項目

說明

cluster_id

聚類的類別,其中-1表示未能劃分到某一聚類中心。

rate

該聚類中的instance佔比。

time_series

該聚類中心的時間戳記序列。

data_series

該聚類中心的資料序列。

instance_names

該聚類中心包含的instance的集合。

sim_instance

該類中的某一個instance名稱。

ts_hierarchical_cluster

函數格式如下所示:

select ts_hierarchical_cluster(x, y, z) 

參數說明如下所示:

參數

說明

取值

x

時間列,從小到大排列。

格式為Unixtime時間戳記,單位為秒。

y

數值列,對應某時刻的資料。

z

某個時刻資料對應的曲線名稱。

字串類型,例如machine01.cpu_usr。

樣本:

  • 查詢分析語句如下所示:

    * and (h: "machine_01" OR h: "machine_02" OR h : "machine_03") | select ts_hierarchical_cluster(stamp, metric_value, metric_name) from ( select '("__time__" - ("__time__" % 600))' as stamp, avg(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY metric_name, stamp )
  • 輸出結果如下所示:輸出結果

顯示項目如下所示:

顯示項目

說明

cluster_id

聚類的類別,其中-1表示未能劃分到某一聚類中心。

rate

該聚類中的instance佔比。

time_series

該聚類中心的時間戳記序列。

data_series

該聚類中心的資料序列。

instance_names

該聚類中心包含的instance的集合。

sim_instance

該類中的某一個instance名稱。

ts_similar_instance

函數格式如下所示:

select ts_similar_instance(x, y, z,instance_name,topK,metricType) 

參數說明如下所示:

參數

說明

取值

x

時間列,從小到大排列。

格式為Unixtime時間戳記,單位為秒。

y

數值列,對應某時刻的資料。

z

某個時刻資料對應的曲線名稱。

字串類型,例如machine01.cpu_usr。

instance_name

指定某個待尋找的曲線名稱。

集合中某個曲線名稱,字串類型,例如machine01.cpu_usr。

說明

必須是已建立的曲線。

topK

最多返回K個與給定曲線相似的曲線。

metricType

{'shape', 'manhattan', 'euclidean'},衡量時序曲線之間的相似性指標。

查詢分析語句如下所示:

* and m: NET and m: Tcp and (h: "nu4e01524.nu8" OR  h: "nu2i10267.nu8" OR  h : "nu4q10466.nu8") | select ts_similar_instance(stamp, metric_value, metric_name, 'nu4e01524.nu8' ) from ( select '("__time__" - ("__time__" % 600))' as stamp, sum(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY  metric_name, stamp )

顯示項目如下所示:

顯示項目

說明

instance_name

與指定指標相近的結果清單。

time_series

該曲線的時間戳記序列。

data_series

該曲線的資料序列。