すべてのプロダクト
Search
ドキュメントセンター

Simple Log Service:時系列クラスタリング関数

最終更新日:Aug 26, 2024

このトピックでは、複数の時系列データをクラスタリングして異なる曲線形状を取得するために使用できる時系列クラスタリング関数について説明します。 次に、対応するクラスター中心と、クラスター内のカーブ形状とは異なる形状のカーブをすばやく見つけることができます。

機能一覧

関数

説明

ts_density_cluster

密度ベースのクラスタリング手法を使用して、複数の時系列データをクラスタリングします。

ts_hierarchical_cluster

階層クラスタリング手法を使用して、複数の時系列データをクラスタリングします。

ts_similar_インスタンス

指定したカーブに似たカーブを照会します。

ts_density_cluster

関数の形式:

select ts_density_cluster(x, y, z) 

次の表に、関数のパラメーターを示します。

パラメーター

説明

x

タイムシーケンス。 水平軸に沿った時点は、昇順でソートされる。

各時点はUnixタイムスタンプです。 単位は秒です。

y

指定された時点に対応する数値データのシーケンス。

非該当

z

指定された時点のデータに対応するカーブの名前。

値は文字列型です。 例: machine01.cpu_usr.

例:

  • クエリステートメントは次のとおりです。

    * and (h: "machine_01" OR h: "machine_02" OR h : "machine_03") | select ts_density_cluster(stamp, metric_value,metric_name ) from ( select '("__time__" - ("__time__" % 600))' as stamp, avg(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY metric_name, stamp ) 
  • 出力結果 Output result

表示项目一覧を次の表に示します。

表示アイテム

説明

cluster_id

クラスターのカテゴリ。 -1の値は、クラスターがどのクラスターセンターにも分類されていないことを示します。

rate

クラスター内のインスタンスの割合。

time_series

クラスターセンターのタイムスタンプシーケンス。

data_series

クラスターセンターのデータシーケンス。

instance_names

クラスターセンターに含まれるインスタンスのコレクション。

sim_instance

クラスター内のインスタンスの名前。

ts_hierarchical_cluster

関数の形式:

select ts_hierarchical_cluster(x, y, z) 

次の表に、関数のパラメーターを示します。

パラメーター

説明

x

タイムシーケンス。 水平軸に沿った時点は、昇順でソートされる。

各時点はUnixタイムスタンプです。 単位は秒です。

y

指定された時点に対応する数値データのシーケンス。

非該当

z

指定された時点のデータに対応するカーブの名前。

値は文字列型です。 例: machine01.cpu_usr.

例:

  • クエリステートメントは次のとおりです。

    * and (h: "machine_01" OR h: "machine_02" OR h : "machine_03") | select ts_hierarchical_cluster(stamp, metric_value, metric_name) from ( select '("__time__" - ("__time__" % 600))' as stamp, avg(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY metric_name, stamp )
  • 出力結果 Output result

表示项目一覧を次の表に示します。

表示アイテム

説明

cluster_id

クラスターのカテゴリ。 -1の値は、クラスターがどのクラスターセンターにも分類されていないことを示します。

rate

クラスター内のインスタンスの割合。

time_series

クラスターセンターのタイムスタンプシーケンス。

data_series

クラスターセンターのデータシーケンス。

instance_names

クラスターセンターに含まれるインスタンスのコレクション。

sim_instance

クラスター内のインスタンスの名前。

ts_similar_instance

関数の形式:

select ts_similar_instance(x, y, z, instance_name, topK, metricType) 

次の表に、関数のパラメーターを示します。

パラメーター

説明

x

タイムシーケンス。 水平軸に沿った時点は、昇順でソートされる。

各時点はUnixタイムスタンプです。 単位は秒です。

y

指定された時点に対応する数値データのシーケンス。

非該当

z

指定された時点のデータに対応するカーブの名前。

値は文字列型です。 例: machine01.cpu_usr.

instance_name

zコレクションで照会される指定されたカーブの名前。

値は文字列型です。 例: machine01.cpu_usr.

説明

照会するカーブは既存のものでなければなりません。

topK

指定されたカーブに似たカーブ。 最大K個のカーブが返されます。

非該当

metricType

{'shape', 'manhattan', 'euclidean'} を実行します。 時系列曲線間の類似性を測定するために使用されるメトリック。

非該当

クエリステートメントは次のとおりです。

* and m: NET and m: Tcp and (h: "nu4e01524.nu8" OR  h: "nu2i10267.nu8" OR  h : "nu4q10466.nu8") | select ts_similar_instance(stamp, metric_value, metric_name, 'nu4e01524.nu8' ) from ( select '("__time__" - ("__time__" % 600))' as stamp, sum(v) as metric_value, h as metric_name from log GROUP BY stamp, metric_name order BY  metric_name, stamp )

表示项目一覧を次の表に示します。

表示アイテム

説明

instance_name

指定されたメトリックに似ているメトリックのリスト。

time_series

クラスターセンターのタイムスタンプシーケンス。

data_series

クラスターセンターのデータシーケンス。