Managed Service for Prometheusは、インテリジェントディテクターを使用して、KPI時系列データの異常な変動を識別します。これは、アラートが発生した場合に、自動データ損失保護と根本原因分析において情報に基づいた意思決定を行うのに役立ちます。このトピックでは、インテリジェントディテクターを使用して、Grafanaダッシュボード上のPrometheusインスタンスの異常なデータ変動を識別する方法について説明します。
Prometheusインスタンスの異常なデータ変動を検出する
Managed Service for Prometheusコンソールにログインします。
左側のナビゲーションペインで、インスタンスをクリックします。
Prometheusインスタンスを見つけ、Grafanaワークスペース列のリンクをクリックします。
左側のナビゲーションペインで、アイコンをクリックします。ページの左上隅にあるExploreの右側のドロップダウンリストからデータソースを選択します。
Metricsドロップダウンリストからメトリックを選択して、メトリックの時系列データを表示します。たとえば、データの異常を表示する次のメトリックを選択できます。
arms_cms_collector_duration_seconds
Metricsドロップダウンリストの右側のテキストボックスに、次のPromQLステートメントを入力します。このステートメントは、サンプルの異常検出器として使用されます。このようにして、特定の期間にわたるメトリックに関する異常なデータ変動を識別できます。
anomal_detect (arms_cms_collector_duration_seconds[180m],3)
説明arms_cms_collector_duration_seconds:前の手順で使用したメトリックの名前。ビジネスシナリオに基づいて置き換えることができます。
PromQLステートメントがクエリするメトリックのデータ型は、範囲ベクトルである必要があります。したがって、メトリック名の右側に時間セレクターを追加する必要があります。時間セレクターのデフォルト値は[180m]です。パラメーターのデフォルト値は3です。事前に他の集計関数を実行する場合は、PromQLステートメントの時間セレクターを[180m:]に変更する必要があります。このようにして、メトリックのデータ型を範囲ベクトルに変更できます。たとえば、PromQLステートメントをanonym_detect (sum(node_memory_free_bytes)[180m:],3)に変更できます。