このトピックでは、アプリケーションリアルタイム監視サービス (ARMS) のアラート管理機能に関連する用語について説明します。
A
アラート
- アラートは、連絡担当者が解決する必要があるイベントです。アラートは、イベントが通知ポリシーで指定された条件を満たし、解決する必要がある場合にのみ生成されます。
アラート管理
- アラートを管理する機能。
アラートカード
- DingTalkグループのチャットボットは、アラートカードの形式でDingTalkグループにアラート通知を送信します。連絡担当者は、アラートカードを使用して、アラートの表示、処理、および解決を行うことができます。チャットボットは、ARMSコンソールのIMロボットタブで設定できます。
アラートの自動解決
- アラートが解決されると、システムはアラートのステータスを自動的に「解決済み」に変更します。
異常
- ビジネスルールによって、監視データが異常になる場合があります。異常な監視データが検出されると、システムはイベントを生成します。
R
エスカレーションルールの再トリガー
- エスカレーションポリシーのすべてのエスカレーションルールがトリガーされた後もアラートが未解決のままである場合、システムはエスカレーションルールを再トリガーします。デフォルトでは、エスカレーションルールは1回だけ再トリガーされます。エスカレーションルールを最大9回まで再トリガーするようにシステムを設定できます。
A
0で埋める、1で埋める、またはNullで埋める
- アラートルールを作成するときに、[アラートデータリビジョンポリシー] パラメーターを [0で埋める]、[1で埋める]、または [Nullで埋める] に設定できます。この機能を使用すると、データがない、複合メトリックが異常、前期間比が異常などのデータ異常を修正できます。
- 0で埋める:チェック値を0に修正します。
- 1で埋める:チェック値を1に修正します。
- Nullで埋める:アラートをトリガーしません。
シナリオ:- 異常1:データなし
ユーザーAは、アラート機能を使用してページビューを監視したいと考えています。ユーザーAがブラウザ監視でアラートルールを作成するときに、Nが5で、ページビューの合計が10以下の場合にアラートがトリガーされるように指定します。ページにアクセスしないと、データは報告されず、アラート通知は送信されません。この問題を解決するために、ユーザーAは [アラームデータリビジョンポリシー] パラメーターで [0で埋める] を選択できます。データが受信されない場合、システムはゼロのデータレコードが受信されたと判断します。これはアラートルールで指定された条件を満たしているため、アラート通知が送信されます。
- 異常2:異常な複合メトリック
ユーザーBは、アラート機能を使用して商品のリアルタイム単価を監視したいと考えています。ユーザーBがARMSでアラートルールを作成するときに、変数aのデータセットを現在の合計料金に設定し、変数bのデータセットを現在の合計アイテム数に設定します。ユーザーBは、Nが3で、現在の合計料金を現在の合計アイテム数で割った最小値が10以下の場合にアラートがトリガーされるように指定します。現在の合計アイテム数が0の場合、現在の合計価格を現在の合計アイテム数で割った複合メトリックの値は存在しません。アラート通知は送信されません。この問題を解決するために、ユーザーBは [アラームデータリビジョンポリシー] パラメーターで [0で埋める] を選択できます。このようにして、複合メトリックの値が存在しない場合、システムはその値を0と判断します。これはアラートルールで指定された条件を満たしているため、アラート通知が送信されます。
- 異常3:異常な前期間比
ユーザーCは、アラート機能を使用してノードのCPU使用率を監視したいと考えています。ユーザーCがアプリケーション監視でアラートルールを作成するときに、Nが3で、ノードの平均CPU使用率が前の監視期間と比較して100%減少した場合にアラートがトリガーされるように指定します。過去N分間にCPUに障害が発生した場合、システムは前期間比の結果を計算するために使用されるαを取得できません。この場合、比較結果は存在しません。アラート通知は送信されません。この問題を解決するために、ユーザーCは [アラームデータリビジョンポリシー] パラメーターで [1で埋める] を選択できます。αが取得されない場合、システムは前期間比の結果が100%の減少であると判断します。これはアラートルールで指定された条件を満たしているため、アラート通知が送信されます。
H
前期間との比較
- βが過去N分間のデータ(平均値、合計、最大値、または最小値)であり、αが過去2N分からN分の間に生成されたデータである場合、βとαを比較することで増加または減少したパーセンテージを取得できます。
J
統合
- APIを使用して、ほとんどの監視サービスをアラート管理機能と統合できます。
L
連絡担当者
- 連絡担当者とは、アラートを処理するO&Mエンジニアのことです。連絡担当者は、DingTalkでアラートを表示、処理、および解決できます。
R
アラートの要求
- 連絡担当者が未解決のアラートを処理する場合、アラートを要求できます。
S
アラートエスカレーションのタイムアウト
- アラートエスカレーションがタイムアウトすると、システムは、エスカレーションポリシーで指定された連絡担当者に、未解決または未確認のアラートの通知を送信します。アラートエスカレーションのデフォルトのタイムアウト期間は10分です。指定できる最大タイムアウト期間は90分です。
エスカレーションポリシー
- アラートエスカレーションがタイムアウトすると、システムは、エスカレーションポリシーで指定された異なるバッチの連絡担当者に、順番にアラート通知を送信します。エスカレーションポリシーを通知ポリシーに追加できます。
イベント
- 統合監視サービスは、アラート管理機能にイベントを送信します。イベントが無音化されていない限り、システムはイベントごとにアラートを生成します。
イベントのグループ化
- 通知の爆撃を防ぐために、複数のイベントを1つのアラートにグループ化できます。これは、通知のキーワードを要約するのにも役立ち、連絡担当者は状況をすばやく理解できます。
イベントの無音化
- 重要でないイベントを無音化できます。無音化されたイベントに対しては、アラートは生成されません。
重複イベントの削除
- 統合監視サービスがアラート管理機能にイベントを送信した後、重複イベントは削除されますが、重複の数は記録されます。
イベントの自動リカバリ
- イベントは、指定された期間が経過すると自動的にリカバリできます。この期間が経過すると、イベントは自動的に解決済みとしてカウントされます。デフォルトでは、イベントは5分後に自動的にリカバリされます。
T
前時間の同じ期間との比較
- βが過去N分間のデータ(平均値、合計、最大値、または最小値)であり、αが前時間の過去N分間に生成されたデータである場合、βとαを比較することで増加または減少したパーセンテージを取得できます。
前日の同じ期間との比較
- βが過去N分間のデータ(平均値、合計、最大値、または最小値)であり、αが前日の同じ時刻の過去N分間に生成されたデータである場合、βとαを比較することで増加または減少したパーセンテージを取得できます。
通知
- アラートがトリガーされると、システムはすぐにアラート連絡担当者にアラート通知を送信します。通知には、アラートをトリガーしたオブジェクトに関する情報とタイトルが含まれています。通知は、テキストメッセージ、メール、WeChatメッセージ、DingTalkグループのアラートカード、webhookメッセージの形式で送信できます。
通知ポリシー
- 通知ポリシーは、イベントを1つのアラートにグループ化し、アラート連絡担当者にアラート通知を送信する方法を決定します。電話、テキストメッセージ、メール、またはDingTalkグループのアラートカードの形式で通知を送信できます。通知は、対応する通知ポリシーがトリガーされてから1分後に連絡担当者に送信されます。
Y
ユーザー
- ユーザーとは、Alibaba CloudアカウントとRAMユーザーのことです。ユーザーは、ARMS コンソールで次の操作を実行できます。
- 通知ポリシーの作成と変更。
- エスカレーションポリシーの作成と変更。
- 統合の作成と変更。
- アラートの表示、処理、および解決。
- ユーザーとは、Alibaba CloudアカウントとRAMユーザーのことです。ユーザーは、ARMS コンソールで次の操作を実行できます。