すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:サービスのモニタリングとアラートの有効化

最終更新日:Sep 29, 2024

サービスの監視およびアラート機能を使用して、サービスのステータスを監視できます。 アラートルールで指定されたしきい値を超えた場合、アラート通知が送信されます。

背景情報

次の表に、Elastic Algorithm Service (EAS) にデプロイされているサービスに対して収集できるメトリックを示します。

メトリック

説明

CPUConsumption

サービスによって消費されるCPUコアの数。

GPUUtilization

GPUの総容量に対するGPUの使用率。

GPUMemory

サービスによって消費されるGPUメモリの量。

思い出の消費

サービスによって消費されるメモリの量。 単位:MB。

QueryPerSecondTotal

1秒あたりの合計呼び出し数。

ResponsePerSecondWithStatusCode2xx

ステータスコード2xx /秒の応答数。

2xxResponseRatio

応答の総数に対するステータスコード2xxの応答の比率。

ResponsePerSecondWithStatusCode4xx

ステータスコード4xx /秒の応答数。

4xxResponseRatio

応答の総数に対するステータスコード4xxの応答の比率。

ResponsePerSecondWithStatusCode5xx

ステータスコード5xx /秒の応答数。

5xxResponseRatio

応答の総数に対するステータスコード5xxの応答の比率。

TP5ResponseTime

すべてのリクエストの上位5% の最大応答時間。

TP80ResponseTime

すべてのリクエストの上位80% の最大応答時間。

TP90ResponseTime

すべてのリクエストの上位90% の最大応答時間。

TP95ResponseTime

すべてのリクエストの上位95% の最大応答時間。

TP99ResponseTime

すべてのリクエストの上位99% の最大応答時間。

TP100ResponseTime

すべてのリクエストの最大応答時間。

IngressTraffic

受信データの量。 単位: KB/s。

EgressTraffic

送信データの量。 単位: KB/s。

ステップ1: アラート連絡先の設定

  1. アラート連絡先を作成します。

    1. CloudMonitorコンソールにログインします。

    2. 左側のナビゲーションウィンドウで、アラート > アラート連絡先を選択します。

    3. [アラート連絡先] タブで、[アラート連絡先の作成] をクリックします。

    4. [アラート連絡先の設定] パネルで、アラート連絡先の名前、メールアドレス、およびDingTalkチャットボットを指定します。

    5. アラート通知の言語パラメーターを設定します。 パネルの下部にあるスライダーをクリックしたままにして、スライダーを右にドラッグします。

      次の有効な値がサポートされています。

      • 自動: 通知は、アカウントが登録されているAlibaba Cloudサイトの言語で送信されます。 アカウントが中国サイト (aliyun.com) に登録されている場合、通知は中国語で送信されます。 アカウントが国際サイト (alibabacloud.com) または日本サイト (jp.alibabacloud.com) に登録されている場合、通知は英語で送信されます。

      • 中国語

      • 英語

    6. OKをクリックします。

  2. アラート連絡先グループの作成

    1. 左側のナビゲーションウィンドウで、アラート > アラート連絡先を選択します。

    2. アラート連絡先グループタブをクリックします。

    3. アラート連絡先グループタブで、アラート連絡先グループの作成をクリックします。

    4. アラート連絡先グループの作成パネルで、アラート連絡先グループの名前を入力し、アラート連絡先グループにアラート連絡先を追加します。

    5. 確認をクリックします。

手順2: アラートルールの設定

  1. CloudMonitorコンソールの左側のナビゲーションウィンドウで、クラウドサービスモニタリング > クラウドサービスモニタリングをクリックします。

  2. クラウドサービスモニタリングページで、検索ボックスでPAI-EAS推論サービスを入力してPAI-EAS推論サービスをクリックします。

  3. PAI-EAS推論サービスページで、サービスが存在するリージョンを選択し、アクション列のチャートの監視をクリックします。

    监控图表

  4. アラートルールの作成をクリックします。

  5. [アラートルールの作成] パネルで、次のパラメーターを設定し、[確認] をクリックします。 下表にパラメーターを示します。

    パラメーター

    説明

    プロダクト

    CloudMonitorによって管理されるサービスの名前。 このパラメーターをPAI-EAS推論サービスに設定します。

    リソース範囲

    アラートルールが有効になるリソースを選択します。 有効な値: すべてのリソース、アプリケーショングループ、およびインスタンス。

    • すべてのリソース: EASサービスのモニタリングデータがアラートルールをトリガーすると、アラート通知が送信されます。

    • インスタンス: 選択した1つ以上のサービスのモニタリングデータがアラートルールをトリガーする場合にのみ、アラート通知が送信されます。

    ルールの説明

    このパラメーターは、アラートルールの内容を指定します。 メトリック値が指定されたアラート条件を満たす場合、アラートがトリガーされます。 このパラメーターを設定するには、次の手順を実行します。

    1. [ルールの追加] をクリックします。

    2. [ルールの説明の追加] パネルで、ルール名、メトリックタイプ、メトリック、しきい値、アラートレベル、および通知方法を指定します。

    3. [OK] をクリックします。

    ミュート用

    アラートがクリアされない場合に別のアラート通知が送信される間隔。

    有効期間

    アラートルールが有効になる期間。 CloudMonitorは指定されたインスタンスをモニタリングし、指定された期間内にのみアラートを生成します。

    アラート連絡先グループ

    アラート通知の送信先の連絡先グループ。 アラート連絡先が関連付けられている連絡先グループを選択します。

    アラートコールバック

    インターネット経由でアクセスできるコールバックURL。 CloudMonitorは、HTTP POSTリクエストを送信して、アラート通知を指定されたコールバックURLにプッシュします。 HTTPプロトコルのみがサポートされています。

    Auto Scaling

    EASサービス用に設定されたアラートルールがトリガーされた場合、自動スケーリング機能は使用できません。 この機能を有効にする必要はありません。

    Log Service

    Log Serviceをオンにすると、アラートがトリガーされると、アラート情報がSimple Log Serviceの指定されたLogstoreに書き込まれます。 この場合、RegionProjectName、およびLogstoreパラメーターを設定する必要があります。

    プロジェクト名とLogstoreを作成する方法の詳細については、「はじめに」をご参照ください。

    メッセージサービス-トピック

    有効にすると、アラートがトリガーされたときにアラート情報がSimple Message Queue (旧MNS) の指定されたトピックに書き込まれます。 この場合、RegionパラメーターとtopicNameパラメーターを設定する必要があります。 トピックの作成方法の詳細については、「トピックの作成」をご参照ください。

    モニタリングデータが見つからない場合のアラートの処理方法

    モニタリングデータが見つからない場合にアラートを処理するために使用する方法。 有効な値:

    • 何もしない (デフォルト値)

    • アラート通知の送信

    • 通常通り