すべてのプロダクト
Search
ドキュメントセンター

Managed Service for Prometheus:マネージドサービスfor Prometheusを使用してECSインスタンスを監視する

最終更新日:Dec 27, 2024

このトピックでは、Alibaba Cloudマネージドサービスfor Prometheusを使用して、仮想プライベートクラウド(VPC)にデプロイされたElastic Compute Service(ECS)インスタンスに関するメトリックを監視し、メトリックを破棄し、アラートを設定する方法について説明します。ECSインスタンスを監視するには、ホストモニターというコンポーネントを有効にする必要があります。

ワークフロー

ECSインスタンスの監視には、次の手順が必要です。

  1. ホストモニターを有効にする:ホストモニターコンポーネントを有効にし、VPCを選択します。その後、オープンソースエクスポーターが自動的にインストールされます。このようにして、マネージドPrometheusエージェントが自動的にデータを収集します。

  2. (オプション)ホストモニターを変更する:エラーを修正したり、新しいビジネス要件を満たすために、サービスポートなど、ホストモニターコンポーネントの構成を変更します。

  3. (オプション)メトリックを破棄する:メトリック収集を絞り込み、コストを節約するために、不要なメトリックを破棄します。

  4. (オプション)アラートを設定する:変更を検出し、問題をタイムリーにトラブルシューティングするために、特定のメトリックのアラートを設定します。

image

前提条件

  • VPCが作成されている。VPCに1つ以上のECSインスタンスが作成されている。詳細については、コンソールでECSインスタンスを作成および管理する(エクスプレスバージョン)を参照してください。

  • Alibaba Cloudリソースセンターが有効化されました。詳細については、リソースセンターを有効化するをご参照ください。

    説明

    ECSインスタンスを監視する前に、リソースセンターを有効化する必要があります。これは、Managed Service for Prometheusのサービス検出機能が、リソースセンターによって提供される現在のアカウントのVPCデータとECSデータに依存しているためです。

1. ホストモニターを有効にする

ホストモニターを有効にし、VPCを選択すると、Node ExporterとProcess ExporterがVPC内のECSインスタンスにデフォルトでインストールされます。その後、マネージドPrometheusエージェントが自動的にデータを収集します。データを保存して視覚化し、データのアラートを統一的に設定できます。 各ECSインスタンスについて、一度に約1,000個のメトリックエントリが収集されます

1.1 コンポーネントを有効にする

  1. ARMSコンソールの左側のナビゲーションペインで、統合センターをクリックします。インフラストラクチャセクションで、ホストモニターをクリックします。image

  2. 表示されるパネルで、VPCを選択し、必要に応じてパラメーターを設定します。詳細については、ECSインスタンスを監視するを参照してください。image

  3. OKをクリックします。1〜2分待ちます。

1.2 ダッシュボードを表示する

  1. ARMSコンソールの左側のナビゲーションペインで、統合管理をクリックします。統合環境タブで、ECSインスタンスをクリックします。VPC IDをクリックして、環境詳細ページに移動します。image

  2. [コンポーネント管理] コンポーネント管理 タブで、ダッシュボードアドオンの種類 セクションでクリックして、組み込みの Grafana ダッシュボードを表示します。imageimage

    説明

    ダッシュボードにデータがない場合は、セキュリティグループの設定を確認してください。詳細については、ダッシュボードにデータがないのはなぜですか? を参照してください。

2. (オプション)ホストモニターを変更する

サービス検出、サービスポート、データ収集間隔など、ホストモニターの構成を変更できます。

2.1 手順

  1. ARMSコンソールの左側のナビゲーションペインで、統合管理をクリックします。統合環境タブで、ECSインスタンスをクリックします。VPC IDをクリックして、環境詳細ページに移動します。image

  2. 変更するエクスポーターを見つけて、設定をクリックします。image

  3. 必要に応じて構成を変更し、OKをクリックします。詳細については、ECSインスタンスを監視するを参照してください。

2.2 確認

  1. ページを更新し、設定をもう一度クリックして、変更が有効になっているかどうかを確認します。

  2. ダッシュボードを表示し、データが期待どおりかどうかを確認します。詳細については、1.2 ダッシュボードを表示するセクションを参照してください。

3. (オプション)メトリックを破棄する

データ分析と管理を簡素化するために、不要なメトリックを破棄できます。

3.1 手順

  1. ARMSコンソールの左側のナビゲーションペインで、統合管理をクリックします。統合環境タブで、ECSインスタンスをクリックします。VPC IDをクリックして、環境詳細ページに移動します。image

  2. メトリックの破棄メトリックスクレイピングタブの更新メトリックimageセクションで、破棄するメトリックを選択し、をクリックします。メトリックの詳細については、を参照してください。

    説明

    ACKクラスターに関する基本メトリクスを破棄することはできません。

3.2 確認

  1. 更新をクリックし、ページを更新して、変更が有効になっているかどうかを確認します。

  2. ダッシュボードを表示し、データが期待どおりかどうかを確認します。詳細については、1.2 ダッシュボードを表示するセクションを参照してください。

4. (オプション)アラートを設定する

特定のメトリックを監視するためにアラートルールを設定できます。メトリックの変更によってアラートがトリガーされると、タイムリーに通知されます。これにより、ルーチンのメンテナンスとトラブルシューティングが容易になります。

マネージドサービスfor Prometheusは、組み込みのアラートルールとカスタムアラートルールを提供します。組み込みのアラートルールまたは既存のカスタムアラートルールを設定したり、ビジネス要件に基づいてカスタムアラートルールを追加したりできます。

4.1 組み込みのアラートルールを設定する

デフォルトでは、組み込みのアラートルールはアラートイベントを生成します。アラート通知を手動で設定できます。

  1. ARMSコンソールの左側のナビゲーションペインで、統合管理をクリックします。統合環境タブで、ECSインスタンスをクリックします。VPC IDをクリックして、環境詳細ページに移動します。image

  2. コンポーネント管理タブのアドオンタイプセクションで、アラートルールをクリックします。アラートイベントを表示または編集をクリックして、アラートルールを表示または変更します。image

  3. 必要に応じてアラートルールを変更し、OKをクリックします。詳細については、Prometheusアラートルールを参照してください。

4.2 カスタムアラートルールを設定する

組み込みのアラートルールがビジネス要件を満たせない場合は、ECSインスタンスのカスタムアラートルールを設定できます。

  1. ARMSコンソールの左側のナビゲーションペインで、統合管理をクリックします。統合環境タブで、ECSインスタンスをクリックします。VPC IDをクリックして、環境詳細ページに移動します。image

  2. コンポーネント管理タブで、基本情報セクションのデフォルトメトリックストレージの横にあるVPCをクリックします。image

  3. アラートルールページで、カスタムアラートルールを作成、変更、または表示できます。詳細については、Prometheusアラートルールを参照してください。image

4.3 確認

  1. ページを更新して、変更が有効になっているかどうかを確認します。

  2. 簡単にトリガーできてリスクのないアラートルールを構成し、アラートルールをトリガーして、期待どおりに動作するかどうかを確認します。

    説明

    アラート通知の送信方法は、アラートルールによって異なります。

FAQ

ダッシュボードにデータがないのはなぜですか?

ダッシュボードにデータがない場合、ECSインスタンスのセキュリティグループが要件どおりにアクセスを許可していない可能性があります。要件:

各ECSインスタンスのセキュリティグループは、100.64.0.0/10および192.168.0.0/18 CIDRブロックからのNode ExporterとProcess Exporterのポートへのアクセスを許可します。Node Exporterのデフォルトポートは9100、Process Exporterのデフォルトポートは9256です。ポートを変更した場合は、変更したポートを使用してください。ECSインスタンスのセキュリティグループルールの表示方法については、セキュリティグループを検索するを参照してください。

Node ExporterがECSインスタンスに自動的にインストールされなかったのはなぜですか?

次の操作を実行します:

  1. ECSインスタンスが予期どおりに実行されているかどうかを確認します。

  2. オープンソースのNode ExporterがECSインスタンスにインストールされていて、ポート9100を使用しているかどうかを確認します。その場合は、コンポーネント管理タブでAlibaba Cloudが提供するNode Exporterを見つけて、設定をクリックしてポートを変更します。

Node Exporterがインストールされているかどうかを確認するにはどうすればよいですか?

http://<ECS-IP>:<PORT>/metricsにアクセスして、メトリックデータが予期どおりに生成されているかどうかを確認します。メトリックデータが利用可能な場合は、Node Exporterがインストールされています。

セキュリティグルールのルールを手動で設定するにはどうすればよいですか?

ECSコンソールにログオンします。 各ECSインスタンスのセキュリティグループ設定で受信ルールを手動で追加して、VPCのCIDRブロックからNode ExporterとProcess Exporterのポートへのアクセスを許可します。Node Exporterのデフォルトポートは9100、Process Exporterのデフォルトポートは9256です。ポートを変更した場合は、変更したポートを使用してください。

ECSインスタンスをマネージドサービスfor Prometheusに統合するときにネットワーク接続の問題が発生した場合はどうすればよいですか?

各ECSインスタンスとPrometheusエージェントがVPCを介して相互にアクセスできることを確認してください。まず、VPCのルートテーブル設定を確認し、トラフィックの方向が正しいことを確認します。次に、ファイアウォールまたはセキュリティグループのルールでトラフィックが許可されているかどうかを確認します。

メトリックデータが不正確または欠落しているのはなぜですか?

Node ExporterとProcess Exporterが有効になっている場合は、それらが予期どおりに実行されているかどうかを確認します。これを行うには、cURLなどのコマンドラインツールを使用して、エクスポーターによって公開されているメトリックをクエリし、データが予期どおりに戻されているかどうかを確認します。エクスポーターで例外が発生した場合は、ログを確認します。

プロセスステータスデータの収集を有効にするにはどうすればよいですか?

プロセスステータスデータはProcess Exporterによって収集されます。デフォルトでは、Process Exporterはポート9256を使用します。各ECSインスタンスのセキュリティグループでポート9256が許可されていることを確認してください。プロセスステータスデータの収集にはわずかなシステムリソースが消費されますが、一般的にはシステムパフォーマンスに影響を与えません。ただし、システムリソースが不足している場合は、注意して進めてください。