すべてのプロダクト
Search
ドキュメントセンター

Managed Service for Prometheus:ECS インスタンスのモニタリング

最終更新日:Sep 26, 2025

Alibaba Cloud Managed Service for Prometheus を使用すると、Node Exporter を使用して Linux または Windows を実行する Elastic Compute Service (ECS) インスタンスからメトリックを収集し、Process Exporter を使用してプロセスのモニタリングデータを収集できます。テキストファイルで構成されたカスタムメトリックを収集することもできます。

前提条件

メリット

Managed Service for Prometheus は、ECS インスタンス向けの効率的で管理しやすいモニタリングソリューションを提供します。このソリューションは、現代のクラウドコンピューティング環境における可観測性と自動管理のニーズを満たします。

Managed Service for Prometheus が提供するホストモニタリングソリューションを使用すると、ECS インスタンス、自己管理データセンター内のサーバー、およびサードパーティのクラウド サービス プロバイダー (CSP) のサーバーを Managed Service for Prometheus に統合してモニタリングできます。ホストモニタリング機能は、さまざまな種類のオープンソースエクスポーターを自動的にインストールし、ECS インスタンスの収集構成を発行できます。マネージド Prometheus エージェントは、自動データ収集に使用できます。収集されたデータは一元的に保存および表示され、アラートルールも一元的に管理されます。自動サービスディスカバリーメカニズムは、サードパーティホストには適用されません。サードパーティホストを使用する場合、サードパーティホストを Managed Service for Prometheus に統合する際に、Alibaba Cloud データ収集エージェントを手動でインストールする必要があります。これにより、モニタリングデータを Managed Service for Prometheus に送信して保存できます。

メリット

説明

数秒でのホスト検出

  • 適応性: 自動サービスディスカバリーメカニズムにより、モニタリングシステムはクラウドリソースの変更に迅速に適応できます。これにより、実行中のすべてのインスタンスがタイムリーにモニタリングされることが保証されます。

  • 多様性: さまざまなシナリオのモニタリングニーズを満たすために、複数のサービスディスカバリーメソッドがサポートされています。たとえば、Kubernetes クラスター内のサービスの自動検出や、他の種類のクラウドサービスの統合がサポートされています。

数秒でのエクスポーターインストール

  • すぐに使用可能: エクスポーターは自動的にインストールできます。これにより、モニタリングシステムは新しく開始された計算ノードを即座に識別し、手動操作なしで計算ノードのメトリックを収集できます。

  • 包括的なモニタリング: Node Exporter、Process Exporter、GPU Exporter、ミドルウェア用のエクスポーターなど、複数のエクスポーターが提供され、包括的なパフォーマンストラッキングが可能です。

数秒でのメトリック収集

  • 簡素化された構成: 自動構成生成機能により、O&M エンジニアは手動構成から解放され、すべてのノードとサービスのメトリックが正確に収集されることが保証されます。

  • 柔軟性: 複雑で変化するモニタリング環境に対応するために、モニタリング要件に基づいて構成を変更できます。

ECS インスタンスを作成した後、30〜60 秒以内にモニタリングシステムに含めることができます。ECS インスタンスのすべてのメトリックがモニタリングされる間隔は、1〜60 秒の間で柔軟に調整できます。これにより、数秒以内に ECS インスタンスの全面的なモニタリングが実現します。

サーバーレスエージェント

  • 一元管理: マネージド Prometheus エージェントを使用して、データ収集を一元的に管理します。これにより、モニタリングアーキテクチャが簡素化され、O&M 効率が向上します。データ収集中にビジネスに影響はありません。

  • パフォーマンス専有型: Prometheus エージェントを使用すると、複雑なモニタリングアルゴリズムを構成する必要がなくなります。これにより、無効な構成の可能性が減り、データモニタリングの精度と適時性が向上します。

スマートメトリックタグ

  • ECS インスタンスのタグ、リソースグループ、リージョンは自動的に抽出され、メトリックシステム全体に注入されます。

  • ビジネス タグ、環境タグ、データソース タグなどのカスタム タグを ECS インスタンスに追加できます。これにより、タグ管理の柔軟性が向上します。

超大規模なデータ収集とストレージ

  • 専有型および共有型の ECS インスタンスを含む、複数の ECS インスタンスを一度に統合できます。ホストされるリソースは、統合する ECS インスタンスの数に基づいて動的に調整できます。これにより、統合の適時性と正確性が保証されます。

  • 超大規模なメトリックストレージとパフォーマンス専有型のクエリおよび表示がサポートされています

アップストリームおよびダウンストリームアプリケーションからの包括的なモニタリングデータ

  • 体系的で包括的な可観測性には、さまざまなディメンションからのモニタリングデータの統合と、エンドツーエンドのモニタリングの実装が必要です。これにより、モニタリングシステムはアプリケーションおよびサービスエコシステム全体の健全性ステータスとパフォーマンスを反映できます。

  • Managed Service for Prometheus が提供するモニタリングソリューションには、基盤となるハードウェア、アプリケーション、およびリモート直接メモリアクセス (RDMA) ネットワーク、Object Storage Service (OSS) バケット、Redis などの外部サービスをカバーするモニタリングポリシーが含まれています。このモニタリングソリューションは、ホスト、ネットワーク、および依存関係に適用されます。

プロセスレベルのモニタリング

  • プロセスレベルのモニタリングにより、オペレーティングシステム上で実行中のプロセスを追跡および分析できます。これにより、プロセスのパフォーマンスとリソース使用率を理解するのに役立ちます。プロセスレベルのモニタリングは、システムレベルのモニタリングを実装する上で重要な役割を果たし、サーバー上で実行されるアプリケーションの健全性ステータスとパフォーマンスを可視化するように設計されています。

  • プロセスレベルのモニタリング中、プロセスの CPU 使用率、メモリ使用量、ディスクの読み取り/書き込みなどの主要なパフォーマンスメトリックがキャプチャされます。プロセスの起動時間、開いているファイルハンドルの数、プロセスで開始されたスレッドの数などの他の情報も収集されます。即時のフィードバックのために、ほぼリアルタイムモニタリング機能が提供されます。これにより、システム管理者は問題を早期に特定して解決できます。

  • プロセスレベルのモニタリングは、管理者に多様な障害診断メソッドを提供します。メモリリークやリソース競合の問題が発生するプロセスや、高い CPU 使用率やリソース消費を引き起こすプロセスなど、システムのパフォーマンス低下や障害の原因となるプロセスを特定するのに役立ちます。

Grafana ダッシュボード

  • デフォルトでは、Managed Service for Prometheus は、ECS 概要ダッシュボード、ECS 詳細ダッシュボード、GPU 概要ダッシュボード、GPU 詳細ダッシュボード、ノードプロセスダッシュボードなど、Grafana ダッシュボードと統合されています。

  • ECS インスタンスは、数回のクリックでモニタリングのために Managed Service for Prometheus に統合でき、モニタリング機能はすぐに使用できます。

ステップ 1: ECS インスタンスの統合

  1. ARMS コンソールにログインします。左側のナビゲーションウィンドウで、[Integration Center] をクリックします。

  2. [Integration Center] ページの左側のナビゲーションウィンドウで、[Infrastructure] をクリックし、次に [Host Monitor] をクリックします。

    image

    説明
    • Managed Service for Prometheus は、リソースセンターに依存して、現在の Alibaba Cloud アカウント内の VPC や ECS インスタンスなどのリソースのデータを取得します。リソースセンターを有効化していない場合は、プロンプトに従って有効化する必要があります。詳細については、「リソースセンターを有効化する」をご参照ください。

    • リソースセンターの有効化は非同期操作です。ARMS コンソールでリソースセンターがまだ有効化されていないというプロンプトが表示され続ける場合は、10〜20 秒待ってから再度 [再検出] をクリックしてください。

  3. 表示されるパネルで、[VPC] を選択し、[構成情報] セクションでパラメーターを指定します。次の表にパラメーターを示します。

    パラメーター

    説明

    NodeExporter インストールモード

    • 自動インストール (推奨): Managed Service for Prometheus は、選択した ECS インスタンスに Node Exporter を自動的にインストールします。

    • 自己インストール: Node Exporter を手動でインストールする必要があります。

    ホストサービスディスカバリーモード

    • 汚染ラベル選択: ブラックリストモード。Managed Service for Prometheus に統合したくない ECS インスタンスを指定します。一致しない ECS インスタンスのデータが収集されます。

    • 無条件: VPC 内のすべての ECS インスタンスからメトリックを収集します。

    • タグ ラベル選択: ホワイトリストモード。Managed Service for Prometheus に統合したい ECS インスタンスを指定します。一致しない ECS インスタンスのデータは収集されません。

    • IP CIDR: CIDR ブロックを指定します。ECS インスタンスの IP アドレスが一致する場合、インスタンスのデータが収集されます。VPC の CIDR ブロックを指定すると、現在の VPC 内のすべての ECS インスタンスのデータが収集されます。

    • インスタンス ID: 統合したい ECS インスタンスの ID を指定します。複数のインスタンス ID はカンマ (,) で区切ります。

    ECS 汚染ラベル

    各汚染はキーと値で構成されます。複数の汚染を構成できます。

    テキストファイルの収集

    メトリックを収集するテキストファイルを指定します。

    プロセスステータスメトリックの収集

    デフォルトでは、各 ECS インスタンスのプロセスデータが収集されます。

    Node-Exporter サービスポート

    デフォルト値: 9100。

    メトリック収集間隔 (単位/秒)

    データが収集される間隔。単位: 秒。デフォルト値: 15。

    セキュリティグループの自動構成

    デフォルトでは、スイッチはオンになっています。

    カスタム ECS タグの注入

    対応するキーと値のペアを Managed Service for Prometheus メトリックに自動的に注入するための ECS タグキー。

  4. [OK] をクリックします。ECS インスタンスのメトリックが統合されるまで、約 1〜2 分待ちます。

説明

統合完了後にダッシュボードにデータが表示されない場合は、ECS インスタンスのセキュリティグループが 100.64.0.0/10 および 192.168.0.0/18 CIDR ブロックからの 9100 および 9256 ポートへのインバウンドアクセスを許可していることを確認してください。詳細については、「セキュリティグループの検索」をご参照ください。9100 は各 Node Exporter のデフォルトポートであり、9256 は各 Process Exporter のデフォルトポートです。必要に応じて特定のポートを調整できます。

ステップ 2: ダッシュボードの表示

  1. 左側のナビゲーションウィンドウで、[統合管理] をクリックします。

  2. [統合管理] ページの [統合環境] タブで、[ECS インスタンス] をクリックします。

  3. [ECS インスタンス] タブで、環境インスタンスの名前をクリックします。

  4. [コンポーネント管理] タブの [アドオンタイプ] セクションで、[ダッシュボード] をクリックして、組み込みの Grafana ダッシュボードを表示します。

ステップ 3: アラートの設定

  1. Managed Service for Prometheus コンソールにログインします。左側のナビゲーションウィンドウで、[統合管理] をクリックします。

  2. [統合管理] ページの [統合環境] タブで、[ECS インスタンス] をクリックします。

  3. [ECS インスタンス] タブで、環境インスタンスの名前をクリックします。

  4. [コンポーネント管理] タブの [アドオンタイプ] セクションで、[アラートルール] をクリックして、組み込みのアラートルールを表示します。

説明
  • 組み込みのアラートルールは、アラート通知を送信せずにアラートイベントを生成します。メールやその他のチャネルを使用してアラート通知を送信する場合は、[編集] をクリックして通知方法を構成します。Prometheus アラートルールの編集ページでは、カスタムのアラートしきい値、期間、アラート内容を指定できます。詳細については、「Prometheus インスタンスのアラートルールを作成する」をご参照ください。

  • アラート通知パラメーターをシンプルモードに設定すると、アラート通知を受信する連絡先と通知期間を構成し、アラート通知を繰り返し送信するかどうかを指定できます。

image