すべてのプロダクト
Search
ドキュメントセンター

Container Service for Kubernetes:クラスター診断の操作Work with cluster diagnostics

最終更新日:Dec 12, 2024

Container Intelligence Service (CIS) を使用すると、数回クリックするだけでノード、ポッド、サービス、Ingress、メモリ、ネットワークを診断し、Container Service for Kubernetes (ACK) クラスター内の問題を特定できます。 このトピックでは、クラスター診断機能を使用してACKクラスターを診断する方法について説明します。

前提条件

  • ACK管理クラスターが作成されます。 詳細については、「ACK管理クラスターの作成」をご参照ください。

  • ACKクラスターのステータスは [実行中] です。

    説明

    [ACKコンソール] にログインし、[クラスター] ページに移動して、クラスターの [クラスターステータス] 列に [実行中] が表示されているかどうかを確認します。

クラスター診断の概要

CISは、以下の診断項目を提供する。

診断アイテム

説明

ノード診断

NotReady状態のKubernetesノードなど、ノードの問題を診断します。

ポッド診断

ポッドの起動失敗や頻繁なポッドの再起動など、ポッドのステータスの問題を診断します。

サービス診断

サービスの構成、リソースのクォータ、異常イベントなど、サービスの問題を診断します。

侵入診断

トラフィックルーティング設定におけるIngress関連の問題を診断します。

メモリ診断

メモリリーク、cgroupリーク、メモリ不足 (OOM) エラーなどのノードメモリの問題を診断します。 診断結果を視覚化して、全体的なメモリ使用量を表示できます。

ネットワーク診断

ポッド間、クラスターとインターネット間、LoadBalancerサービスとインターネット間の接続の問題など、一般的なネットワークの問題を診断します。

診断の設定

重要

クラスター診断機能を使用すると、ACKはクラスター内の各ノードでデータ収集プログラムを実行し、診断結果を収集します。 ACKは、システムのバージョン、ロード、Docker、kubeletなどのシステムログと操作情報から重要なエラーメッセージを収集します。 ACKはビジネス情報や機密データを収集しません。

ノード、ポッド、サービス、Ingress、メモリ、およびネットワーク診断を構成する手順は同様です。 次のセクションでは、ノード診断を例として、診断機能を設定する方法を示します。

  1. ACKコンソールにログインします。 左側のナビゲーションウィンドウで、[クラスター] をクリックします。

  2. [クラスター] ページで、管理するクラスターの名前をクリックします。 左側のナビゲーションウィンドウで、[検査と診断] > [診断] を選択し、画面の指示に従って承認を完了します。

  3. [診断] ページで、[ノード診断] をクリックします。 次に、左上隅の [診断] をクリックします。

  4. [ノードの選択] パネルで [ノード名] を指定し、[知っていると同意する] を読み、[診断の作成] をクリックします。

    ページで診断の進行状況を表示できます。 診断が完了すると、ページに診断結果と診断項目が表示されます。 原因を確認して問題を修正できます。

診断結果の表示

[ノード診断] ページで、リストの診断レポートの [操作] 列で [診断の詳細] をクリックし、詳細ページで診断結果を表示します。

説明

診断項目は、クラスタ構成に基づいて変化し得る。 診断ページの実際の診断項目が優先されます。

診断アイテム

フラグ

説明

ノード診断

  • 通常の正常: 操作は必要ありません。

  • 警告警告: 問題の重大度を確認します。 クラスターの異常を引き起こす可能性のある問題をトラブルシューティングします。

  • 異常异常: クラスターエラーを回避するために、できるだけ早い機会に問題を解決してください。

  • 不明未知: 診断が完了していないか、診断結果が不明です。

ノード診断は、ノードNodeComponentClusterComponentECSControllerManager、およびGPUNode診断項目で構成されます。 これらの診断項目は、ノード、ノードコンポーネント、クラスターコンポーネント、およびElastic Compute Service (ECS) インスタンスのステータスに基づいてノードの異常を特定するのに役立ちます。 診断の詳細ページでは、ノードの診断結果、修復の提案、および診断項目を表示できます。

診断項目に関する情報を表示するに详情图标.pngは、診断項目の右側にあるアイコンの上にポインターを移動します。

異常または警告フラグのある診断項目は、[トラブルシューティング] タブに表示されます。

診断項目に異常フラグが表示されている場合は、[ステータス] 列の [詳細] の上にポインターを移動して、問題に関する詳細を表示できます。

ポッド診断

ポッド診断は、ポッドClusterComponentノードNodeComponent、およびECSControllerManager診断項目で構成されます。 これらの診断項目は、ポッド、クラスターコンポーネント、ノード、およびECSインスタンスのステータスに基づいてポッドの異常を特定するのに役立ちます。 診断の詳細ページでは、ポッドの診断結果、修理の提案、および診断項目を表示できます。

診断項目に関する情報を表示するに详情图标.pngは、診断項目の右側にあるアイコンの上にポインターを移動します。

異常または警告フラグのある診断項目は、[トラブルシューティング] タブに表示されます。

診断項目に異常フラグが表示されている場合は、[ステータス] 列の [詳細] の上にポインターを移動して、問題に関する詳細を表示できます。

サービス診断

サービス診断は、サービスおよびResourceQuotas診断項目で構成されます。 これらの診断項目は、Classic Load Balancer (CLB) インスタンスの課金方法、証明書、クォータ、異常イベントに基づいてサービスの異常を特定するのに役立ちます。

診断項目に関する情報を表示するに详情图标.pngは、診断項目の右側にあるアイコンの上にポインターを移動します。

異常または警告フラグのある診断項目は、[トラブルシューティング] タブに表示されます。

診断項目に異常フラグが表示されている場合は、[ステータス] 列の [詳細] の上にポインターを移動して、問題に関する詳細を表示できます。

侵入診断

Ingress診断は、IngressAddon、およびSLB診断項目で構成されます。 これらの診断項目は、Ingress、Ingressプラグイン、およびServer Load Balancer (SLB) インスタンスのステータスに基づいてIngressの異常を特定するのに役立ちます。

診断項目に関する情報を表示するに详情图标.pngは、診断項目の右側にあるアイコンの上にポインターを移動します。

異常または警告フラグのある診断項目は、[トラブルシューティング] タブに表示されます。

診断項目に異常フラグが表示されている場合は、[ステータス] 列の [詳細] の上にポインターを移動して、問題に関する詳細を表示できます。

メモリ診断

なし。

診断の詳細ページでは、[メモリの概要][メモリ分析] 、および [OOM分析] セクションに、メモリリーク、メモリ使用率、各プロセスで占有されているメモリなどの診断結果を表示できます。

ネットワーク診断

  • 通常のimage.png: 操作は必要ありません。

  • 異常image.png: できるだけ早い機会に問題を解決してください。

[診断結果] ページで、診断結果を表示できます。 [パケットパス] セクションには、診断されたすべてのノードが表示されます。 異常なノードが強調表示されます。