Kubernetesは、大規模な分散コンテナーオーケストレーションエンジンです。 その複雑さのため、Kubernetesクラスターの管理とO&Mには専門的な専門知識が必要です。 Kubernetesクラスターの管理とO&Mを簡素化するために、Container Service for Kubernetes (ACK) はAIOpsスイートを提供しています。 AIOpsスイートは、クラスターチェック、クラスター検査、およびクラスター診断で構成され、問題のトラブルシューティングとO&M効率の向上に役立ちます。 このトピックでは、クラスタチェック、クラスタ検査、クラスタ診断など、AIOpsスイートとその機能の利点について説明します。
メリット
AIOpsスイートは、クラスタチェック、クラスタ検査、クラスタ診断など、さまざまな機能を提供します。 次の表に、AIOpsスイートの利点を示します。
機能 | メリット |
システムがクラスターに対してO&M操作を実行する前に、クラスターがO&M操作の要件を満たしているかどうかを評価するクラスターチェックがトリガーされます。 これにより、O&M操作の成功率が向上します。 | |
クラスター検査は、クラスター内の潜在的なリスクを特定するためにスケジュールされた時間に実行されます。 | |
ポッド、ノード、Ingress、メモリ、サービスを診断するための一連のクラスター診断ツールが用意されています。 これにより、トラブルシューティングが簡単になります。 |
AIOpsスイートは、ACK管理クラスター、ACK専用クラスター、およびACK Serverless Proクラスターでサポートされています。
クラスターチェック
クラスターチェック機能は、クラスターアップグレード、クラスター移行、コンポーネントのインストール、コンポーネントのアップグレード、ノードプールのアップグレードなどの主要なO&M操作を対象としています。 これらのO&M操作を実行する前に、クラスターチェックが自動的にトリガーされます。 対応するO&M操作は、クラスターがチェックに合格した後にのみ実行できます。 システムはまた、チェック項目の失敗の理由を視覚化して表示し、それらを修正する方法についての提案を提供します。 詳細については、「クラスターチェック」をご参照ください。
クラスター検査
広範なクラスター管理の実践に基づいて、ACKは豊富なユースケースからクラスター検査の豊富な経験を蓄積してきました。 クラスター検査機能を使用して、次のタスクを完了できます。
クラスターのステータスをスキャンして、潜在的なリスクを特定します。
クラスターのリソース使用量、リソースクォータ、クラスター証明書、コンポーネントバージョンを定期的に確認し、結果を視覚化して表示できます。
異常の重大度レベルを表示し、クラスターを効率的に維持するためのソリューションを提供します。
詳細については、「クラスター検査」をご参照ください。
クラスター診断
クラスター診断機能を使用すると、数回クリックするだけでクラスターを診断できます。 この機能は、クラスター内のポッド、ノード、Ingress、メモリ、サービスの診断に役立ちます。 詳細については、「クラスター診断の操作」をご参照ください。
項目 | 説明 |
ポッドの起動の失敗、コンテナーイメージのプルの失敗、ポッドの例外などの一般的なポッドの問題を診断し、これらの問題の根本的な原因を表示し、問題を修正する方法についての提案を提供します。 | |
NotReadyの問題、ノードネットワークの問題、ランタイムの問題などの一般的なノードの問題を診断し、これらの問題の根本原因を表示し、問題を修正する方法についての提案を提供します。 | |
サービス例外イベント、Server Load Balancer (SLB) バックエンドサーバークォータ、SLBインスタンス数クォータに関連する問題など、サービスの一般的な問題を診断し、これらの問題の根本原因を表示し、問題の修正方法についての提案を提供します。 | |
Ingressコンポーネントのチェック、起動パラメーター、Ingressポッドのエラーログ、およびアプリケーションアクセスの問題のトラブルシューティングに役立つIngressコントローラーで使用されるSLBインスタンスに関する情報を収集します。 | |
メモリリーク、メモリの断片化、cgroupリークなど、ACKクラスターの一般的なメモリの問題を診断し、これらの問題の根本原因を表示し、問題を修正する方法についての提案を提供します。 |