すべてのプロダクト
Search
ドキュメントセンター

Container Service for Kubernetes:基本的なモニタリング機能

最終更新日:Nov 14, 2024

Container Service for Kubernetes (ack) のACK-koordinatorコンポーネントは、サービスレベル目標 (SLO) 対応のリソーススケジューリングをサポートします。 このトピックでは、ack-koordinatorを使用して、レイテンシー (LS) ワークロードとベストエフォート (BE) ワークロードが同じ場所に配置されているシナリオで基本的なモニタリングを有効にする方法について説明します。

前提条件

  • ACK Proクラスターが作成されました。 基本的なモニタリング機能は、ACK Proクラスターでのみサポートされます。 詳細については、「ACK管理クラスターの作成」をご参照ください。

  • ack-koordinator v1.1.1-ack.1以降がインストールされています。 詳細については、「ack-koordinator (FKA ack-slo-manager) 」をご参照ください。

  • ack-koordinatorの動的リソースオーバーコミットメント機能が有効になっています。 詳細については、「動的リソースのオーバーコミットメント」をご参照ください。

コロケーションの基本モニタリングデータの表示

  1. ACKコンソールにログインします。 左側のナビゲーションウィンドウで、[クラスター] をクリックします。

  2. [クラスター] ページで、管理するクラスターの名前をクリックします。 左側のウィンドウで、[操作] > [Prometheusモニタリング] を選択します。

  3. On thePrometheusモニタリングページ、選択コスト分析 /リソース最適化 > オンラインワークロードとオフラインワークロードのハイブリッド展開.

    次の図は、基本的なモニタリングダッシュボードを示しています。在离线混部

基本モニタリングダッシュボードの説明

基本モニタリングダッシュボードでは、次の情報を表示できます。

  • リソースの利点: コロケーションシナリオにおけるリソースの利点に関する統計を表示するパネルを提供します。

  • Observability: コロケーションシナリオのリソースとワークロードに関する洞察を提供します。 クラスター、ノードプール、ノード、ポッドごとにリソース統計を表示できます。

リソース特典の概要

[リソース特典の概要] セクションには、リソースの特典とリソースの使用傾向に関する情報が表示されます。

コロケートリソースの総量と割り当てられたコロケートリソースの量に関する情報 集群混部收益情况

期間

説明

同じ場所に配置されていないリソース

ノード上のすべての割り当て可能な物理リソース。 コロケーションされていないリソースの合計量はノードの仕様によって異なり、コロケーションを有効にした後も変更されません。

Colocatedリソース

SLOを意識したACKのワークロードスケジューリングは、動的リソースオーバーコミットメント機能を使用して、クラスタ内のアイドルリソースを利用します。 コロケートされたリソースの総量は、ノードのリソース利用に基づいて変化し、ノードのアイドルリソースとともに動的に変化する。 Colocatedリソースは、コロケーションシナリオで使用されるスケジュール可能なリソースです。 コロケーションされたリソースの量は、コロケーションのシナリオでリソースの利点を評価するために使用される重要なメトリックです。

併置されたリソースの総量

並置されたリソースには、クラスター内のコロケーションに使用できるvCPUとメモリリソースが含まれます。 上の図は、LSワークロードとBEワークロードのコロケーションに使用できるvCPUと487 GiBのメモリがクラスターに118あることを示しています。 コロケートされたリソースの量が増加すると、クラスタはより多くのスケジューリング可能なアイドルリソースを提供できます。 この場合、より多くのアプリケーションをデプロイでき、コロケーションシナリオでより多くのリソースの利点を生み出すことができます。

割り当てられた共同リソースの合計量

割り当てられたコロケーションリソースには、コロケーションに割り当てられたvCPUとメモリリソースが含まれます。 上の図は、コロケーションシナリオで2 vCPUと1 GiBのメモリが割り当てられていることを示しています。 割り当てられるコロケートリソースの量が増加する場合、より多くのコロケートリソースが割り当てられる。 この場合、より多くのアプリケーションをデプロイでき、コロケーションシナリオでより多くのリソースの利点を生み出すことができます。

割り当てられた共同リソースの比率

割り当てられたコロケーションされたリソースの比率は、コロケーションのvCPUとメモリに基づいて計算されます。 この比率は、以下の式を用いて計算される。割り当てられたリソースの比率=割り当てられたリソースの量 /リソースの総量。 上の図は、コロケーションに割り当てられたvCPUの比率が1.70% 、コロケーションに割り当てられたメモリの比率が0.21% であることを示しています。 より高い比率は、コロケーションシナリオにおいてより多くのリソース利益が生成され得ることを示す。

併置リソースの利用動向 混部资源使用趋势

期間

説明

併置されたポッドの数

併置されたポッドの数には、併置されていないリソースを使用するポッドの数と併置されたリソースを使用するポッドの数が含まれます。 コロケートされていないリソースを使用するポッドの割合とコロケートされたリソースを使用するポッドの割合も表示されます。

共同リソースの比率

コロケーションのvCPUの比率とコロケーションのメモリの比率が表示されます。 比率は、コロケートされたリソースの量およびコロケートされていないリソースの量を示す。 クラスタが大量のアイドルリソースを有し、コロケートされたリソースの比率が高い場合、コロケーションのために大量のリソースを使用することができる。

Colocatedリソースの概要

[クラスターディメンション][ノードディメンション] 、および [ポッドディメンション] セクションには、クラスター、ノード、ポッド別のリソース使用量とリソース要求が表示されます。

Cluster Dimension 集群资源视图-1集群资源视图-2

期間

説明

クラスター内のリソース使用量

消費されたCPUおよびメモリリソースに関する情報が表示されます。 この情報には、クラスターの合計vCPUと合計メモリ容量、コロケートされていないポッドで使用されるvCPUとメモリ、コロケートされたポッドで使用されるvCPUとメモリ、システムコンポーネントで使用されるvCPUとメモリが含まれます。 同じ場所に配置されていないポッド、同じ場所に配置されたポッド、およびシステムコンポーネントが使用するvCPUまたはメモリが、クラスタの合計vCPUまたはメモリ容量よりもはるかに少ない場合、クラスタのCPU使用率およびメモリ使用率は低く、大量のCPUまたはメモリリソースがクラスタ内でアイドル状態になります。

クラスター内のコロケートされたリソースのリクエスト

コロケートされたリソースのリクエストに関する情報が表示されます。 この情報には、コロケーションのための割り当て可能なvCPUとメモリの合計、およびコロケーションのための要求されたvCPUとメモリが含まれます。 要求された共同配置リソースの量が共同配置リソースの総量に近い場合、割り当てられた共同配置リソースの比率は高い。

クラスター内の非コロケートリソースのリクエスト

非コロケートリソースのリクエストに関する情報が表示されます。 情報は、非コロケーションシナリオのための割り当て可能なvCPUおよび割り当て可能なメモリ、ならびに非コロケーションシナリオのための要求されたvCPUおよびメモリを含む。 要求された非コロケートリソースの量が非コロケートリソースの総量に近い場合、割り当てられた非コロケートリソースの比率は高い。

node_labelパラメーターの値を変更して、特定のノードプールのパネルを表示できます。

节点池视图

次の表では、ページに表示されるフィルターについて説明します。

フィルター

説明

node_label_value

デフォルト値: All。 デフォルト値を使用すると、[リソース特典の概要] セクションと [クラスターディメンション] セクションには、すべてのクラスターノードに関する統計情報が表示されます。

ドロップダウンリストからノードプールIDを選択すると、[リソース特典の概要] セクションと [クラスターディメンション] セクションにノードプールに関する情報を表示できます。

node_label

ノードラベルを指定してノードを選択できます。 詳細については、オンラインワークロードとオフラインワークロードのハイブリッド展開タブのメモセクションを参照してください。

ノードディメンション

オンラインワークロードとオフラインワークロードのハイブリッド展開タブで、ノードを選択して、ノードに関するリソース情報を表示できます。

单机资源视图-1单机资源视图-2单机资源视图-3

期間

説明

ノード上のコロケートされたリソースの比率

ノード上のコロケートされたリソースの比率に関する情報が表示されます。 情報には、非コロケーションシナリオのvCPUの比率、非コロケーションシナリオのメモリの比率、コロケーションのvCPUの比率、コロケーションのメモリの比率が含まれます。 コロケートされていないリソースの合計量は、コロケートされたリソースの合計量にスタックされるため、統計を比較できます。

ノードのリソース使用量

ノードのCPU使用率, メモリ使用率 (キャッシュを含む), メモリ使用率 (キャッシュを除く) の情报が表示されます。 この情報には、ノードの合計vCPUと合計メモリ、同じ場所に配置されていないポッドが使用するvCPUとメモリ、同じ場所に配置されたポッドが使用するvCPUとメモリ、システムコンポーネントが使用するvCPUとメモリが含まれます。 同じ場所に配置されていないポッド、同じ場所に配置されたポッド、およびシステムコンポーネントによって使用されるvCPUまたはメモリリソースの量がノードの合計vCPUまたはメモリ容量よりもはるかに少ない場合、ノードのCPU使用率またはメモリ使用率は低く、大量のCPUまたはメモリリソースはノード上でアイドル状態です。

ノードで要求された共同配置リソース

コロケーションに要求されたvCPUとメモリに関する情報が表示されます。 この情報には、合計vCPU、要求されたvCPU、合計メモリ、およびノード上のコロケーションの要求されたメモリが含まれます。 要求された共同配置リソースの量が共同配置リソースの総量に近い場合、割り当てられた共同配置リソースの比率は高い。

各ポッドによる共同リソースの要求

ノード上の各ポッドによるコロケーションのためのvCPUとメモリの要求に関する情報が表示されます。

各ポッドの一括リソース使用率

ノード上の各ポッドのコロケーションのためのvCPUの使用率およびコロケーションのためのメモリの使用率に関する情報が表示されます。

ポッド寸法

オンラインワークロードとオフラインワークロードのハイブリッド展開タブでは、pod_namespacepod_nameパラメーターの値を変更して、各ポッドのパネルを表示できます。

Pod资源视图-1Pod资源视图-2Pod资源视图-3

期間

説明

ポッドによって使用される共同配置リソースの量

ポッドによって使用されるコロケーション用のCPUおよびメモリリソースの量に関する情報。 情報には、CPU制限とメモリ制限、CPU要求とメモリ要求、および実際のCPU使用率とメモリ使用率が含まれます。

ポッドの一括リソース使用率

ノード上のポッドのコロケーションのためのvCPUの使用率およびコロケーションのためのメモリの使用率に関する情報が表示されます。

各コンテナによって使用されるコロケートされたリソースの量

ポッド内の各コンテナで使用されるコロケーションのCPUおよびメモリリソースの量に関する情報。 情報には、CPU制限とメモリ制限、CPU要求とメモリ要求、および実際のCPU使用率とメモリ使用率が含まれます。

よくある質問

[オンラインワークロードとオフラインワークロードのハイブリッド展開] タブの [リソース特典の概要] セクションにデータが表示されないという問題を解決するにはどうすればよいですか。

  1. ack-koordinatorがインストールされているか確認します。

    1. ACK コンソールにログインします。 左側のナビゲーションウィンドウで、[クラスター] をクリックします。

    2. [クラスター] ページで、管理するクラスターの名前をクリックします。 左側のウィンドウで、[アプリケーション] > [ヘルム] を選択します。

    3. Helmページで、ack-koordinatorコンポーネントが存在するかどうかを確認します。

  2. [リソース特典の概要] セクションにデータが表示されているかどうかを確認します。

    このセクションにデータが表示されない場合は、次の手順を実行します。

    1. 最初に ARMSコンソールを使用します。

    2. 左側のナビゲーションウィンドウで、Prometheusのマネージドサービス > インスタンス.

    3. 表示されるページの左上隅で、管理するPrometheusインスタンスがデプロイされているリージョンを選択し、Prometheusインスタンスをクリックします。 Prometheusインスタンスの詳細ページの左側のナビゲーションウィンドウで、[サービスの検出] をクリックします。

    4. [Service Discovery] ページの [Metrics] タブで、検索ボックスにkube_node_labelsと入力します。 kube_node_labelsを見つけ、[操作] 列の [有効化] をクリックします。 [メモ] メッセージで、[OK] をクリックします。

ダッシュボードのビューがこのトピックで提供されているビューと異なるという問題を解決するにはどうすればよいですか。

オンラインワークロードとオフラインワークロードのハイブリッド展開ダッシュボードを最新バージョンに更新します。 ダッシュボードを更新する方法の詳細については、Grafanaダッシュボードを表示.