リソース観測機能を使用すると、データ転送サービスリソース、計算リソース、ストレージリソースなど、さまざまなリソースのモニタリングデータを特定の期間で表示できます。メトリックデータを折れ線グラフまたは表で表示して、ジョブの実行計画とリソース構成を最適化および調整できます。これは、ジョブの実行効率とパフォーマンスの向上に役立ちます。このトピックでは、MaxCompute のリソース使用量を表示する方法について説明します。
サポートされているリージョン
次の表は、リソース観測機能を使用してさまざまなリソースを観測できるリージョンを示しています。
リソースの種類 | サポートされているリージョン |
計算リソース | 中国 (杭州)、中国 (上海)、中国 (北京)、中国 (張家口)、中国 (深セン)、中国 (ウランチャブ)、中国 (成都)、中国 (香港)、米国 (シリコンバレー)、米国 (バージニア)、マレーシア (クアラルンプール)、日本 (東京)、ドイツ (フランクフルト)、インドネシア (ジャカルタ)、英国 (ロンドン)、シンガポール |
ストレージリソース | 中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (成都)、中国 (張家口)、中国 (ウランチャブ)、中国 (香港)、マレーシア (クアラルンプール)、日本 (東京)、ドイツ (フランクフルト)、インドネシア (ジャカルタ)、シンガポール |
データ転送サービス | 中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (成都)、中国東部 1 ファイナンス、中国 (香港)、シンガポール、日本 (東京)、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、ドイツ (フランクフルト)、英国 (ロンドン)、米国 (シリコンバレー)、米国 (バージニア)、SAU (リヤド - パートナーリージョン) |
ジョブ パフォーマンス | 中国 (杭州)、中国 (上海)、中国 (北京)、中国 (張家口)、中国 (ウランチャブ)、中国 (深セン)、中国 (成都)、中国 (香港)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、日本 (東京)、米国 (シリコンバレー)、米国 (バージニア)、ドイツ (フランクフルト)、英国 (ロンドン)、SAU (リヤド - パートナーリージョン) |
権限
Alibaba Cloud アカウント: リソース観測のすべての読み取り権限と操作権限があります。
RAM ユーザー: RAM 権限が必要です。詳細については、「RAM 権限」をご参照ください。
計算リソース
サブスクリプションおよび従量課金クォータの CU リソース使用量を表示できます。
手順
MaxCompute コンソールにログインします。 左上隅でリージョンを選択します。
左側のナビゲーションウィンドウで、[リソース観察] をクリックします。
[リソース観察] ページで、[計算リソース] タブをクリックします。
レベル 1 クォータ名、時間範囲、および時間間隔を選択します。
時間間隔は、データポイント間の分数です。 自動、1、5、または 15 分を選択できます。 パフォーマンスを確保するため、時間範囲が 72 時間を超える場合は、自動間隔のみを選択できます。
レベル 2 クォータの左側にある
アイコンをクリックして、そのリソース消費傾向グラフを表示します。 複数のレベル 2 クォータチャートを同時に展開できます。各レベル 2 クォータに関連付けられているプロジェクトのリストを表示します。
メトリック
メトリック名 | 説明 |
CPU リソース | 現在のクォータの CPU 使用率のトレンド。タイムポイントをクリックすると、そのタイムポイントに対応するジョブスナップショットリストが表示されます。 |
メモリリソース | 現在のクォータグループのメモリ使用量のトレンド。 重要 従量課金リソースは、共有リソースプールから提供されます。これらのリソースは、コンピューティングジョブを実行するために消費されます。コンピューティングジョブはリソースを奪い合い、各ジョブが使用できるリソースを指定することはできません。ユーザーが大量のリソースを継続的にリクエストする場合、MaxCompute は、他のユーザーが従量課金コンピューティングリソースを使用できるように、ユーザーのリソース使用量を制限します。 |
クォータと関連付けられたプロジェクト: レベル 2 クォータをデフォルトクォータとして定義するプロジェクトを識別できます。
ストレージ リソース
現在のリージョンにおけるストレージの合計使用量と、さまざまなストレージ タイプの使用率を表示できます。また、選択したプロジェクトと期間に基づいて、さまざまなストレージ タイプのストレージ使用量の傾向、および詳細なテーブルまたはパーティションのストレージ情報も表示できます。
手順
MaxCompute コンソール にログオンします。上部のナビゲーションバーで、リージョンを選択します。
左側のナビゲーションウィンドウで、[ワークエリア] > [リソース観察] を選択します。
[リソース監視] ページで、[ストレージ リソース] タブをクリックして、現在の日のストレージ合計使用量とさまざまなストレージ タイプのストレージ使用量分布を表示します。
オプション。期間と1つ以上のプロジェクトを選択して、[ストレージ使用量の傾向] を表示します。デフォルトでは、7日間を示す 7d が期間として選択され、すべてのプロジェクトが選択されます。最大 8 つのプロジェクトを手動で選択できます。
オプション。[ストレージの詳細] セクションの [プロジェクトの詳細] タブで、日付を選択して、その日付の各プロジェクトのストレージ使用量を表示します。デフォルトの日付は現在の日付です。
オプション。[ストレージの詳細] セクションの [テーブル/パーティションの詳細] タブで、日付とプロジェクトを選択して、その日付のプロジェクト内のテーブルとパーティションのストレージ使用量を表示します。デフォルトの日付は現在の日付です。
指標
指標名 | 説明 |
[現在の日付のストレージ使用量] | 現在のリージョンにおけるストレージの合計使用量と、各ストレージ タイプの使用率が表示されます。データは約1時間ごとに更新されます。 |
[ストレージ分布] | 現在のリージョンにおけるプロジェクト、テーブル、およびパーティションの数が表示されます。データは毎日更新されます。 |
[ストレージ傾向] |
|
[プロジェクトの詳細] | 現在のリージョンにおいて、指定された日付にストレージ合計使用量の値が 0 より大きいプロジェクトの、さまざまなストレージ タイプのストレージ使用量の詳細が表示されます。過去1年以内の日付を選択できます。[プロジェクトの詳細] タブでは、現在の日付のプロジェクトのストレージ合計使用量と、前日、7日前、または30日前のストレージ合計使用量も比較されます。 |
[テーブル/パーティションの詳細] | ストレージ タイプ、ストレージ サイズ、現在の日付のストレージ使用量と前日、7日前、または30日前のストレージ使用量の比較が表示されます。 |
データ転送サービス
特定のデータ伝送リソースグループまたは特定のプロジェクトのリソース使用量を表示できます。また、フィルター条件を使用して、異なるテーブルまたはリクエストタイプのタイプのリソース使用量をより詳細に観察および分析することもできます。
手順
MaxCompute コンソール にログインし、上部のナビゲーションバーでリージョンを選択します。
左側のナビゲーションウィンドウで、 を選択します。
リソース監視 ページで、[Data Transmission Service] タブをクリックします。
クォータ、プロジェクト、時間範囲、および集約アルゴリズムを選択して、各メトリックのデータをクエリします。
使用方法
データ集約メカニズム
データ伝送サービスの監視には、メトリック間隔適応メカニズムが使用されます。 このメカニズムは、選択された時間範囲に基づいて、監視データを表示するためのメトリック密度を自動的に最適化します。
短期間(3時間以内)は、ネイティブのデータ粒度(1分/ポイント)を使用します。
長期間は、メトリックのステップサイズが 5分/ポイント(12時間)、30分/ポイント(72時間)、60分/ポイント(7日間)に自動的に延長されます。
複数の集約方法が用意されています。
平均値:データの全体的な傾向を反映します。
最大値:異常な変動の特性を捉えます。
ステップサイズが基本粒度(1分)を超えると、システムは最初に集約方法に従ってデータを処理します。 したがって、モニタリングチャートに表示される傾向は、集約アルゴリズムによって異なります。 期間が長いほど、データの差異が大きくなります。これは正常な動作です。 分析シナリオに基づいて適切な集約アルゴリズムを選択できます。
パフォーマンス分析シナリオ:平均値の集約アルゴリズムを使用することをお勧めします。
トラブルシューティングシナリオ:最大値の集約アルゴリズムを使用することをお勧めします。
フィルター条件と制限
時間範囲でデータをフィルタリングする場合、1回のクエリで最大 7日間を選択できます。 メトリック間隔適応メカニズムのため、選択した時間範囲が短いほど、監視データの精度は高くなります。
クォータまたはプロジェクトを少なくとも 1つ選択する必要があります。 クォータとプロジェクトの組み合わせフィルタリングも可能です。
クォータディメンションからのみリソース使用量データを表示する場合:クォータを選択するときに、排他的リソースグループまたは共有リソースグループのいずれかを指定できます。 共有リソースグループはプロジェクトレベルのクォータであるため、特定のプロジェクトの共有リソースグループの使用状況を表示する場合は、プロジェクトも指定する必要があります。
プロジェクトディメンションからのみリソース使用量データを表示する場合: [クォータの選択] フィールドを空のままにし、[プロジェクトの選択] で目的のプロジェクトを選択する必要があります。これにより、そのプロジェクトの合計使用量が表示されます。
フィルター条件を変更した後、誤操作を避けるために、[クエリ] をクリックして監視データをリフレッシュする必要があります。
一部のテーブルレベルの監視ダッシュボードでは、データを表示したり、テーブル名でフィルターを適用したりする前に、プロジェクトを選択する必要があります。
メトリクス
メトリック | 説明 |
[リクエスト並列度] | 折れ線グラフに、現在の使用量とクォータ使用量制限を含む、フィルター条件に基づいた対応するスロット使用量が表示されます。単位:スロット。 |
[スループット] | 折れ線グラフに、フィルター条件に基づいた対応するスループットが表示され、縦軸に単位(B/分または MB/分など)が表示されます。 |
[テーブルレベルのリクエスト同時実行数] | [使用タイプ](トンネルバッチアップロードなど)の値と [テーブル名](testtable など)の値を選択すると、フィルター条件下でトンネルバッチメソッドを使用してテーブル testtable にデータをアップロードする際の同時実行数を示す折れ線グラフが表示されます。単位:スロット。 |
[テーブルレベルの IP スループット] | [使用タイプ](トンネルバッチアップロードなど)の値と [テーブル名](testtable など)の値を選択すると、トンネルバッチメソッドを使用してテーブル testtable にデータをアップロードする際に、フィルター条件下で各送信元 IP アドレスのスループットを示す折れ線グラフが表示されます。 |
[リクエスト合計数とエラーリクエスト数] | フィルター条件に基づいて、リクエストの合計数とさまざまなエラーリクエストの数を表示します。
|
[スループット合計] | フィルター条件に基づいて、対応する期間内のさまざまな使用メソッドのデータ量の要約を表示し、円グラフを使用してさまざまな使用メソッドの割合を示します。 |
[スロット平均転送速度] | [使用タイプ](トンネルバッチアップロードなど)の値を選択すると、フィルター条件下でトンネルバッチメソッドを使用してデータをアップロードするリクエストのスロットあたりの平均転送速度が表示されます。 |
ジョブパフォーマンス
コンピューティングジョブの数量、CU 使用量、および実行時間を表示し、ジョブパフォーマンスが期待どおりかを確認できます。
手順
MaxCompute コンソール にログインし、上部のナビゲーションバーでリージョンを選択します。
左側のナビゲーションウィンドウで、[リソース観察] をクリックします。
[リソース観察] ページで、[ジョブパフォーマンス監視] タブをクリックします。
次のパラメーターに基づいて表示するジョブをフィルタリングおよびグループ化し、さまざまなディメンションに基づいてチャート内のメトリックデータをグループ化できます。
パラメーター
説明
期間
必須。完了したジョブをフィルタリングするために使用される時間範囲(開始時刻と終了時刻)。
プリセットの時間範囲を選択するか、カスタムの時間範囲を設定できます。
1d:前日。
3d:過去 3 日間。
7d:過去 7 日間。
カスタムの時間範囲:ドロップダウンリストをクリックして日付を選択し、[時間を選択] をクリックして時間範囲を選択します。
説明デフォルトの時間範囲は前日です。最大時間範囲は 7 日、最小時間範囲は 1 時間です。過去 45 日間のジョブのみを検索できます。
プロジェクト名
完了したジョブをフィルタリングするために使用される MaxCompute プロジェクトの名前。
説明デフォルトでは、すべてのプロジェクトが選択されています。最大 8 つのプロジェクトを選択できます。
クォータ
完了したジョブをフィルタリングするために使用されるコンピューティングクォータ。
説明デフォルトでは、すべてのコンピューティングクォータが選択されています。最大 8 つのレベル 2 クォータを選択できます。コンピューティングクォータの詳細については、「新しい MaxCompute コンソールでコンピューティングリソースのクォータを管理する」をご参照ください。
グループ化
必須。チャート内のデータのグループ。ディメンションとチャートタイプに基づいてグループを定義できます。
有効値:
グループなし:選択したフィルター範囲内のすべてのジョブについて、メトリックの経時変化を表示します。これはデフォルト値です。
プロジェクト:選択したフィルター範囲内のすべてのジョブのメトリックをプロジェクト別に表示します。
説明プロジェクトを選択した場合は、フィルターパラメーターで プロジェクト名 を指定し、最大 8 つのプロジェクトを選択する必要があります。
クォータ:選択したフィルター範囲内のすべてのジョブのメトリックをレベル 2 クォータ別に表示します。
説明クォータを選択した場合は、フィルターパラメーターで クォータ を指定し、最大 8 つのレベル 2 クォータを選択する必要があります。
ジョブタイプ:選択したフィルター範囲内のすべてのジョブのメトリックをジョブタイプ別に表示します。
SQL:SQL ジョブ。
SQLRT:MaxCompute Query Acceleration (MCQA) SQL ジョブ。
LOT:MapReduce ジョブ。
CUPID:Spark または Mars ジョブ。
Algo_Task:機械学習ジョブ。
GRAPH:グラフコンピューティングジョブ。
ジョブの終了ステータス:選択したフィルター範囲内のすべてのジョブのメトリックを、ジョブの終了時のステータスに基づいて表示します。
成功:ジョブが成功します。
失敗:ジョブが失敗します。
キャンセル:ジョブがキャンセルされます。
[検索] をクリックして、各メトリックの統計を表示します。
オプション。[データサマリー] を選択して、選択した時間範囲に基づいて各メトリックの統計を表示します。
パラメーター
説明
時間ごと
1 時間は時間の粒度です。時間ごと を選択すると、現在の時間に完了したジョブのデータ統計が表示されます。デフォルトでは、時間単位の粒度のデータが表示されます。
たとえば、現在の時点が 2024 年 5 月 6 日 14:00 の場合、2024 年 5 月 6 日 14:00 から 15:00 までの時間範囲に完了したジョブの各メトリックの統計が表示されます。
日ごと
1 日は時間の粒度です。日ごと を選択すると、現在の日に完了したジョブのデータ統計が表示されます。
たとえば、現在の日付が 2024 年 5 月 6 日の場合、2024 年 5 月 6 日 00:00 から 2024 年 5 月 7 日 00:00 までの時間範囲に完了したジョブの各メトリックの統計が表示されます。
比較期間 のオプションを選択して、比較期間 で指定された日数または時間数を現在の日付または時間から差し引くことによって取得された、日または時間の既存データ統計を表示します。
デフォルト値:比較なし。過去 30 日間、過去 7 日間、または 過去 1 日間 を選択することもできます。たとえば、現在の時点が 2024 年 5 月 6 日 14:00 で、過去 30 日間 が選択されている場合、2024 年 4 月 6 日 14:00 のデータが現在のデータと比較するために使用されます。
メトリック
CU 使用量トレンド(単位:コア×時間)
メトリック名
説明
CPU 時間(単位:コア×時間)
選択したフィルター範囲内で完了したジョブに消費された CPU 時間の数。
1 CPU 時間とは、1 CPU コアが 1 時間消費されることを指します。CPU 時間の数 = CPU コアの数 × 期間
メモリ時間(単位:GB ×時間)
選択したフィルター範囲内で完了したジョブに消費されたメモリ時間の数。
1 メモリ時間とは、1 GB のメモリ空間が 1 時間消費されることを指します。メモリ時間の数 = メモリ空間 × 期間。
CPU 時間消費量上位 10 件の分析または メモリ時間消費量上位 10 件の分析
最も多くの CPU 時間またはメモリ時間を消費する上位 10 件のジョブと、選択したフィルター範囲内で合計 CPU 時間の最高値、平均 CPU 時間の最高値、合計メモリ時間の最高値、および平均メモリ時間の最高値でランク付けされたジョブの上位 10 件の署名と ExtNodeId を表示します。
ジョブ実行時間(単位:秒)
メトリック名
説明
平均実行時間
選択したフィルター範囲内で完了したジョブの平均ジョブ期間。
最大実行時間
選択したフィルター範囲内で完了したジョブの最大ジョブ期間。
最小実行時間
選択したフィルター範囲内で完了したジョブの最小ジョブ期間。
分位実行時間を選択
選択したフィルター範囲内で指定された分位数のジョブを完了するのにかかる期間。分位数は、第 1 分位数、第 5 分位数、第 10 分位数、第 50 分位数、第 90 分位数、第 95 分位数、または第 99 分位数にすることができます。
たとえば、第 99 分位数の場合、このメトリックは 99% のジョブを完了するのにかかる期間を示します。
ジョブ実行時間上位 10 件の分析
実行時間が最も長い上位 10 件のジョブと、合計実行時間が最も長いジョブと平均実行時間が最も長いジョブでランク付けされた上位 10 件の署名と ExtNodeId を表示します。
ジョブ数トレンド(単位:件数):選択したフィルター範囲内で完了したジョブの数を表示します。
ジョブスキャン量トレンド(単位:GB):選択したフィルター範囲内で完了したジョブによってスキャンされたデータの量を表示します。単位は適応的に変更され、実際に使用された単位がチャートに表示されます。
CU 時間あたりのジョブスキャン量トレンド(単位:GB):選択したフィルター範囲内でジョブによって 1 CU 時間あたりにスキャンされたデータの平均量を表示します。単位は適応的に変更され、実際に使用された単位がチャートに表示されます。1 CU には、1 CPU コアと 4 GB のメモリが含まれています。値は、
MAX(CPU-hours, Roundup(Memory-hours/4))を使用して計算されます。
テナントレベルのインフォメーションスキーマ を使用して、上記のメトリックの統計を収集することもできます。Information Schema task_history テーブルには、すべての操作によって生成された タスクインスタンス が含まれていることに注意してください。ただし、コンソールの ジョブパフォーマンス監視 タブに表示されるメトリックのデータは、コンピューティングリソースを消費するジョブからのみ取得されます。したがって、テナントレベルのインフォメーションスキーマを使用して取得された統計結果は、ジョブパフォーマンス監視タブに表示される統計結果と異なる場合があります。
次の SQL 文は例を示しています。
SET odps.namespace.schema=TRUE;
SELECT to_char (end_time, 'yyyy-mm-dd hh'), -- ジョブが完了した時間。
-- to_char (end_time, 'yyyy-mm-dd'), -- ジョブが完了した日付。日単位の粒度を使用する場合は、この行を使用して前の行を置き換えます。
sum(cast(cost_cpu/100/3600 as DECIMAL(18,5) )) cost_cpuh, -- CPU 時間。
sum(cast(cost_mem/1024/3600 as DECIMAL(18,5) )) cost_memh, -- メモリ時間。
avg(datediff(end_time, start_time, 'ss')), -- ジョブの平均実行時間。
min(datediff(end_time, start_time, 'ss')), -- ジョブの最小実行時間。
max(datediff(end_time, start_time, 'ss')) -- ジョブの最大実行時間。
-- status, -- グループ化基準:status:ジョブステータス。project:task_catalog。job type:task_type。
FROM SYSTEM_CATALOG.INFORMATION_SCHEMA.tasks_history
WHERE ds>=to_char(date_add(getdate(),-7),'yyyymmdd') -- ビジネス要件に基づいて他のフィルター条件を追加できます。
and task_type in ('SQL','SQLRT','LOT','CUPID','ALgoTask')
GROUP BY to_char (end_time, 'yyyy-mm-dd hh')
-- to_char (end_time, 'yyyy-mm-dd'), -- ジョブが完了した日付。日単位の粒度を使用する場合は、この行を使用して前の行を置き換えます。
-- status, -- グループ化基準:status:ジョブステータス。project:task_catalog。job type:task_type。
order BY to_char (end_time, 'yyyy-mm-dd hh') ASC;
-- to_char (end_time, 'yyyy-mm-dd'); -- ジョブが完了した日付。日単位の粒度を使用する場合は、この行を使用して前の行を置き換えます。よくある質問
質問 1:
問題の説明:ジョブがプロジェクトまたはクォータ別にグループ化された後、一部のプロジェクトまたはクォータがチャートに表示されません。
考えられる原因:プロジェクトまたはクォータでジョブが利用できません。
質問 2:
問題の説明:比較期間を選択した後、比較期間に対応するデータが利用できません。
考えられる原因:プロジェクトまたはクォータが比較期間内に作成されていないか、削除されている可能性があります。比較期間内にプロジェクトまたはクォータでジョブが利用できません。
参考資料
リソース監視ページで各メトリックのデータを確認した後、ビジネス要件に基づいてジョブの実行計画とリソース割り当てを最適化および調整できます。