すべてのプロダクト
Search
ドキュメントセンター

AnalyticDB:Sparkアプリケーションのパフォーマンス診断

最終更新日:Jun 12, 2024

AnalyticDB for MySQL Data Lakehouse Edition (V3.0) は、Sparkアプリケーションのパフォーマンス診断機能を提供します。 Sparkアプリケーションにパフォーマンスの問題がある場合は、診断情報を使用してパフォーマンスのボトルネックをすばやく特定して分析し、Sparkアプリケーションを最適化し、トラブルシューティングの効率を向上させることができます。 このトピックでは、Sparkアプリケーションのパフォーマンス診断を実行する方法について説明します。

前提条件

  • AnalyticDB for MySQL Data Lakehouse Edition (V3.0) クラスターが作成されます。 詳細については、「クラスターの作成」をご参照ください。

  • 予約済みコンピューティングリソースの少なくとも8つのAnalyticDBコンピューティングユニット (ACU) を持つジョブリソースグループが作成されます。 詳細については、「リソースグループの作成」をご参照ください。

  • Resource Access Management (RAM) ユーザーにAliyunADBDeveloperAccess権限が付与されます。 詳細については、「RAMユーザーと権限の管理」をご参照ください。

  • AnalyticDB for MySQL Data Lakehouse Edition (V3.0) クラスター用にデータベースアカウントが作成されます。

  • AnalyticDB for MySQLは、AliyunADBSparkProcessingDataRoleロールを引き受けて他のクラウドリソースにアクセスする権限があります。 詳細については、「権限付与の実行」をご参照ください。

シナリオ

Sparkアプリケーションのパフォーマンス診断機能は、次のシナリオに適しています。

  • データセットのパフォーマンス分析: Sparkを使用して大量のデータを処理する場合、データセットのパフォーマンスを分析します。 この機能は、メモリのスパイクや流出などのパフォーマンスのボトルネックをすばやく特定し、データ処理の効率を向上させるのに役立ちます。

  • 多数のアプリケーションでの負荷分散: 高同時負荷は、データスキュー、ロングテール、負荷の不均衡など、Sparkアプリケーションのパフォーマンスの問題を引き起こす可能性があります。 この機能は、問題をすばやく特定し、Sparkアプリケーションを最適化するのに役立ちます。

制限

  • 診断できるのは、過去14日間に正常に実行されたSparkアプリケーションのみです。

  • バッチとストリーミングアプリケーションのみを診断できます。

手順

  1. AnalyticDB for MySQLコンソールにログインします。 ホームページの左上でリージョンを選択します。 左側のナビゲーションウィンドウで、クラスターリスト をクリックします。 Lake Warehouse Edition(3.0) タブで、管理するクラスターを見つけ、クラスターIDをクリックします。

  2. 左側のナビゲーションウィンドウで、 [ジョブ開発] > [Spark JAR開発] を選択します。

  3. [アプリケーション] セクションで、診断するアプリケーションを見つけ、[操作] 列の [詳細]> [履歴] を選択します。

  4. [実行履歴] セクションで、診断するジョブを見つけ、[操作] 列の [診断] をクリックします。

    説明

    診断操作が完了すると、[診断最適化の詳細] パネルが表示されます。 Sparkアプリケーションにパフォーマンスの問題がある場合は、診断情報に基づいてSparkアプリケーションを最適化できます。