Serverless Spark は、さまざまな組み込みパラメーターを提供します。このトピックでは、これらのパラメーターとそのユースケースについて説明し、ランタイム環境の構成とタスク実行の最適化に役立てます。
パラメーター | 説明 | シナリオ |
spark.emr.serverless.user.defined.jars | アップロードされた JAR パッケージを Serverless Spark ドライバーとエグゼキュータの ClassPath に追加します。
| このパラメーターを使用して、Spark-Submit ツール、バッチジョブ、または Airflow Serverless Spark Operator を使用して Spark タスクを送信するとき、またはセッションリソースを作成するときに、OSS からカスタム JAR パッケージを Spark ドライバーとエグゼキュータに追加します。 |
spark.emr.serverless.fusion | Kyuubi と Livy によって開始されたセッションまたはバッチ処理タスクに対して Fusion を有効にするかどうかを指定します。有効な値:
| タスクまたはセッションで [Spark 構成] パラメーターを使用して Fusion を有効にできます。 |
spark.emr.serverless.environmentId | 計算リソースに使用するランタイム環境の ID を指定します。 | このパラメーターを使用して、Airflow または Spark-Submit ツールを使用して Serverless Spark タスクを送信するときに ランタイム環境 を指定します。デフォルトでは、サードパーティの依存ライブラリがランタイム環境にインストールされます。 |
spark.emr.serverless.network.service.name | 計算リソースと他の VPC のデータソース間のネットワーク接続を有効にするためのネットワーク接続の名前を指定します。 | このパラメーターを使用して、Serverless Spark タスクを送信するときにネットワーク接続を追加し、他の Virtual Private Cloud (VPC) のデータソースへのアクセスを許可します。 |
spark.emr.serverless.excludedModules | Serverless Spark から組み込みライブラリを削除します。
| このパラメーターは通常、カスタム JAR パッケージを使用する必要がある場合に使用されます。Serverless Spark コンソール、Spark-Submit ツール、バッチジョブ、Airflow Serverless Spark Operator、Kyuubi、または Livy から Spark タスクを送信するとき、またはセッションリソースを作成するときに、組み込みの Serverless Spark ライブラリを削除できます。 |
spark.emr.serverless.kyuubi.engine.queue | Kyuubi によって開始された Spark アプリケーションが実行されるワークスペースキューの名前を指定します。 | このパラメーターは、Kyuubi 構成セクションで設定するか、接続を確立するときに JDBC URL で指定できます。 |
spark.emr.serverless.templateId | Spark アプリケーションのデフォルト構成テンプレートの ID を指定します。事前定義されたワークスペーステンプレートを参照することで、タスクを送信するときのパラメーター構成を簡素化できます。 ページでテンプレート ID を取得できます。例: | このパラメーターは、Spark-Submit ツールでのみサポートされます。 |
spark.emr.serverless.livy.config.mode | Spark タスクを送信するときに、Livy Gateway の
| Spark タスクの構成を完全にカスタマイズするには、このパラメーターを |
spark.emr.serverless.tag.xxxx | Livy を介して送信されたバッチジョブに、 | このパラメーターを使用して、Livy Gateway を介して送信された Spark ジョブにタグを追加します。その後、ジョブ履歴でこれらのタグによってジョブをフィルターできます。 |