说明 Spark SQL 提交作業的模式預設是 yarn-client 模式。
操作步驟
- 進入阿里雲 E-MapReduce 控制台作業列表。
- 單擊該頁右上方的建立作業,進入建立作業頁面。
- 填寫作業名稱。
- 選擇 Spark SQL 作業類型,表示建立的作業是一個 Spark SQL 作業。Spark SQL 作業在 E-MapReduce 後台使用以下的方式提交:
spark-sql [options] [cli option]
- 在應用參數選項框中填入 Spark SQL 命令後續的參數。
- -e 選項
-e 選項可以直接寫啟動並執行 SQL,在作業 應用參數框中直接輸入,如下所示:
-e "show databases;"
- -f 選項
-f 選項可以指定 Spark SQL 的指令檔。通過將編寫好的 Spark SQL 指令檔放在 OSS 上,可以更靈活,建議您使用這種運行方式。如下所示:
-f ossref://your-bucket/your-spark-sql-script.sql
- -e 選項
- 選擇執行失敗後策略。
- 單擊確定,Spark SQL 作業即定義完成。