當MaxCompute提供的內建函數無法滿足您的業務需求時,您可在MaxCompute Studio中自行開發UDF(自訂函數)以實現業務功能,本文介紹如何使用MaxCompute Studio開發及調試Java UDF。
前提條件
您需要完成以下操作:
背景資訊
您可以按照本文介紹自行開發UDF,也可以單擊
直接建立函數。編寫UDF
在Project地區,按右鍵Module的源碼目錄(即 ),選擇 。
填寫Name並選擇類型為UDF,按下Enter鍵。
Name:建立的MaxCompute Java Class名稱。如果需要建立Package,可以在此處填寫packagename.classname,會自動產生Package。
建立成功後,在編輯介面開發Java程式。
通過本地運行調試UDF
通過本地運行方式測試,查看UDF的運行結果是否符合預期。
按右鍵編寫完成的Java指令碼,選擇Run。
在Run/Debug Configurations頁面上配置運行參數。
MaxCompute project:UDF運行使用的MaxCompute空間。本地運行時選擇local。
說明如果需要使用MaxCompute專案中的表資料,需要先在MaxCompute project中更改設定Endpoint和指定專案名稱,指定的MaxCompute專案的表資料未被下載至warehouse目錄中,會先下載資料;如果資料已經下載,則跳過此步驟。
MaxCompute project選擇local,則表示本地專案無需與MaxCompute的資料或資源進行互動,即可在本地環境中進行開發、測試和調試。
MaxCompute table:UDF運行時需要使用的MaxCompute表的名稱。
Table columns:UDF運行時需要使用的MaxCompute表的列資訊。
單擊OK,開始運行。
說明本地運行會讀取warehouse中指定的表資料作為輸入,您可以在控制台查看日誌輸出。
通過單元測試調試UDF
您可以參照examples目錄下的單元測試執行個體,編寫自己的測試案例。
後續步驟
完成開發和調試UDF之後,需要對UDF代碼進行打包、上傳和註冊,使其在MaxCompute中可用。詳情請參見打包、上傳及註冊。
相關文檔
如果您希望在MaxCompute Studio中使用Python語言進行UDF開發,請參見開發Python UDF。