全部產品
Search
文件中心

MaxCompute:查詢非結構化資料

更新時間:Jun 19, 2024

MaxCompute 2.0支援通過外部表格的方式直接存取OSS、OTS等。MaxCompute Studio對此提供了一些代碼模板方便您快速進行非結構化資料查詢開發。本文為您介紹如何使用MaxCompute Studio查詢非結構化資料。

前提條件

您需要完成以下操作:

編寫StorageHandler、Extractor和Outputter

  1. Project地區,按右鍵Module的源碼目錄(即src > main > java),選擇new > MaxCompute Java

    11

  2. 填寫Name並選擇類型為ExtractorStorageHandlerOutputer,按下Enter鍵。

    • Name:建立的MaxCompute Java Class名稱。如果還沒有建立Package,在此處填寫packagename.classname,會自動產生Package。

    • 選擇類型為ExtractorStorageHandlerOutputer

      說明

      您可以根據需要選擇Extractor、StorageHandler或Outputer類型:

      • Extractor:自訂輸入資料解析器,用來實現自訂處理資料讀取的邏輯,即如何讀取非結構化資料。

      • StorageHandler:用於指定和配置自訂Extractor和Outputer的實作類別。

      • Outputer: 自訂輸出資料Outputer,用來實現自訂輸出資料的邏輯,即如何寫出非結構化資料。

  3. 建立Extractor成功後,在編輯介面開發Java程式。代碼框中模板已自動填滿架構代碼,只需要自行編寫需要的邏輯代碼即可。

通過單元測試調試Extractor和Outputter

您可以參照examples目錄下的單元測試樣本,編寫測試案例。樣本

打包上傳

調試成功之後,將Java程式打成JAR包,並作為資源上傳至MaxCompute服務端。詳情請參見打包、上傳和註冊

查詢非結構化資料

  1. Project地區,按右鍵scripts,選擇new > MaxCompute SQL 指令碼

    添加指令碼

  2. Script Name後輸入SQL指令碼名稱,MaxCompute Project中選擇執行指令碼的MaxCompute專案,單擊OK

    建立指令碼

  3. 在編輯器中輸入建立外部表格的SQL語句,並單擊運行表徵圖,完成外部表格建立。

  4. 建立一個MaxCompute SQL指令碼,輸入如下查詢語句,並單擊運行表徵圖,查詢資料。

    查詢

相關文檔

樣本:通過自訂解析器建立OSS外部表格