全部產品
Search
文件中心

MaxCompute:HISTOGRAM

更新時間:Jun 19, 2024

返回一個Map,Map的Key是輸入input值,Map的Value是input值出現的次數。NULL值將被忽略。

注意事項

升級到MaxCompute 2.0後,產品擴充了部分函數。如果您用到的函數涉及新資料類型(TINYINT、SMALLINT、INT、FLOAT、VARCHAR、TIMESTAMP或BINARY),在使用擴充函數時,需要執行如下語句開啟新資料類型開關:

  • Session層級:如果使用新資料類型,您需要在SQL語句前加上語句set odps.sql.type.system.odps2=true;,並與SQL語句一起提交執行。

  • Project層級:Project Owner可根據需要對Project進行設定,等待10~15分鐘後才會生效。命令如下。

    setproject odps.sql.type.system.odps2=true;

    setproject的詳細說明請參見專案空間操作。關於開啟Project層級資料類型的注意事項,請參見資料類型版本說明

在同一條SQL語句中同時使用多個彙總函式時,如果專案資源不足,會出現記憶體溢出問題,請您根據實際業務情況最佳化SQL或購買計算資源。

命令格式

map<K, bigint> histogram(K input);

參數說明

input:輸入欄位,將作為Map的Key。

傳回值說明

返回構造的Map,描述每個input值出現的次數。

樣本

select histogram(a) from values
    ('hi'), (null), ('apple'), ('pie'), ('apple') t(a);

返回結果如下。

+----------------------------+
| _c0                        |
+----------------------------+
| {"pie":1,"hi":1,"apple":2} |
+----------------------------+

相關函數

HISTOGRAM函數屬於彙總函式,更多將多條輸入記錄進行求平均值、參數彙總的相關函數請參見彙總函式