如果您已開通MaxCompute服務,可以通過MaxComputeSQL分析串連擷取到公開資料集中的表,並查詢這些表,以便您快速試用MaxCompute。本文為您介紹公開資料集資訊,並指導您如何通過MaxComputeSQL分析串連查詢並分析資料。
MaxCompute開放的資料主要是阿里巴巴提供的一個淘寶展示廣告點選率預估資料集,詳細資料欄位資訊請參見天池資料集。資料存放在MaxCompute的MAXCOMPUTE_PUBLIC_DATA專案中。
聲明
MaxCompute提供的公開資料集資料只能用於產品測試,資料將不做周期更新,且不保障資料準確性,因此請您勿用於正式生產。
注意事項
公開資料集通過MaxCompute的特殊授權機制實現公開授權,對所有的MaxCompute使用者開放。在使用過程中,您需要注意:
公開資料集的資料均儲存在一個名為MAXCOMPUTE_PUBLIC_DATA的專案中,但所有使用者並未被加入到該專案中,即非專案空間成員。因此,使用者需要跨專案訪問資料,在編寫SQL指令碼時,必須在表名前指定專案名稱。命令樣本如下。
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.raw_sample limit 10;
說明公開資料集的資料無需付費即可查看,但是執行查詢語句會產生相應計算費用。費用計算規則請參見計算費用。
由於公開資料集需要跨專案訪問,您在DataWorks的資料地圖中無法尋找到公開資料集中的表。
公開資料集
MAXCOMPUTE_PUBLIC_DATA專案資料集中的表詳細資料如下。
股票
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
股票相關表資訊如下:
ods_enterprise_share_basic(股票基本資料表)
ods_enterprise_share_quarter_cashflow(季度現金流報表)
ods_enterprise_share_quarter_growth(季度業務增長資料表)
ods_enterprise_share_quarter_operation(季度財務周轉資料表)
ods_enterprise_share_quarter_profit(季度利潤表)
ods_enterprise_share_quarter_report(季度報表)
ods_enterprise_share_trade_h(股票價格表)
更新周期
提供固定日期分區的資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.ods_enterprise_share_basic WHERE ds ='20170114';
二手房產
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
dwd_prouduct_house_basic_info_out(二手房資料)
更新周期
提供固定日期分區的資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_prouduct_house_basic_info_out WHERE ds= '20170113';
影視及票房
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
影視及票房相關表資訊如下:
dwd_product_movie_basic_info(電影基本資料表)
ods_product_movie_box(票房基本資料表)
更新周期
提供固定日期分區的資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_product_movie_basic_info WHERE ds ='20170112' limit 10;
行政及城鄉區劃代碼
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
dwd_product_areacode_basic_info_2020(2020年行政及城鄉區劃代碼基本資料表)
更新周期
提供固定資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_product_areacode_basic_info_2020 limit 10;
手機號碼歸屬地
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
dwd_product_phoneno_basic_info_2020(2020年手機號歸屬地基本資料表)
更新周期
提供固定資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.dwd_product_phoneno_basic_info_2020 limit 10;
原始樣本骨架
從淘寶網站中隨機抽樣100+萬使用者8天內的展示廣告點選日誌,構成原始的樣本骨架。
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
raw_sample
更新周期
提供固定資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.raw_sample limit 10;
廣告基本資料
涵蓋了raw_sample表中部分廣告的基本資料。
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
ad_feature
更新周期
提供固定資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.ad_feature limit 10;
使用者基本資料
涵蓋了raw_sample中全部使用者的基本資料。
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
user_profile
更新周期
提供固定資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.user_profile limit 10;
使用者的行為日誌
涵蓋了raw_sample中全部使用者22天內的購物行為。
專案名稱
MAXCOMPUTE_PUBLIC_DATA
表名稱
behavior_log
更新周期
提供固定資料,不再做累加式更新。
查詢表結構
DESC MAXCOMPUTE_PUBLIC_DATA.table_name;
查詢樣本
SELECT * FROM MAXCOMPUTE_PUBLIC_DATA.behavior_log limit 10;