PyODPS提供了DataFrame API,它提供了類似Pandas的介面,但是能充分利用MaxCompute的計算能力。同時能在本地使用同樣的介面,用Pandas進行計算。
- 快速入門:為您介紹如何建立和操作DataFrame對象,以及使用Dataframe完成基本的資料處理。
- 建立DataFrame:為您介紹如何建立DataFrame,用於引用資料來源。
- Sequence:為您介紹Sequence。Sequence Expr代表二維資料集中的一列。SequenceExpr只可以從一個Collection中擷取,不支援手動建立SequenceExpr。
- Collection:為您介紹Collection。CollectionExpr中包含針對二維資料集的列操作、篩選、變換等大量操作。
- 執行:為您介紹DataFrame操作支援的執行方法。
- MapReduce API:本文為您介紹DataFrame下MapReduce API的使用。
- 列運算:本文為您介紹DataFrame API中的列運算。
- 彙總操作:本文為您介紹DataFrame支援的彙總操作以及如何?分組彙總、編寫自訂彙總。
- 排序、去重、採樣、資料變換:本文為您介紹DataFrame對象執行排序、去重、採樣、資料變換操作。
- 資料合併:本文向您介紹DataFrame支援的資料表的JOIN操作、UNION操作等資料合併操作。
- 視窗函數:本文為您介紹DataFrame API支援使用視窗函數。
- 繪圖:本文為您介紹PyODPS DataFrame提供的繪圖方法。
- 調試指南:由於PyODPS DataFrame本身會對整個操作執行最佳化,為了更直觀地反應整個過程, 您可以使用可視化的方式顯示整個運算式的計算過程。本文為您介紹DataFrame的調試過程。