PyODPS是MaxCompute的Python版本的SDK,提供對MaxCompute對象的基本操作及DataFrame架構,協助您在MaxCompute上使用Python進行資料分析,支援在DataWorks或本地環境上使用。本文為您介紹在本地環境上使用PyODPS時,如何安裝PyODPS。
前提條件
安裝PyODPS環境前,您可先查看下Python的版本,建議Python版本為3.6及以上版本,不建議使用2.7及以下版本。
安裝步驟
執行如下命令安裝PyODPS。
pip install pyodps
執行如下命令檢查安裝是否成功。若無傳回值和報錯資訊表示安裝成功。
python -c "from odps import ODPS"
如果您使用的Python不是系統預設的Python版本,安裝完PIP後,您可以執行如下命令進行Python版本切換。
/home/tops/bin/python3.7 -m pip install setuptools>=3.0 #/home/tops/bin/python3.7為安裝的python路徑
後續步驟
建議您安裝以下工具,提升Tunnel上傳的速度: greenlet 0.4.10或以上版本。
初始化ODPS入口。
import os from odps import ODPS # 確保 ALIBABA_CLOUD_ACCESS_KEY_ID 環境變數設定為使用者 Access Key ID, # ALIBABA_CLOUD_ACCESS_KEY_SECRET 環境變數設定為使用者 Access Key Secret, o = ODPS( os.getenv('ALIBABA_CLOUD_ACCESS_KEY_ID'), os.getenv('ALIBABA_CLOUD_ACCESS_KEY_SECRET'), project='your-default-project', endpoint='your-end-point', )
其中:
ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET:需將該環境變數設定為您的阿里雲帳號的AccessKey ID和 AccessKey Secret。
說明不建議直接使用AccessKey ID和 AccessKey Secret字串。
your-default-project和your-end-point:需替換為您設定的預設專案名稱與Endpoint資訊,各地區的Endpoint請參見Endpoint。
完成上述配置後,您就可以在本地環境中使用PyODPS,例如對於ODPS對象的基本操作list
、get
、exist
、create
、delete
等,更多PyODPS的使用指導請參見基本操作概述、DataFrame概述。
說明
如無特殊說明,文檔中的o對象即為ODPS對象。