PyODPS是MaxCompute的Python版本的SDK,提供對MaxCompute對象的基本操作及DataFrame架構,協助您在MaxCompute上使用Python進行資料分析,支援在DataWorks或本地環境上使用。本文為您介紹在本地環境上使用PyODPS時,如何安裝PyODPS。
前提條件
安裝PyODPS環境前,您需要安裝3.6或以上版本的Python。安裝方式請參見安裝Python。
安裝步驟
進入命令列。
執行如下命令安裝PyODPS。
pip install pyodps
執行如下命令檢查安裝是否成功。若無傳回值和報錯資訊表示安裝成功。
python -c "from odps import ODPS"
如果在安裝過程中出現numpy或者pyarrow等依賴包安裝錯誤,通常顯示為C代碼編譯錯誤,這可能是您的pip或者setuptools版本過低導致,可以先升級pip和setuptools的版本,再嘗試安裝。
pip install -U pip setuptools
如果您使用的Python不是系統預設的Python版本,您可以執行如下命令以使用您需要的Python版本。
/home/tops/bin/python3.7 -m pip install pyodps
#/home/tops/bin/python3.7為安裝的python路徑
如果您在安裝過程中遇到urllib3 v2.0 only supports OpenSSL 1.1.1+的報錯,說明您的Python使用了較舊版本的OpenSSL,而試圖安裝的依賴urllib3不支援這個OpenSSL版本,此時需要先安裝舊版urllib3,此後再安裝PyODPS。
pip install "urllib3<2.0"
後續步驟
初始化ODPS入口。
import os
from odps import ODPS
# 確保 ALIBABA_CLOUD_ACCESS_KEY_ID 環境變數設定為使用者 Access Key ID,
# ALIBABA_CLOUD_ACCESS_KEY_SECRET 環境變數設定為使用者 Access Key Secret,
o = ODPS(
os.getenv('ALIBABA_CLOUD_ACCESS_KEY_ID'),
os.getenv('ALIBABA_CLOUD_ACCESS_KEY_SECRET'),
project='your-default-project',
endpoint='your-end-point',
)
其中:
ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET:需將該環境變數設定為您的阿里雲帳號的AccessKey ID和 AccessKey Secret。環境變數設定方法請參見在Linux、macOS和Windows系統配置環境變數。
說明不建議直接使用AccessKey ID和 AccessKey Secret字串。
your-default-project和your-end-point:需替換為您設定的預設專案名稱與Endpoint資訊,各地區的Endpoint請參見Endpoint。
完成上述配置後,您就可以在本地環境中使用PyODPS,例如對於ODPS對象的基本操作list
、get
、exist
、create
、delete
等,更多PyODPS的使用指導請參見基本操作概述、DataFrame概述。
如無特殊說明,文檔中的o對象即為ODPS對象。