Python用MaxCompute SDKであるPyODPSは、MaxComputeオブジェクトのDataFrameフレームワークと重要な操作を提供し、Pythonを使用したMaxComputeでのデータ分析を容易にします。 PyODPSは、DataWorksまたはオンプレミス環境内で利用できます。 このトピックでは、オンプレミス設定でのPyODPSのインストールプロセスについて説明します。
前提条件
PyODPSをインストールする前に、Python 3.6以降がシステムにインストールされていることを確認してください。 インストール手順については、「Pythonのインストール」をご参照ください。
インストール手順
コマンドラインインターフェイスを開きます。
次のコマンドを実行してPyODPSをインストールします。
pip install pyodps
次のコマンドを実行してインストールを確認します。 結果が返されず、エラーが報告されない場合、インストールは成功しています。
python -c "from odps import ODPS"
多くの場合、CコードのコンパイルエラーであるNumPyやPyArrowなどの依存関係に関連するインストールエラーが発生した場合、エラーは古いバージョンのpipまたはsetuptoolsが原因である可能性があります。 この場合は、次のコマンドを実行してこれらのツールをアップグレードし、インストールを再度実行します。
pip install -U pip setuptools
使用するPythonバージョンがシステムのデフォルトバージョンでない場合は、次のコマンドを実行して必要なバージョンを使用します。
/home/tops/bin/python3.7 -m pip install pyodps
#/home/tops/bin/python3.7 is the path of the installed Python.
インストール中にエラーurllib3 v2.0のみOpenSSL 1.1.1 + が報告された場合、Pythonは現在のurllib3バージョンではサポートされていない古いOpenSSLバージョンを使用します。 この問題を解決するには、PyODPSをインストールする前に、以前のバージョンのurllib3をインストールします。
pip install "urllib3<2.0"
次のステップ
MaxComputeエントリポイントを初期化します。
import os
from odps import ODPS
# Set the environment variable ALIBABA_CLOUD_ACCESS_KEY_ID to your AccessKey ID,
# Set the environment variable ALIBABA_CLOUD_ACCESS_KEY_SECRET to your AccessKey secret,
o = ODPS(
os.getenv('ALIBABA_CLOUD_ACCESS_KEY_ID'),
os.getenv('ALIBABA_CLOUD_ACCESS_KEY_SECRET'),
project='your-default-project',
endpoint='your-end-point',
)
説明:
ALIBABA_CLOUD_ACCESS_KEY_IDおよびALIBABA_CLOUD_ACCESS_KEY_SECRET: Alibaba CloudアカウントのAccessKey IDおよびAccessKey secretでこれらの環境変数を設定します。 環境変数の設定については、「Linux、macOS、およびWindowsシステムでの環境変数の設定」をご参照ください。
説明AccessKey IDとAccessKey secretを直接使用するのではなく、環境変数を使用することをお勧めします。
your-default-projectおよびyour-end-point: これらのプレースホルダーを、デフォルトのプロジェクト名およびエンドポイントの詳細に置き換えます。 リージョン別のエンドポイント情報については、「エンドポイント」をご参照ください。
説明したように設定すると、PyODPSはオンプレミス環境で使用できる状態になります。 ODPSオブジェクトに対して、list
、retrieve
、exist
、create
、delete
などの基本操作を実行できます。 PyODPSの詳細については、「基本操作の概要」および「DataFrameの概要」をご参照ください。
特に指定のない限り、このトピックの「o」オブジェクトはMaxComputeオブジェクトを指します。