本文為您介紹PyODPS提供的配置選項。
您可以通過odps.options
獲得PyODPS提供的配置選項。
from odps import options
# 設定所有輸出表的生命週期(lifecycle選項)。
options.lifecycle = 30
# 使用Tunnel下載string類型時使用bytes(tunnel.string_as_binary選項)。
options.tunnel.string_as_binary = True
# 用ODPS執行PyODPS DataFrame時,可以參照下面dataframe相關配置,在sort時將limit設定為一個比較大的值。
options.df.odps.sort.limit = 100000000
通用配置
選項 | 說明 | 預設值 |
end_point | ODPS Endpoint。 | None |
default_project | 預設Project。 | None |
log_view_host | LogView主機名稱。 | None |
log_view_hours | LogView保持時間(小時)。 | 24 |
local_timezone | 使用的時區。True表示本地時間,False表示UTC,也可用 | None |
lifecycle | 所有表生命週期。 | None |
temp_lifecycle | 暫存資料表生命週期。 | 1 |
biz_id | 使用者ID。 | None |
verbose | 是否列印日誌。 | False |
verbose_log | 記錄接收。 | None |
chunk_size | 寫入緩衝區大小。 | 1496 |
retry_times | 請求重試次數。 | 4 |
pool_connections | 緩衝在串連池的串連數。 | 10 |
pool_maxsize | 串連池最大容量。 | 10 |
connect_timeout | 連線逾時。 | 5 |
read_timeout | 讀取逾時。 | 120 |
api_proxy | APIProxy 伺服器。 | None |
data_proxy | 資料Proxy 伺服器。 | None |
completion_size | 對象補全列舉條數限制。 | 10 |
notebook_repr_widget | 使用互動式圖表。 | True |
sql.settings | ODPS SQL運行全域hints。 | None |
sql.use_odps2_extension | 啟用MaxCompute 2.0語言擴充。 | False |
資料上傳下載配置
選項 | 說明 | 預設值 |
tunnel.endpoint | Tunnel的Endpoint。 | None |
tunnel.use_instance_tunnel | 使用Instance Tunnel擷取執行結果。 | True |
tunnel.limit_instance_tunnel | 是否限制Instance Tunnel擷取結果的條數。 | None |
tunnel.string_as_binary | 在STRING類型中使用Bytes而非Unicode。 | False |
DataFrame配置
選項 | 說明 | 預設值 |
interactive | 是否在互動式環境。 | 根據檢測值。 |
df.analyze | 是否啟用非ODPS內建函數。 | True |
df.optimize | 是否開啟DataFrame全部最佳化。 | True |
df.optimizes.pp | 是否開啟DataFrame謂詞下推最佳化。 | True |
df.optimizes.cp | 是否開啟DataFrame列剪裁最佳化。 | True |
df.optimizes.tunnel | 是否開啟DataFrame使用Tunnel最佳化執行。 | True |
df.quote | ODPS SQL後端是否用 | True |
df.libraries | DataFrame運行使用的第三方庫(資源名)。 | None |
df.supersede_libraries | 使用自行上傳的NumPy替換服務中的版本。 | False |
df.odps.sort.limit | DataFrame有排序操作時,預設添加的Limit條數。 | 10000 |
機器學習配置
選項 | 說明 | 預設值 |
ml.xflow_settings | Xflow執行配置。 | None |
ml.xflow_project | 預設Xflow工程名。 | algo_public |
ml.use_model_transfer | 是否使用ModelTransfer擷取模型 PMML。 | False |
ml.model_volume | 在使用ModelTransfer時使用的 Volume名稱。 | pyodps_volume |