すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:モデル予測

最終更新日:Jul 22, 2024

このコンポーネントを使用して、EasyRecモデルに対するオフライン予測を実行できます。

前提条件

モデルトレーニングコンポーネントを使用してモデルをトレーニングしました。 詳細については、「モデルトレーニング」をご参照ください。

Machine Learning Designerでコンポーネントを構成する

  • 入力ポート

ポート (左から右)

推奨上流コンポーネント

PAIコマンドのパラメータ

必須

入力モデル

saved_model_dir

入力テーブル

  • データ型: MaxComputeテーブル

  • サポートされているコンポーネント: SQL ScriptおよびRead Table

input_table

  • コンポーネントパラメータ

タブ

パラメーター

必須

説明

PAIコマンドのパラメータ

デフォルト値

パラメーター設定

入力フィーチャ列

不可

トレーニング用に入力テーブルから選択されたフィーチャ列。 このパラメーターと [除外列] パラメーターを同時に指定することはできません。

selected_cols

デフォルト値なし

除外列

不可

入力テーブルから除外する列。 このパラメーターと [フィーチャ列の入力] パラメーターを同時に指定することはできません。

excluded_cols

デフォルト値なし

予約済み列

不可

予約する生成された列の名前。

reserved_cols

デフォルト値なし

出力列

不可

MaxComputeテーブルの出力列。

output_cols

probs double

miniBatchサイズ

不可

ミニバッチのサイズ。バッチに含まれるサンプルの最小数を示します。

batch_size

1024

アルゴリズムのバージョンの指定

このパラメーターは、[詳細オプション] を選択した場合に使用できます。

実行するアルゴリズムパッケージを選択します。

  1. TARパッケージを生成します。 詳細については、EasyRecドキュメントの「リリースとアップグレード」をご参照ください。

  2. TARパッケージをOSSパスにアップロードします。 詳細については、「オブジェクトのアップロード」をご参照ください。

  3. アップロードしたTARパッケージを選択します。

スクリプト

デフォルト値なし

チューニング

労働者数

不可

ワーカーノードの数。

clusterパラメーターとして渡されます。

1

ワーカーCPU

不可

各ワーカーのCPU番号。 値1は1つのCPUコアを示します。

6

ワーカーメモリ

不可

各ワーカーノードのメモリサイズ。 100の値は100 MBを示します。

30000

ワーカーGPU

不可

ほとんどのEasyRecトレーニングではGPUは必要ありません。

0

  • 出力ポート

ポート (左から右)

データ型

PAIコマンドのパラメータ

出力テーブル

MaxComputeテーブル

output_table

PAIコマンドとパラメータ

PAI -project algo_public -name easy_rec_ext 
    -Darn="acs:ram::xxx:role/aliyunodpspaidefaultrole" 
    -Dbatch_size="1024" 
    -Dbuckets="oss://rec_sln_demo/" 
    -Dcluster="{\"worker\": {\"count\": 1, \"cpu\": 600, \"gpu\": 0, \"memory\": 30000}}" 
    -Dcmd="predict" 
    -Dinput_table="odps://pai_hangzhou/tables/pai_temp_flow_inpwi02on49ooub78p_node_dn3y3lvucm862jr71n_outputTable" 
    -Dlifecycle="28" 
    -DossHost="oss-cn-hangzhou-internal.aliyuncs.com" 
    -Doutput_cols="item_emb string" 
    -Doutput_table="odps://pai_hangzhou/tables/pai_temp_flow_da1nuzwmbdfyw5kajy_node_5jgko0vlrjiwawp6y8_outputTable" 
    -Dreserved_cols="item_id" 
    -Dsaved_model_dir="oss://rec_sln_demo/EasyRec/deploy/rec_sln_demo_dssm_recall_v1/20230425/export/final/item" 
    -Dscript="oss://rec_sln_demo/easy_rec_ext_0.6.1_res.tar.gz";

パラメーター

必須

説明

saved_model_dir

エクスポートされたモデルファイルのディレクトリ。

input_table

入力テーブルの名前。

output_table

不可

自動的に作成される出力テーブル。

reserved_cols

不可

output_tableにコピーされる列。 複数の列はコンマ (,) で区切ります。

output_cols

不可

出力テーブルの列の名前とデータ型。 複数の列はコンマ (,) で区切ります。

batch_size

不可

ミニバッチのサイズ。

arn

arnの値を取得するには、次の操作を実行します。PAIコンソールにログインします。 左側のナビゲーションウィンドウで、[アクティベーションと権限付与] > [依存サービス] を選択します。 [デザイナー] セクションでOSSを見つけ、[操作] 列の [権限の表示] をクリックします。

バケット

モデルファイルが存在するバケットとモデルが保存されているバケット。 複数のバケットを使用する場合は、複数のバケットをコンマ (,) で区切ります。 例: oss:// xxxx/,oss:// xxxx/

ossHost

OSSのエンドポイント。 エンドポイントの詳細については、「リージョンおよびエンドポイント」をご参照ください。

スクリプト

不可

EasyRec TARパッケージが保存されているOSSバケットのパス。 EasyRec TARパッケージの設定方法の詳細については、EasyRecドキュメントの「リリースとアップグレード」をご参照ください。

例:

  1. 次の図に示すように、パイプラインを作成します。 d97c947a2a84a25c45582ba08920423c..png

    セクション

    説明

    ① ② ③

    パラメーターの設定方法の詳細については、「モデルトレーニングの」をご参照ください。

    Model TrainingコンポーネントをModel Predictionの左側の入力ポートに接続し、Read Table-2コンポーネントをModel Predictionの右側の入力ポートに接続します。 [除外列][clk] に設定し、[予約列]user_idおよび [pid] を選択します。

  2. パイプラインの実行後、モデル予測コンポーネントを右クリックし、[データの表示] > [出力テーブル] を選択します。 image..png

詳細については、「Vector Recall」の「13_rec_sln_demo_dssm_recall_item_embedding_v1」をご参照ください。