ソリューションの実装方法 - ランク付け - Platform For AI

「おすすめソリューション - ランク」を使用して、特徴エンジニアリングによって処理されたユーザー特徴テーブル、アイテム特徴テーブル、およびユーザー行動テーブルに基づいてランキングモデルをトレーニングし、そのランキングモデルをオンラインサービスとしてデプロイできます。このトピックでは、ランク付けの実装方法について説明します。

前提条件

特徴エンジニアリングワークフローが実行され、ランキング用のデータセットが生成されていること。詳細については、「特徴エンジニアリング」をご参照ください。

rec_sln_demo_user_table_preprocess_all_feature_v2
rec_sln_demo_item_table_preprocess_all_feature_v2
rec_sln_demo_behavior_table_preprocess_v2

手順

可視化モデリング (Designer) ページに移動します。
1. Machine Learning Platform for AI (PAI) コンソールにログインします。
2. 左側のナビゲーションウィンドウで [Workspaces] をクリックします。 [Workspaces] ページで、管理するワークスペースの名前をクリックします。
3. 左側のナビゲーションウィンドウで、[Model Training > Visualized Modeling (Designer)] を選択します。 [Visualized Modeling (Machine Learning Designer)] ページが表示されます。

パイプラインを作成します。

[Visualized Modeling (Designer)] ページで、[プリセットテンプレート] タブをクリックします。
テンプレートリストで、[Recommended Solutions - Rank] セクションの [作成] をクリックします。
[パイプラインの作成] ダイアログボックスで、次のパラメーターを設定します。デフォルト値を使用できます。
[データストレージ] は、特徴エンジニアリングと同じ OSS バケットパスを使用して、ワークフローの実行中に生成された一時データとモデルファイルを保存します。
[OK] をクリックします。パイプラインの作成には約 10 秒かかります。

次の図に示すように、キャンバスでパイプラインのコンポーネントを表示します。プリセットテンプレートに基づいて、システムがパイプラインを自動的に作成します。

コンポーネント番号	説明
1	サンプルモデル。
2	fg.json ファイルに基づいて、特徴生成 (FG) を使用してサンプルモデルを処理します。
3	数値特徴の等頻度ビニングを使用して、モデルの boundaries を設定します。
4	列挙特徴の一意な値の数を使用して、モデルの embedding_dim と hash_bucket_size を設定します。
5	rec_sln_demo_sorting モデルの 30 日間のサンプルデータを離散化して、トレーニングサンプルを生成します。
6	rec_sln_demo_rec_sln_demo_sorting_30d_binning_v2 テーブルと rec_sln_demo_rec_sln_demo_sorting_30d_count_v2 テーブルの結果を要約して、特徴構成情報とステップ構成情報を計算します。
7	コンポーネント 6 の計算結果に基づいて EasyRec 構成ファイルを指定します。説明このコンポーネントは 1 回だけ実行する必要があります。
8	モデルトレーニングの前に、コンポーネント 7 を実行して EasyRec 構成ファイルを生成する必要があります。