推奨ソリューション-ランクを使用して、機能エンジニアリングで処理されたユーザー機能テーブル、アイテム機能テーブル、およびユーザー行動テーブルに基づいてランキングモデルをトレーニングし、ランキングモデルをオンラインサービスとして展開できます。 このトピックでは、ランキングの実装方法について説明します。
前提条件
フィーチャエンジニアリングワークフローが実行され、ランク付けのためのデータセットが生成される。 詳細については、「機能エンジニアリング」をご参照ください。
rec_sln_demo_user_table_preprocess_all_feature_v2
rec_sln_demo_item_table_preprocess_all_feature_v2
rec_sln_demo_behavior_table_preprocess_v2
注意事項
視覚化モデリング (デザイナー) ページに移動します。
Machine Learning Platform for AI (PAI) コンソールにログインします。
左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。
左側のナビゲーションウィンドウで、[Model TrainingVisualized Modeling (Designer)] を選択します。 視覚化モデリング (機械学習デザイナー) ページが表示されます。
パイプラインを作成します。
[Visualized Modeling (Designer)] ページで、[プリセットテンプレート] タブをクリックします。
テンプレートリストで、[推奨ソリューション-ランク] セクションの [作成] をクリックします。
[パイプラインの作成] ダイアログボックスで、次のパラメーターを設定します。 デフォルト値を使用できます。
Pipeline Data Pathパラメーターに指定された値は、パイプラインのランタイム中に生成された一時データとモデルを格納するために使用されるObject Storage Service (OSS) バケットパスです。
[OK] をクリックします。 パイプラインの作成には約10秒かかります。
次の図に示すように、キャンバス上のパイプラインのコンポーネントを表示します。 システムは、プリセットテンプレートに基づいてパイプラインを自動的に作成します。
コンポーネント番号
説明
1
サンプルモデル。
2
FG. jsonファイルに基づいて、フィーチャ生成 (fg) を使用してサンプルモデルを処理します。
3
数値フィーチャの等しい周波数ビニングを使用して、モデルの境界を設定します。
4
列挙フィーチャの一意の値の数を使用して、モデルのembeding_dimおよびhash_bucket_sizeを設定します。
5
rec_sln_demo_sortingモデルの30日間のサンプルデータを離散化して、トレーニングサンプルを生成します。
6
rec_sln_demo_rec_sln_demo_sorting_30d_binning_v2テーブルとrec_sln_demo_rec_sln_demo_sorting_30d_count_v2テーブルの結果を要約して、フィーチャ構成情報とステップ構成情報を計算します。
7
コンポーネント6の計算結果に基づいて、EasyRec設定ファイルを指定します。
説明このコンポーネントを1回だけ実行する必要があります。
8
モデルトレーニングの前に、コンポーネント7を実行してEasyRec構成ファイルを生成する必要があります。