このトピックでは、etrecに基づいてu2I2Iリコールを実装する方法について説明します。
データセット
pai_online_project.rec_sln_demo_behavior_table
パラメーター | データ型 | 説明 |
request_id | BIGINT | トラッキングポイントまたはリクエストのID。 |
user_id | BIGINT | ユーザーの一意のID。 |
exp_id | STRING | 実験ID。 |
page | STRING | ページ。 |
net_type | STRING | ネットワークタイプ。 |
event_time | BIGINT | 動作が発生した時刻。 |
item_id | BIGINT | アイテムID。 |
event | STRING | 動作のタイプ。 |
プレイタイム | DOUBLE | 再生時間または読み取り時間 |
ds | STRING | テーブル内のパーティション列の名前。 |
注意事項
機械学習デザイナーページへ
Machine Learning Platform for AI (PAI) コンソールにログインします。
左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。
左側のナビゲーションウィンドウで、モデルの開発とトレーニング> 視覚化モデリング (デザイナー) を選択します。
パイプラインの作成
[Visualized Modeling (Designer)] ページで、[プリセットテンプレート] タブをクリックします。
テンプレートリストの [推奨ソリューション-Etrecリコール] セクションで、[作成] をクリックします。
[パイプラインの作成] ダイアログボックスで、パラメーターを設定します。 デフォルト値を使用できます。
Pipeline Data Pathパラメーターに指定された値は、パイプラインのランタイム中に生成された一時データとモデルを格納するために使用されるObject Storage Service (OSS) バケットパスです。
[OK] をクリックします。 パイプラインの作成には約10秒かかります。
パイプラインリストで、[推奨ソリューション-Etrecリコール] をダブルクリックしてパイプラインに入ります。
次の図に示すように、キャンバス上のパイプラインのコンポーネントを表示します。 システムは、プリセットテンプレートに基づいてパイプラインを自動的に作成します。
コンポーネント番号
説明
1
行動の重み。
2
Item-to-Itemトレーニングのトレーニングサンプルを30日間準備します。
3
U2Iトリガーの精度を向上させるために、ユーザーが操作したアイテムに対して加重計算を実行します。
4
協調フィルタリングモデルErecI2Iをトレーニングします。
5
EtrecI2IスコアをKKV形式のパーティションテーブルに分割します。
6
U2IトリガーテーブルをI2Iテーブルに関連付け、U2I2Iリコールの上位500結果を計算します。
パイプラインを実行し、結果を表示します。
グローバル変数を指定します。
キャンバスの上部ツールバーで、[実行] をクリックします。
パイプラインの実行後、DataWorksコンソールでMaxComputeテーブルrec_sln_demo_etrec_u2i2i_score_v1を表示します。 詳細については、「テーブルの詳細の表示」をご参照ください。