すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:DSSMベクトルリコール

最終更新日:Jul 22, 2024

このトピックでは、カスタマイズされた推奨アルゴリズムによって生成されたDeep Structured Semantic Model (DSSM) のベクトルリコールについて説明します。

前提条件

フィーチャエンジニアリングワークフローが実行され、ベクトルリコール用のデータセットが生成されます。 詳細については、「機能エンジニアリング」をご参照ください。

  • rec_sln_demo_user_table_preprocess_all_feature_v2

  • rec_sln_demo_item_table_preprocess_all_feature_v2

  • rec_sln_demo_behavior_table_preprocess_v2

手順

  1. 機械学習デザイナーページへ

    1. Machine Learning Platform for AI (PAI) コンソールにログインします。

    2. 左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。

    3. 左側のナビゲーションウィンドウで、モデルの開発とトレーニング> 視覚化モデリング (デザイナー) を選択します。

  2. パイプラインの作成

    1. [Visualized Modeling (Designer)] ページで、[プリセットテンプレート] タブをクリックします。

    2. テンプレートリストの [推奨ソリューション-ベクトルリコール] セクションで、[作成] をクリックします。

    3. [パイプラインの作成] ダイアログボックスで、パラメーターを設定します。 デフォルト値を使用できます。

      Pipeline Data Pathパラメーターに指定された値は、パイプラインのランタイム中に生成された一時データとモデルを格納するために使用されるObject Storage Service (OSS) バケットパスです。

    4. [OK] をクリックします。

      パイプラインの作成には約10秒かかります。

    5. パイプラインリストで、[推奨ソリューション-ベクトルリコール] をダブルクリックしてパイプラインに入ります。

    6. 次の図に示すように、キャンバス上のパイプラインのコンポーネントを表示します。 システムは、プリセットテンプレートに基づいてパイプラインを自動的に作成します。image..png

      コンポーネント番号

      説明

      1

      ベクトルリコール用のサンプルモデルDSSM_Recall。

      2

      特徴生成 (FG) を使用してサンプルモデルを処理します。

      3

      正のサンプルテーブルを作成し、負のサンプリングトレーニングに正のサンプルを使用します。

      4

      数値フィーチャの等しい周波数ビニングを使用して、モデルの境界を設定します。

      5

      列挙フィーチャの一意の値の数を使用して、モデルのembeding_dimおよびhash_bucket_sizeを設定します。

      6

      FGを使用してアイテム機能を処理します。

      7

      FGを使用してユーザー機能を処理します。

      8

      rec_sln_demo_dssm_recall_30d_binning_v1テーブルの結果を要約します。

      とrec_sln_demo_dssm_recall_30d_count_v1テーブル

      フィーチャ構成情報とステップ構成情報を計算します。

      9

      ネガティブサンプリング用のアイテムテーブルを作成します。

      10

      DSSM_Recallモデルの30日間のサンプルデータを離散化して、トレーニングサンプルを生成します。

      11

      コンポーネント8の計算結果に基づいて、EasyRec設定ファイルを指定します。

      12

      モデルトレーニングの前に、コンポーネント11を実行してEasyRec構成ファイルを生成する必要があります。

      13

      分割されたアイテムモデルを使用して、アイテムフィーチャテーブルrec_sln_demo_dssm_recall_item_feature_fg_encoded_v1で推論を実行し、アイテムベクトルを取得します。

      14

      分割されたユーザーモデルを使用して、ユーザー機能テーブルで推論を実行します。rec_sln_demo_dssm_recall_user_feature_fg_encoded_v1を使用してユーザーベクトルを取得します。

      15

      シーケンステーブルを作成し、hit_rateを使用してモデルを評価します。

      説明

      評価日に発生した新規ユーザーと新規アイテムは評価に含まれません。

      18

      hit_rate @ top200を使用してモデルを評価します。

  3. パイプラインを実行し、結果を表示します。

    1. キャンバスの上部ツールバーで、[実行] をクリックします。

    2. パイプラインの実行後、出力を表示します。

      • キャンバス上のコンポーネント18 (18_rec_sln_demo_recall_total_hit_rate_v1_2) を右クリックし、ショートカットメニューから [データの表示] > [hit_rate_detail] を選択すると、ベクターリコールヒット率の詳細が表示されます。 image.png

      • キャンバス上でコンポーネント18 (18_rec_sln_demo_recall_total_hit_rate_v1_2) を右クリックし、[データの表示] > [total_hit_rate] を選択して、ベクトルリコールヒット率を表示します。 image.png