全部產品
Search
文件中心

Platform For AI:DSSM向量召回

更新時間:Jul 13, 2024

本文為您介紹推薦解決方案產生的DSSM(Deep Structured Semantic Model)向量召回。

前提條件

已運行推薦解決方案-特徵工程工作流程範本產生向量召回的資料集,具體操作請參見特徵工程

  • rec_sln_demo_user_table_preprocess_all_feature_v2

  • rec_sln_demo_item_table_preprocess_all_feature_v2

  • rec_sln_demo_behavior_table_preprocess_v2

實現向量召回

  1. 進入Designer頁面。

    1. 登入PAI控制台

    2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應的工作空間。

    3. 在工作空間頁面的左側導覽列選擇模型開發與訓練 > 可視化建模(Designer),進入Designer頁面。

  2. 構建工作流程

    1. Designer頁面,單擊預置模板頁簽。

    2. 在模板列表的推薦解決方案-向量召回地區,單擊建立

    3. 建立工作流程對話方塊,配置參數(可以全部使用預設參數)。

      其中: 工作流程資料存放區配置為OSS Bucket路徑,用於儲存工作流程運行中產出的臨時資料和模型。

    4. 單擊確定

      您需要等待大約十秒鐘,工作流程可以建立成功。

    5. 在工作流程列表,雙擊推薦解決方案-向量召回工作流程,進入工作流程。

    6. 系統根據預置的模板,自動構建工作流程,如下圖所示。image..png

      組件編號

      描述

      1

      DSSM_Recall向量召回模型樣本。

      2

      使用FG模組編碼樣本,產出DSSM_Recall向量召回模型的樣本。

      3

      建立正樣本表,負採樣時使用正樣本參與訓練。

      4

      統計數值類特徵的等頻分箱,用於設定模型的boundaries(邊界)。

      5

      統計枚舉類特徵的唯一值數,用於設定模型的embedding_dimhash_bucket_size

      6

      使用FG編碼Item特徵。

      7

      使用FG編碼User特徵。

      8

      匯總rec_sln_demo_dssm_recall_30d_binning

      _v1表和rec_sln_demo_dssm_recall_30d_

      count_v1表結果,計算Feature配置資訊和Step配置資訊。

      9

      建立物品表用作負採樣。

      10

      打散DSSM_Recall模型的30天樣本資料形成訓練樣本。

      11

      根據組件編號8節點的計算結果,在EasyRec設定檔中填充配置資訊。

      12

      模型訓練需要先執行一次組件編號11節點,產生EasyRec設定檔。

      13

      使用切分後的物品模型,對物品特徵表進行推理。rec_sln_demo_dssm_recall_item_feature_fg_encoded_v1,得到物品向量。

      14

      使用切分後使用者模型,推理使用者特徵表 rec_sln_demo_dssm_recall_user_feature_fg_encoded_v1,得到使用者向量。

      15

      建立序列表,用做hit_rate評估。

      說明

      評估當天出現的新使用者及新商品不參與評估。

      18

      召回模型使用hit_rate@top200進行評估,用於評估推薦系統的召回階段的效能。

  3. 運行工作流程並查看輸出結果。

    1. 單擊畫布上方的運行

    2. 工作流程運行結束後,查看輸出結果。

      • 按右鍵畫布中組件編號為18的組件(18_rec_sln_demo_recall_total_hit_rate_v1_2),在捷徑功能表,單擊查看資料 > hit_rate_detail。即可查看向量召回評估詳情結果hit_rate_detailimage.png

      • 按右鍵畫布中編號為18的組件(18_rec_sln_demo_recall_total_hit_rate_v1_2),在捷徑功能表,單擊查看資料 > total_hit_rate,即可查看向量召回評估值total_hit_rateimage.png