本文為您介紹推薦解決方案-etrec召回的實現方法。
資料集
pai_online_project.rec_sln_demo_behavior_table
欄位名 | 類型 | 描述 |
request_id | BIGINT | 埋點ID/請求ID |
user_id | BIGINT | 使用者唯一ID |
exp_id | STRING | 實驗ID |
page | STRING | 頁面 |
net_type | STRING | 網路類型 |
event_time | BIGINT | 行為時間 |
item_id | BIGINT | 內容ID |
event | STRING | 行為類型 |
playtime | DOUBLE | 播放時間長度/閱讀時間長度 |
ds | STRING | 分區列名 |
etrec召回
進入Designer頁面
登入PAI控制台。
在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。
在工作空間頁面的左側導覽列選擇模型開發與訓練 > 可視化建模(Designer),進入Designer頁面。
構建工作流程
在Designer頁面,單擊預置模板頁簽。
在模板列表的推薦解決方案-etrec召回地區,單擊建立。
在建立工作流程對話方塊,配置參數(可以全部使用預設參數)。
其中:工作流程資料存放區配置為OSS Bucket路徑,用於儲存工作流程運行中產出的臨時資料和模型。
單擊確定。您需要等待大約十秒鐘,工作流程可以建立成功。
在工作流程列表,雙擊推薦解決方案-etrec召回工作流程,進入工作流程。
系統根據預置的模板,自動構建工作流程,如下圖所示。
組件編號
描述
1
行為權重。
2
準備Item-to-Item30天的訓練樣本。
3
通過對使用者歷史互動的Item進行加權統計,提高了召回U2I Trigger的準確性。
4
EtrecI2I協同過濾模型訓練。
5
EtrecI2I Score拆分成KKV形式的分區表。
6
關聯U2I Trigger和I2I表,計算U2I2I召回Top500的結果。
運行工作流程並查看輸出結果
填寫全域變數
單擊畫布上方的運行。
工作流程運行結束後,在DataWorks上查看MaxCompute表rec_sln_demo_etrec_u2i2i_score_v1,具體操作,請參見查看錶詳情。