全部產品
Search
文件中心

OpenSearch:人氣模型

更新時間:Jul 13, 2024

人氣模型是什麼

人氣模型屬於離線計算的模型,是淘寶搜尋最基礎的排序演算法模型。人氣模型會計算量化出每個商品的靜態品質及受歡迎的程度的值,這個值稱之為商品人氣分。雖然人氣模型來自淘寶搜尋業務,但其實這個模型對於其他的搜尋情境也有普適性,在非商品搜尋情境中通過人氣模型也可以計算出被索引的文檔的受歡迎程度。

模型訓練使用的特徵

  • 實體維度:商品/doc、品牌、商家、葉子類目、一級類目等。

  • 時間維度:1天、3天、7天、14天、30天、時間衰減加權等。

  • 行為維度:曝光、點擊、收藏、加購、購買、評論、點贊等。

  • 統計維度:數量、人數、頻率、點擊率、轉化率等。

每個特徵從以上4個維度中各取一到兩個進行組合,再從歷史資料中統計該組合特徵最終的特徵值。比如,商品(實體)最近1天(時間)的曝光(行為)量(統計指標);商品所在店鋪(實體)最近30天(時間)的銷量(行為類型+統計維度)等等。由以上方法產生的特徵數量級相當於4個維度笛卡爾積。

使用步驟

  1. 建立模型

  2. 訓練模型並檢查資料報告

  3. 應用到排序配置-策略管理中

【溫馨提示】:單個應用最多建立5個人氣模型。

建立具體流程

1.建立人氣模型,控制台-->搜尋演算法中心-->排序配置-->人氣模型,點擊建立。

image

按要求填寫模型名點擊確定

image

2.點擊確認後,建立完成頁面如下圖所示。

image

3.點擊排序配置>人氣模型>訓練模型此時狀態會被更新成調度中,等待模型訓練完畢即可。

image

人氣模型詳情

人氣模型詳情頁說明

image.png

基本資料

可查看模型的建立時間狀態最後訓練開始時間以及最新版本狀態

image.png

配置資訊

定時任務:預設開啟並每天訓練一次,也可以編輯定時任務,自訂訓練周期

image.png

image.png

資料校正

資料完整度狀態包含資料可用資料異常

image.png

完整度報告顯示當前應用的完整度等級,具體完整度等級可見:

資料完整度

介紹

晉陞條件

l0

表示資料完全不可用,缺少必要的核心欄位,資料量太少,後續的資料處理不能繼續進行。

l0-->l1:

最近一天ipv數大於100。

l1

表示資料的核心欄位已經具備,滿足模型訓練條件。

說明

相關API/SDK參考:演算法執行個體