電商行業演算法版介紹
搜尋效果的好壞在電商行業中直接決定著GMV的轉化,這也是電商企業不斷深耕突破的技術難題。行業演算法版根據多年積累的行業經驗打造了特有的電商行業垂直解決方案,藉助達摩院先進的智能語言處理技術,貼合行業痛點與需求,提供了電商專屬查詢分析能力、內建好行業排序運算式及行業演算法能力,降低接入門檻,實現一鍵式配置,提升接入效率的同時也為企業提供更優質的搜尋效果。
二者功能差異
功能列表 | 通用版 | 行業模板 |
一站式配置 | 建立應用後,需要手動建立並配置查詢分析、排序策略和下拉提示模型。 | 結合電商行業常見搜尋情境,選擇所需能力及功能,同時提供應用結構模板和索引結構模板,實現一鍵式配置,降低新使用者使用門檻。 |
查詢分析 | 針對通用行業提供同義字拓展、停用詞省略、拼字錯誤修正、詞權重分析、類目預測等能力。 | 針對電商通用行業及潮流、母嬰、汽車、餐飲等常用垂類提供增強版分析器與查詢分析功能。結合電商行業商品及使用者特徵,更精準的構建索引並識別使用者查詢意圖,與通用版相比效果更優。 |
策略排序 | 建立應用後,需要結合業務情境手動設定並調試相應的排序策略。 | 在應用結構模板和索引結構模板基礎上,提供電商行業常用基礎排序、業務排序運算式,無需額外配置即可滿足大部分電商行業排序效果需求。 |
功能迭代 | 定期更新分析器、查詢分析等系統預設詞典。 | 根據電商行業的名詞、產品等變化,不斷迭代更新,最佳化原有分詞、查詢分析能力,提供更高時效性的服務保障。 |
查詢分析效果對比
行業演算法版較通用版相比在查詢分析功能上做出了更深入的最佳化,不僅在通用版的基礎上更新了常見bad case,而且針對電商行業集各家之所長,豐富已有詞庫,如下根據各個功能舉例:
分詞:(以空格分詞)
query | 通用版 | 行業增強版 |
漢本萃 紐崔萊 | 漢 本 萃 紐崔萊 | 漢本萃 紐崔萊 |
小金管遮瑕膏 | 小金 管 遮瑕 膏 | 小 金管 遮瑕 膏 |
蘇泊爾空氣炸鍋 | 蘇泊爾 空氣 炸 鍋 | 蘇泊爾 空氣 炸鍋 |
尋夢環遊記吉他 | 尋夢 環 遊記 吉他 | 尋夢 環遊記 吉他 |
炸街西裝套裝 | 炸 街 西裝 套裝 | 炸街 西裝 套裝 |
喜戈洗髮水 | 喜 戈 洗髮 水 | 喜戈 洗髮 水 |
橘朵單色眼影 | 橘 朵 單色 眼影 | 橘朵 單色 眼影 |
實體識別:
query | 通用版 | 行業增強版 |
蘋果 11 殼 女款 | 蘋果:品類 11:數字 殼:普通詞 女款:人群 | 蘋果:品牌 11:數字 殼:品類 女款:人群 |
漢本萃 紐崔萊 | 漢本萃:普通詞 紐崔萊:品牌 | 漢本萃:品牌 紐崔萊:品牌 |
蔬菜苗 | 蔬菜苗:新詞 | 蔬菜苗:品類 |
美瞳 | 美瞳:普通詞 | 美瞳:品類 |
同義字:
query | 通用版 | 行業增強版 |
闊腿褲女2021年新款 | 闊腿褲 女 2021年 新款 | 闊腿褲(腿褲 闊腳褲 甩褲)女 2021年 新款 |
漢本萃紐崔萊 | 漢本萃 紐崔萊 | 漢本萃 紐崔萊(nutrilite) |
運動鞋女跑步鞋 | 運動鞋 女 跑步鞋(跑鞋) | 運動鞋 女 跑步鞋(跑鞋 慢跑鞋 健步鞋) |
蘇泊爾空氣炸鍋 | 蘇泊爾 空氣 炸鍋 | 蘇泊爾(supor 蘇泊兒 蘇伯爾) 空氣 炸鍋 |
洗碗機西門子 | 洗碗機 西門子 | 洗碗機 西門子(siemens) |
拼字錯誤修正:
query | 通用版 | 行業增強版 |
無剛圈文胸 | 無剛圈文胸 | 無鋼圈文胸 |
putizhu | putizhu | 菩提珠 |
baisiwa | baisiwa | 白絲襪 |
紅色baobao 女包 | 紅色baobao 女包 | 紅色包包 女包 |
sushe 冰箱 | sushe 冰箱 | 宿舍 冰箱 |
chuanglian歐美 | chuanglian歐美 | 窗帘歐美 |
孕婦裝dama | 孕婦裝dama | 孕婦裝大碼 |
u型枕 nami | u型枕 nami | u型枕 納米 |
按磨器 腰部 | 按磨器 腰部 | 按摩器 腰部 |
yami | yami | 雅蜜 |
yingyang | yingyang | 營養 |
jiankang | jiankang | 健康 |
呀高 | 呀高 | 牙膏 |
獨享型轉行業演算法版
行業演算法版支援應用從獨享型通用行業轉為電商行業演算法版,具體操作下:
(1)在執行個體管理頁面選擇一個通用版應用,點擊 更多,選擇轉為行業增強版,會跳轉到售賣頁:
(2) 升級為電商行業演算法版後,在執行個體管理下找到對應的執行個體點擊詳情,點擊 行業模板適配,對應用進行變更:
(3)應用變更,步驟為:功能選擇 --> 應用結構, --> 索引結構 --> 資料來源:
1)功能選擇:模板功能選擇包括查詢分析、排序策略和周邊服務:
2)應用結構:支援自動產生應用結構
注意:欄位標籤用於快速產生索引結構,查詢分析規則和排序策略,請務必在應用結構中添加欄位標籤所對應的欄位名稱,操作見如上截圖。
3)索引結構:
注意:索引標籤用於快速產生查詢分析規則,排序策略,請務必在索引結構中添加索引標籤所對應的索引名稱,操作見如上截圖。
4)資料來源:(下面以RDS資料來源為例進行說明)
(5)搜尋結果排序:
如果排序運算式中引用的欄位有變更,需要編輯或者刪除失效的排序運算式。
(6)修改查詢分析:
修改查詢分析時需注意以下3點:
原先查詢分析引用的索引類型改成電商增強;
查詢分析中實體識別如有引用幹預詞典,幹預詞典的類型也需要改成行業-電商通用分析的分析器;
(7)修改配置完成後,選擇是否同步增量資料以及是否需要線下版本變更後自動發布上線:
如果此處選擇了“不同步,線下應用將全新推送資料”,那麼在版本構建期間如有增量資料進入應用,則不會同步到構建中的版本裡。
如果此處選擇了“不需要”自動發布上線,那麼後續手動切換,需要在線下應用詳情頁中點擊“發布上線”。
(8)配置完成及測試:
注意事項
電商行業演算法板的建立流程可參考文檔:電商行業演算法版
獨享型通用行業應用可轉為電商行業演算法版,此操作無法復原;
電商行業演算法版僅適用於獨享型應用;
如果是共用型應用需變規格到獨享型再進行電商行業演算法版適配,需要線上應用規格與執行個體規格一致(同為獨享型)後再進行電商行業演算法版適配操作;
應用結構中務必添加欄位標籤所對應的欄位名稱,否則會報錯;
索引結構中務必添加索引標籤所對應的索引名稱,否則不能進行下一步: