教育行業演算法版介紹
教育行業演算法版基於最新演算法功能,貼合搜題情境的痛點和需求,提供了教育行業專屬的搜題智能語義理解能力、向量召回、排序演算法,為線上教育行業搜題業務的搜尋效能和效果準確性提供雙重保障,並有效解決了超大題庫資料導致的搜尋延遲高、資源消耗大、題庫不完整導致的搜尋無結果率高等行業重痛點問題,提供多模態搜尋解決方案。針對教育行業,OpenSearch還提供了向量模型,以實現向量召回及多路搜尋,提高搜題準確率,詳見多路搜尋。
二者功能差異
功能列表 | 通用行業 | 教育行業演算法版 |
一站式配置 | 建立應用後,需要手動建立並配置查詢分析、排序策略和下拉提示模型。 | 結合教育行業常見搜尋情境,選擇所需能力及功能,同時提供應用結構模板和索引結構模板,實現一鍵式配置,降低新使用者使用門檻。 |
查詢分析 | 針對通用行業提供同義字拓展、停用詞省略、拼字錯誤修正、詞權重分析、類目預測等能力。 | 針對教育通用行業及搜題垂類情境,提供增強版分析器與查詢分析功能。結合教育搜題情境及行業難題,更精準的構建索引並識別使用者查詢意圖,與通用版相比效果更優。 |
策略排序 | 建立應用後,需要結合業務情境手動設定並調試相應的排序策略。 | 在應用結構模板和索引結構模板基礎上,提供教育行業常用基礎排序、業務排序運算式,無需額外配置即可滿足大部分教育行業排序效果需求。 |
功能迭代 | 定期更新分析器、查詢分析等系統預設詞典。 | 根據教育行業的名詞、產品等變化,不斷迭代更新,最佳化原有分詞、查詢分析能力,提供更高時效性的服務保障。 |
查詢分析效果對比
行業增強版較通用版相比在查詢分析功能上做出了更深入的最佳化,不僅在通用版的基礎上更新了常見bad case,而且針對教育行業集各家之所長,豐富已有詞庫,如下根據各個功能舉例:
分詞:(以空格分詞)
query | 通用版 | 行業增強版 |
Atteno's clockwehaveourbreak. | Atteno ' s clockwehaveourbreak . | At ten o'clock we have our break . |
BeforeIgottonthebusstop,thebushadalreadyleft. | BeforeIgottonthebusstop , thebushadalreadyleft . | Before I got to the bus stop , the bus had already left . |
Itis20yuan. | Itis 20 yuan . | It is 20 yuan . |
minusfrac12xmsup3yplus3xymsup3minus5x | minusfrac 12 xmsup 3 yplus 3 xymsup 3 minus 5 x | minus frac 12 x msup 3 y plus 3 xy msup 3 minus 5 x |
adequal2,bcequal4 | adequal 2 , bcequal 4 | ad equal 2 , bc equal 4 |
矩形leftoabcright的頂點leftoright | 矩形 leftoabcright 的頂點 leftoright | 矩形 left oabc right 的頂點 left o right |
注意事項
教育行業演算法版應用的建立流程可以參考文檔:教育行業演算法版
獨享通用版應用可轉為行業增強版,行業增強版應用不可轉為通用版;
教育行業演算法版僅適用於獨享型應用;
如果是共用型應用變規格到獨享型再進行教育行業演算法版適配,需要線上應用規格與執行個體規格一致(同為獨享型)後再做教育行業演算法版適配操作;
應用結構中務必添加欄位標籤所對應的欄位名稱,否則會報錯;
索引結構中務必添加索引標籤所對應的索引名稱,否則不能進行下一步: