全部產品
Search
文件中心

OpenSearch:通用行業/教育行業演算法版對比

更新時間:Jul 13, 2024

教育行業演算法版介紹

教育行業演算法版基於最新演算法功能,貼合搜題情境的痛點和需求,提供了教育行業專屬的搜題智能語義理解能力、向量召回、排序演算法,為線上教育行業搜題業務的搜尋效能和效果準確性提供雙重保障,並有效解決了超大題庫資料導致的搜尋延遲高、資源消耗大、題庫不完整導致的搜尋無結果率高等行業重痛點問題,提供多模態搜尋解決方案。針對教育行業,OpenSearch還提供了向量模型,以實現向量召回及多路搜尋,提高搜題準確率,詳見多路搜尋

二者功能差異

功能列表

通用行業

教育行業演算法版

一站式配置

建立應用後,需要手動建立並配置查詢分析、排序策略和下拉提示模型。

結合教育行業常見搜尋情境,選擇所需能力及功能,同時提供應用結構模板和索引結構模板,實現一鍵式配置,降低新使用者使用門檻。

查詢分析

針對通用行業提供同義字拓展、停用詞省略、拼字錯誤修正、詞權重分析、類目預測等能力。

針對教育通用行業及搜題垂類情境,提供增強版分析器與查詢分析功能。結合教育搜題情境及行業難題,更精準的構建索引並識別使用者查詢意圖,與通用版相比效果更優。

策略排序

建立應用後,需要結合業務情境手動設定並調試相應的排序策略。

在應用結構模板和索引結構模板基礎上,提供教育行業常用基礎排序、業務排序運算式,無需額外配置即可滿足大部分教育行業排序效果需求。

功能迭代

定期更新分析器、查詢分析等系統預設詞典。

根據教育行業的名詞、產品等變化,不斷迭代更新,最佳化原有分詞、查詢分析能力,提供更高時效性的服務保障。

查詢分析效果對比

行業增強版較通用版相比在查詢分析功能上做出了更深入的最佳化,不僅在通用版的基礎上更新了常見bad case,而且針對教育行業集各家之所長,豐富已有詞庫,如下根據各個功能舉例:

  • 分詞:(以空格分詞)

query

通用版

行業增強版

Atteno's clockwehaveourbreak.

Atteno ' s clockwehaveourbreak .

At ten o'clock we have our break .

BeforeIgottonthebusstop,thebushadalreadyleft.

BeforeIgottonthebusstop , thebushadalreadyleft .

Before I got to the bus stop , the bus had already left .

Itis20yuan.

Itis 20 yuan .

It is 20 yuan .

minusfrac12xmsup3yplus3xymsup3minus5x

minusfrac 12 xmsup 3 yplus 3 xymsup 3 minus 5 x

minus frac 12 x msup 3 y plus 3 xy msup 3 minus 5 x

adequal2,bcequal4

adequal 2 , bcequal 4

ad equal 2 , bc equal 4

矩形leftoabcright的頂點leftoright

矩形 leftoabcright 的頂點 leftoright

矩形 left oabc right 的頂點 left o right

注意事項

  • 教育行業演算法版應用的建立流程可以參考文檔:教育行業演算法版

  • 獨享通用版應用可轉為行業增強版行業增強版應用不可轉為通用版;

  • 教育行業演算法版僅適用於獨享型應用;

  • 如果是共用型應用變規格到獨享型再進行教育行業演算法版適配,需要線上應用規格與執行個體規格一致(同為獨享型)後再做教育行業演算法版適配操作;

  • 應用結構中務必添加欄位標籤所對應的欄位名稱,否則會報錯;

image

  • 索引結構中務必添加索引標籤所對應的索引名稱,否則不能進行下一步:

image