全部產品
Search
文件中心

:中文通用分析器

更新時間:Sep 04, 2024

分析器介紹

中文通用分析器(chn_standard),基於中文語義分詞,適用於全網通用行業的分析器。中文分析器按照檢索單元(最小粒度)進行分詞,並且支援擴充分詞。例如:文檔欄位內容為“菊花茶”,分詞之後的結果為“菊花 茶 花茶”,其中花茶是茶的擴充分詞。

例如:
原始內容:菊花茶 
中文通用分析器:菊花  茶 花茶

分詞幹預

修改進階配置中的chn_standard.dict並發布上線即可進行分詞幹預。分詞幹預的詞條是一個中粒度的詞條,引擎內部會對幹預的詞條再次進行切分成檢索粒度。比如幹預“搜尋引擎”的分詞時,在詞條中添加搜尋引擎,搜尋引擎還會繼續分詞成“搜尋”、“引擎”兩個詞。

注意事項

  • 該分析器只適用於TEXT類型欄位,在配置schema的時候指定分析器為chn_standard。