特徵函數項
特徵函數項可以用到排序運算式中(大部分僅支援精排運算式),可以通過各種文法及語句的組合得到強大的排序功能。
其中特徵函數參數出現的文檔欄位需根據對應函數文檔提示,建立為索引或屬性.
query_min_slide_window:查詢詞在某個欄位上命中的分詞片語個數與該片語在欄位上最小視窗的比值
1.詳細用法:
query_min_slide_window(field_name,in_order=false, index_name)
2.參數:
field_name:要統計的欄位,該欄位需要為TEXT、中文基礎分詞、自訂分詞、單字分詞、英文分詞、模糊分詞類型。
in_order:true|false,可選,預設為false。表示進行滑動視窗比較時,視窗中片語的順序是否必須和查詢詞中的保持一致。
index_name:field_name對應的索引名稱,可選。
3.傳回值:
float,範圍為[0, 1]
4.適用情境:
情境1:計算查詢詞在title上的最小視窗 query_min_slide_window(title)
情境2:判斷title欄位中是否存在於查詢詞中相同的子序列 if(query_min_slide_window(title, true) > 0.99, 1, 0)
5.注意事項:
函數參數依賴欄位需建立為對應類型索引
可以用於精排運算式;
從字面上衡量query在field_name欄位上緊密度情況;
影響滑動視窗計算的有兩個因素,query在field_name欄位上命中的term的個數和包含這些term的最小視窗。