特徵函數項
特徵函數項可以用到排序運算式中(大部分僅支援精排運算式),可以通過各種文法及語句的組合得到強大的排序功能。
其中特徵函數參數出現的文檔欄位需根據對應函數文檔提示,建立為索引或屬性.
text_relevance : 關鍵詞在欄位上的文本匹配度。
1.詳細用法:
text_relevance(field_name,index_name,params )
2.參數:
field_name:欄位名,必選,該欄位需要為中文基礎分詞、中文基礎分詞、自訂分詞、單字分詞等類型,並且配置了索引欄位。
index_name:field_name對應的索引名稱,可選。
params :算分邏輯,可選預設為sum,true表示由查詢分析擴充出的索引分組文檔打分取max,false表示由查詢分析擴充出的索引分組文檔打分取sum。(例,query=index:'肯德基',同義字擴充:query=index:'肯德基' OR index:'kfc')。
3.傳回值:
float,範圍為[0,1]
4.適用情境:
情境1:在精排中對title和body進行文本算分,權重比為3:1 text_relevance(title)*3+text_relevance(body)
情境2:在精排中對title欄位對應的索引title_index進行文本算分,並且查詢分析擴充後的索引分組文本打分結果取sum,text_relevance(title,title_index,false)
5.注意事項:
函數參數依賴欄位需建立為索引
主要衡量角度:命中詞在query中所佔比重;命中詞在欄位中所佔比重;命中詞在欄位中出現的頻率;欄位中命中詞之間的循序關聯性與query中命中詞之間的循序關聯性。
該feature目前只用於精排排序。