擴充參數 - OpenSearch

OpenSearch-LLM智能問答版擴充參數說明

Prompt參數

attitude參數

參數說明：對話內容的語氣，預設為normal

normal：無
polite：使用和藹和禮貌的語氣
patience：使用委婉和耐心的語氣

rule參數

參數說明：對話內容的詳細程度，預設為detailed

detailed：詳細和專業
stepbystep：詳細且按步驟

noanswer參數

參數說明：無法回答問題時的回複，預設為sorry

sorry：抱歉，根據已知資訊無法回答該問題
uncertain：我不知道

language參數

參數說明：回答問題使用的語言，預設為Chinese

Chinese：中文
English：英語
Thai：泰語
Korean：韓語

role參數

參數說明：開啟後，將定製回答的角色，例如：AI小助手

out_format參數

參數說明：輸出內容的形式，預設為text

text：文本
table：表格
list：列項
markdown：markdown

文檔召回參數

filter參數

參數說明：召迴文檔時根據目標欄位進行過濾，預設為空白。

文法說明：過濾條件式格式設定為：field=value

樣本：

1、只從category為value1的doc中擷取資料

"filter" : "category=\"value1\""

2、只從category為value1和value2的doc中擷取資料

"filter" : "category=\"value1\" OR category=\"value2\""

3、category多值過濾

category欄位的多值傳參的時候，每個item需要用英文逗號隔開
eg：category =  類別1,類別2,類別3,類別4
"filter" : "category=\"類別1\""  //category對應的value可以是傳入多值的任意item

sf參數

參數說明：向量召回的閾值，預設1.3；值越大越不相關，取值範圍 [0,+∞)。

文法說明：

sf=value eg:sf = 1 可根據預期調節sf參數的值，值越小越先關。

top_n參數

參數說明：文檔召回多少個文檔，預設是5個，取值範圍(0,50]。

文法說明：

top_n:value eg: top_n = 3 可根據實際需要調節top_n參數大小

formula參數

參數說明：用來指定召迴文檔時的排序公式

文法說明：

文本相關性

text_relevance: 關鍵詞在欄位上的文本匹配度
field_match_ratio：擷取某欄位上與查詢詞匹配的分詞片語個數與該欄位總片語個數的比值
query_match_ratio：擷取查詢詞中（在某個欄位上）命中片語個數與總片語個數的比值
fieldterm_proximity: 用來表示關鍵詞分詞片語在欄位上的緊密程度
field_length：擷取某個欄位上的分詞片語個數
query_term_count: 返回查詢詞分詞後片語個數
query_term_match_count：擷取查詢詞中（在某個欄位上）命中文檔的片語個數
field_term_match_count：擷取文檔中某個欄位與查詢詞匹配的片語個數
query_min_slide_window：查詢詞在某個欄位上命中的分詞片語個數與該片語在欄位上最小視窗的比值

時效性

timeliness: 時效分，用于衡量文檔的新舊程度，單位為秒
timeliness_ms: 時效分，用于衡量文檔的新舊程度，單位為毫秒

功能性

tag_match: 用於對查詢語句和文檔做標籤匹配，使用匹配結果對文檔進行算分加權
first_phase_score：擷取粗排運算式最終計算分值
kvpairs_value: 擷取查詢串中kvpairs子句中指定欄位的值
normalize：歸一化函數，根據不同的算分將數值歸一化至[0, 1]
in和notin: 判斷欄位值是否（不）在指定列表中

operator參數

參數說明：表示文本召回時，文本token之間的關係是OR，預設是AND。

人工幹預參數

sf參數

參數說明：人工幹預問題的閾值，預設為0.3，取值範圍[0,+∞)，sf越大則越容易匹配到人工幹預詞條。

文法說明：

sf=value eg:sf = 1 可根據預期調節sf參數的值。

參考圖片參數

sf參數

參數說明：參考圖片的閾值，預設為1，取值範圍[0,+∞)，sf越大則參考圖片與內容的向量相似性越小。

文法說明：

sf=value eg:sf = 1 可根據預期調節sf參數的值。

其他參數

return_hits參數

參數說明：是否返回搜尋結果，預設為false，如果不返回就只有參考連結。

文法說明：

return_hits:false eg:return_hits = true 返回對應的搜尋結果

csi_level參數

參數說明：控制對大模型產生的內容是否經過綠網處理，判斷內容是否有敏感、涉政或者有害等資訊。

none: 表示不需要經過綠網處理
loose: 內容需要經過綠網處理，且只有綠網判斷確定存在敏感內容，就會被攔截，返回無結果
strict: 內容需要經過綠網處理，且一旦綠網判斷確定或者疑似存在敏感內容，就會被攔截，返回無結果

link參數

參數說明：控制模型產生的內容是否標識內容引用的來源

true: 內容包含來源
false: 不包含

包含內容的返回資訊執行個體如下：

可以通過線上擴容和離線擴容兩種方式擴容ECS雲端硬碟容量[^1^]。線上擴容無需重啟執行個體，離線擴容需要重啟執行個體[^1^]。具體操作步驟為：在ECS控制台上選擇待擴容的雲端硬碟，在操作列選擇擴容，然後根據需要選擇擴容方式[^1^]。如果需要擴容分區和檔案系統，可以通過控制台擷取或者通過控制台擷取[^2^]。擴容雲端硬碟容量後，新容量生效後無法再縮小，建議合理規劃儲存空間[^3^]。

說明

其中被'[^' 和 '^]' 包括起來的數字表示引用結果中reference裡的第幾個文檔。例如'[^1^]'表示應用reference中的第一個文檔。