參數 | 說明 |
名稱 | 為文本庫命名。文本庫名稱允許重複,但建議您在業務中將其設定為唯一。 |
使用情境 | 選擇文本庫的使用情境。取值: - 文本反垃圾:文本反垃圾(scenes包含antispam)
- 圖片廣告:圖片審核(scenes包含ad)
|
文本類型 | 選擇文本庫的文本類型。取值: - 關鍵詞:使用關鍵詞匹配,只要包含關鍵詞就會命中,覆蓋面大。
- 相似文本:使用文本相似性匹配,只有整段文本相似才會命中,精確度高。
|
匹配方式 | 文本類型為關鍵詞時,選擇文本庫的匹配方式。取值: - 精確匹配:待檢測文本中包括與庫中的詞完全一樣的內容時才命中。
- 先轉換再匹配:待檢測文本以及關鍵詞都會經過預先處理,預先處理後進行匹配。預先處理的邏輯如下:
- 大寫字母統一轉換為小寫字母。例如,輸入檢測文本“bitCoin”,會命中關鍵詞“bitcoin”。
- 繁體中文統一轉換為簡體。例如,輸入檢測文本“中國”,會命中關鍵詞“中國”。
- 相似字轉換。例如,輸入檢測文本“②”,會命中關鍵詞“2”。
|
識別結果 | 選擇文本庫的用途。 - 文本類型為關鍵詞時,取值:
- 風險名單:若命中文本庫中樣本,則機審結果返回違規(suggestion=block)。
- 疑似名單:若命中文本庫中樣本,則機審結果返回疑似(suggestion=review)。
- 忽略名單:不檢測文本庫中樣本,但是會檢測除了樣本庫以外的其他內容。
- 文本類型為相似文本時,取值:
- 風險名單:若命中文本庫中樣本,則機審結果返回違規(suggestion=block)。
- 疑似名單:若命中文本庫中樣本,則機審結果返回疑似(suggestion=review)。
- 可信名單:若命中文本庫中樣本,則機審結果返回正常(suggestion=pass)。
|
BizType | BizType允許您根據不同的業務需求配置並應用不同的文本庫,例如使用BizType指定在某次檢測中應用文本庫。BizType生效邏輯如下: - 文本庫設定BizType為“A”,且API檢測請求中傳遞了BizType為“A”,則檢測文本只會使用BizType為“A”的文本庫(前提是文本庫已開啟)。
- 其他情況下,檢測文本均會使用所有已開啟的文本庫。
|