語音審核2.0版升級音頻模型能力,能夠支援中文、英文和中英文混合的音頻內容。結合國際化業務特性,提供稽核原則和標籤體系。本文介紹語音審核2.0版多語言服務的內容以及使用方法。
功能特性
相比較語音審核1.0版本,語音審核2.0版採用單獨的策略和標籤體系,滿足國際化業務特性。同時提供更多功能特性,簡化業務使用並輔助人工審核。
對比項 | 語音審核1.0版本 | 語音審核2.0版 |
對比項 | 語音審核1.0版本 | 語音審核2.0版 |
多語言能力 | 預設僅支援中文。 | 支援中文、英文和中英文混合。 |
審核能力 |
|
|
標籤體系 | 沿用標籤體系,僅支援單個風險標籤。 | 採用國際化標籤體系,增加褻瀆、地區等國際化標籤,支援多個風險標籤和細分標籤。 |
介面功能 |
|
|
國際化標籤
語音審核2.0版多語言服務採用國際化標籤體系。如果內容存在多類風險,能夠同時返回多個標籤。標籤分類包括但不限於如下所示:
標籤類型 | 分類 |
標籤類型 | 分類 |
一級標籤(labels) |
|
細分標籤(riskTips) | 細分標籤採用 |
服務效能
語音審核2.0版採用高效能的核心引擎,能夠高並發調度幾十種模型和策略,提供更高時效性的服務保障。
服務效能 | 說明 |
服務效能 | 說明 |
檔案大小 | 2.0版支援音頻檔案的大小限制從200 MB提高到500 MB。 |
檔案格式 | 支援音頻檔案格式:MP3、WAV、AAC、WMA、OGG、M4A、AMR。 可使用視訊檔案格式:AVI、FLV、MP4、MPG、ASF、WMV、MOV、RMVB、RM。 |
請求頻率(QPS) | 提交工作要求頻率(QPS)從50次/秒提升至100次/秒。 |
並發路數 | 2.0版支援的預設並發路數限制從20路提高至50路。 |
語音審核的QPS是指API每秒響應的請求數;並發路數是指系統中同時檢測的語音檔案或語音流數量。
計費說明
語音審核2.0版服務支援按量後付費方式。
按量後付費
當您開通語音審核2.0版服務後,預設付費方式是按量後付費,且按照實際用量結算當日費用,不調用服務不收費。
審核類型 | 支援的業務情境(服務) | 計費單價 |
審核類型 | 支援的業務情境(服務) | 計費單價 |
語音審核基礎(audio_standard) | 音視頻媒體多語言偵測:audio_multilingual_global | 9.0美元/千分鐘 |
接入指南
步驟一:開通服務
訪問開通服務,開通語音審核2.0版服務。
步驟二:為RAM使用者授權
在接入SDK或者API之前,您需要為RAM使用者授權。您可以為阿里雲帳號和RAM使用者建立一個存取金鑰(AccessKey)。在調用阿里雲API時您需要使用AccessKey完成身分識別驗證。擷取方式,請參見擷取AccessKey。
操作步驟
步驟三:安裝並接入SDK
目前支援的接入地區如下:
地區 | 外網接入地址 | 內網接入地址 |
地區 | 外網接入地址 | 內網接入地址 |
新加坡 | green-cip.ap-southeast-1.aliyuncs.com | green-cip-vpc.ap-southeast-1.aliyuncs.com |
如果需要其他語言的SDK範例程式碼,您可以通過OpenAPI開發人員門戶線上調試工具調試API介面,該工具會自動產生相應API的SDK調用範例程式碼。
API
使用說明
業務介面:https://green-cip.{region}.aliyuncs.com
。
您可以調用該介面建立語音內容檢測任務。關於如何構造HTTP請求,請參見HTTP原生調用;您也可以直接選用已構造好的HTTP請求,更多資訊,請參見語音審核增強版2.0版SDK及接入指南。
業務介面:
提交審核任務:VoiceModeration
查詢審核任務:VoiceModerationResult
計費資訊:
該介面為收費介面。僅對HTTP狀態代碼為200的請求進行計量計費,產生其他錯誤碼時不會計費。
提交審核任務
請求參數
名稱 | 類型 | 是否必須 | 樣本值 | 描述 |
名稱 | 類型 | 是否必須 | 樣本值 | 描述 |
Service | String | 是 | audio_multilingual_global | 審核服務類型。取值: audio_multilingual_global |
ServiceParameters | JSONString | 是 | 審核服務需要的參數集。JSON字串格式,關於每個字串的描述,請參見ServiceParameters。 |
表 1. ServiceParameters
名稱 | 類型 | 是否必須 | 樣本值 | 描述 |
url | String | 是 | http://aliyundoc.com/test.flv | 待檢測對象的URL:公網HTTP/HTTPS URL。 |
callback | String | 否 | http://aliyundoc.com | 檢測結果回調通知您的URL,支援使用HTTP和HTTPS協議的地址。該欄位為空白時,您必須定時輪詢檢測結果。 callback介面必須支援POST方法、UTF-8編碼的傳輸資料,以及表單參數checksum和content。 Alibaba Content Security Service按照以下規則和格式設定checksum和content,調用您的callback介面返回檢測結果。
您的服務端callback介面收到Alibaba Content Security Service推送的結果後,如果返回的HTTP狀態代碼為200,則表示接收成功,其他的HTTP狀態代碼均視為接收失敗。接收失敗時,Alibaba Content Security Service將最多重複推送16次檢測結果,直到接收成功。重複推送16次後仍未接收成功,則不再推送,建議您檢查callback介面的狀態。 |
seed | String | 否 | abc**** | 隨機字串,該值用於回調通知請求中的簽名。 由英文字母、數字、底線(_)組成,不超過64個字元。由您自訂,用於在接收到Alibaba Content Security Service的回調通知時校正請求由阿里雲Alibaba Content Security Service服務發起。 當使用callback時,該欄位必須提供。 |
cryptType | String | 否 | SHA256 | 使用回調通知時(callback),設定對回調通知內容進行加密的演算法。Alibaba Content Security Service會將返回結果(由
|
返回參數
名稱 | 類型 | 樣本值 | 描述 |
名稱 | 類型 | 樣本值 | 描述 |
Code | Integer | 200 | 錯誤碼,和HTTP狀態代碼一致。更多資訊,請參見錯誤碼。 |
Data | JSONObject | {"taskId": "AAAAA-BBBBB"} | 審核結果資料。 |
Message | String | OK | 請求訊息的響應訊息。 |
RequestId | String | AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE**** | 請求ID。 |
樣本
請求樣本
{
"service":"audio_multilingual_global",
"serviceParameters":"{\"cryptType\":\"SHA256\",\"seed\":\"abc***123\",\"callback\":\"https://aliyun.com/callback\",\"url\":\"http://aliyundoc.com/test.flv"}"
}
正常返回樣本
{
"code":200,
"data":{
"taskId":"AAAAA-BBBBB"
},
"message":"SUCCESS",
"requestId":"AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}
查詢任務結果
任務審核完成後,查詢結果會返回全部語音片段資料。
請求參數
名稱 | 類型 | 是否必須 | 樣本值 | 描述 |
名稱 | 類型 | 是否必須 | 樣本值 | 描述 |
Service | String | 是 | audio_multilingual_global | 審核服務類型。 |
ServiceParameters | JSONString | 是 | 審核服務需要的參數集。JSON字串格式,關於每個字串的描述,請參見ServiceParameters。 |
表 2. ServiceParameters
名稱 | 類型 | 是否必須 | 樣本值 | 描述 |
taskId | String | 是 | AAAAA-BBBBB | 提交任務返回的ID。 |
返回參數
名稱 | 類型 | 樣本值 | 描述 |
名稱 | 類型 | 樣本值 | 描述 |
Code | Integer | 200 | 錯誤碼,和HTTP狀態代碼一致。更多資訊,請參見錯誤碼。 |
Data | JSONObject | {"url":xxxx,"results":xxx} | 返回參數JSON格式。 |
Message | String | OK | 請求訊息的響應訊息。 |
RequestId | String | AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE**** | 請求ID。 |
表 3. Data
名稱 | 類型 | 樣本值 | 描述 |
url | String | https://aliyundoc.com | 檢測對象的URL。 |
sliceDetails | JSONArray | 返回語音片段的詳細結果。具體內容,請參見sliceDetails。 |
表 4. sliceDetails
名稱 | 類型 | 樣本值 | 描述 |
startTime | Integer | 0 | 句子開始的時間,單位:秒。 |
endTime | Integer | 4065 | 句子結束的時間,單位:秒。 |
startTimestamp | Integer | 1678854649720 | 切片開始時間戳,單位:毫秒。 |
endTimestamp | Integer | 1678854649720 | 切片結束時間戳記,單位:毫秒。 |
text | String | 噁心的 | 語音轉換成常值內容。 |
url | String | https://aliyundoc.com | 語音片段的臨時訪問地址。該地址有效時間為30分鐘,需要及時轉存。 |
labels | String | pullinTraffic | 標籤,多個標籤用英文逗號(,)分隔。包括:
|
riskWords | String | AAA,BBB,CCC | 命中風險詞,多個詞以逗號分隔。 |
riskTips | String | sexuality_Suggestive | 細分標籤,多個標籤以逗號分隔。 |
extend | String | {\"riskTips\":\"sexuality_Suggestive\",\"riskWords\":\"pxxxxy\"} | 保留欄位。 |
樣本
請求樣本
{
"service":"audio_multilingual_global",
"serviceParameters":"{\"taskId\":\"AAAAA-BBBBB"}"
}
正常返回樣本
{
"code":200,
"data":{
"sliceDetails":[
{
"endTime":4065,
"labels":"pullinTraffic",
"startTime":0,
"text":"pxxxxy xxxxxx",
"riskTips":"sexuality_Suggestive",
"riskWords":"pxxxxy",
"url":"https://aliyundoc.com"
}
]
},
"message":"OK",
"requestId":"AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}
回調訊息格式
回調訊息的資料為JSON格式的表單如下所示:
欄位名 | 欄位類型 | 描述 |
欄位名 | 欄位類型 | 描述 |
checksum | String | 校正碼,字串格式,由使用者 使用者UID即阿里雲帳號ID,可以在阿里雲控制台查詢。為防篡改,您可以在擷取到推送結果時,按上述演算法產生字串,與checksum做一次校正。 使用者UID必須是阿里雲帳號的UID,而不是RAM使用者的UID。 |
taskId | String | 回調訊息的任務ID。 |
content | String | 序列化後的檢測結果,JSON字串格式,請自行解析反轉成JSON對象。關於content結果的格式,與查詢任務結果的返回一致。 |
錯誤碼
以下為介面返回code的含義說明,系統僅對code返回為200的請求計量計費,其他code不會計費。
Code | 說明 |
Code | 說明 |
200 | 請求正常。 |
280 | 檢測中。 |
400 | 請求參數為空白。 |
401 | 請求參數錯誤。 |
402 | 請求參數長度不符合介面規定,請檢查並修改。 |
403 | 請求超過QPS限制,請檢查並調整QPS限制。 |
404 | 傳入的檔案下載遇到錯誤,請檢查或重試。 |
405 | 傳入的檔案下載逾時,可能是因為檔案無法訪問,請檢查調整後重試。 |
406 | 傳入的檔案超過大小限制,請檢測調整後重試。 |
407 | 傳入的檔案格式暫不支援,請檢查調整後重試。 |
408 | 該帳號無許可權調用該介面,可能是帳號未開通或者已欠費,或者調用帳號未被授權訪問。 |
480 | 檢測並發路數超過限制,請檢查並調整並發。 |
500 | 系統異常。 |