本文由簡體中文內容自動轉碼而成。阿里雲不保證此自動轉碼的準確性、完整性及時效性。本文内容請以簡體中文版本為準。

語音審核2.0版多語言服務

更新時間:2024-07-06 00:10

語音審核2.0版升級音頻模型能力,能夠支援中文、英文和中英文混合的音頻內容。結合國際化業務特性,提供稽核原則和標籤體系。本文介紹語音審核2.0版多語言服務的內容以及使用方法。

功能特性

相比較語音審核1.0版本,語音審核2.0版採用單獨的策略和標籤體系,滿足國際化業務特性。同時提供更多功能特性,簡化業務使用並輔助人工審核。

對比項

語音審核1.0版本

語音審核2.0版

對比項

語音審核1.0版本

語音審核2.0版

多語言能力

預設僅支援中文。

支援中文、英文和中英文混合。

審核能力

  • 採用單個模型,結合語言特性,策略兼顧準確和召回。

  • 預設不支援呻吟聲模型。

  • 採用多種模型並行,結合語言和地區特性,策略更精確。

  • 新增呻吟聲模型等,支援識別非語義特徵。

標籤體系

沿用標籤體系,僅支援單個風險標籤。

採用國際化標籤體系,增加褻瀆、地區等國際化標籤,支援多個風險標籤和細分標籤。

介面功能

  • 採用語義斷句的切片方案,語音切片時間長度分布在幾秒至幾十秒以內。

  • 僅返回有違規風險的語音切片內容,預設不提供語音切片臨時地址。

  • 採用可調節的切片方案,語音切片為固定時間長度。固定切片時間長度能夠提高人工複審的效率。

  • 返回所有語音切片內容和轉寫文本,提供語音切片臨時地址用於人工複審。

國際化標籤

語音審核2.0版多語言服務採用國際化標籤體系。如果內容存在多類風險,能夠同時返回多個標籤。標籤分類包括但不限於如下所示:

標籤類型

分類

標籤類型

分類

一級標籤(labels)

  • violence:暴恐

  • contraband:違禁品

  • sexuality:色情

  • profanity:褻瀆辱罵

  • pullinTraffic:廣告引流

  • regional:地區對立

  • C_customized:使用者庫命中

細分標籤(riskTips)

細分標籤採用xxx_yyy的格式返回。例如:contraband_Drugs

服務效能

語音審核2.0版採用高效能的核心引擎,能夠高並發調度幾十種模型和策略,提供更高時效性的服務保障。

服務效能

說明

服務效能

說明

檔案大小

2.0版支援音頻檔案的大小限制從200 MB提高到500 MB。

檔案格式

支援音頻檔案格式:MP3、WAV、AAC、WMA、OGG、M4A、AMR。

可使用視訊檔案格式:AVI、FLV、MP4、MPG、ASF、WMV、MOV、RMVB、RM。

請求頻率(QPS)

提交工作要求頻率(QPS)從50次/秒提升至100次/秒。

並發路數

2.0版支援的預設並發路數限制從20路提高至50路。

說明

語音審核的QPS是指API每秒響應的請求數;並發路數是指系統中同時檢測的語音檔案或語音流數量。

計費說明

語音審核2.0版服務支援按量後付費方式。

按量後付費

當您開通語音審核2.0版服務後,預設付費方式是按量後付費,且按照實際用量結算當日費用,不調用服務不收費。

審核類型

支援的業務情境(服務)

計費單價

審核類型

支援的業務情境(服務)

計費單價

語音審核基礎(audio_standard)

音視頻媒體多語言偵測:audio_multilingual_global

9.0美元/千分鐘

接入指南

步驟一:開通服務

訪問開通服務,開通語音審核2.0版服務。

步驟二:為RAM使用者授權

在接入SDK或者API之前,您需要為RAM使用者授權。您可以為阿里雲帳號和RAM使用者建立一個存取金鑰(AccessKey)。在調用阿里雲API時您需要使用AccessKey完成身分識別驗證。擷取方式,請參見擷取AccessKey

操作步驟

  1. 使用Resource Access Management員登入RAM控制台

  2. 建立RAM使用者,勾選OpenAPI調用訪問,並記錄下RAM使用者產生的AccessKey。具體操作,請參見建立RAM使用者

  3. 向RAM使用者授權系統策略許可權:AliyunYundunGreenWebFullAccess。具體操作,請參見為RAM使用者授權

步驟三:安裝並接入SDK

目前支援的接入地區如下:

地區

外網接入地址

內網接入地址

地區

外網接入地址

內網接入地址

新加坡

green-cip.ap-southeast-1.aliyuncs.com

green-cip-vpc.ap-southeast-1.aliyuncs.com

說明

如果需要其他語言的SDK範例程式碼,您可以通過OpenAPI開發人員門戶線上調試工具調試API介面,該工具會自動產生相應API的SDK調用範例程式碼。

API

使用說明

業務介面:https://green-cip.{region}.aliyuncs.com

您可以調用該介面建立語音內容檢測任務。關於如何構造HTTP請求,請參見HTTP原生調用;您也可以直接選用已構造好的HTTP請求,更多資訊,請參見語音審核增強版2.0版SDK及接入指南

  • 業務介面

    • 提交審核任務:VoiceModeration

    • 查詢審核任務:VoiceModerationResult

  • 計費資訊

    該介面為收費介面。僅對HTTP狀態代碼為200的請求進行計量計費,產生其他錯誤碼時不會計費。

提交審核任務

請求參數

名稱

類型

是否必須

樣本值

描述

名稱

類型

是否必須

樣本值

描述

Service

String

audio_multilingual_global

審核服務類型。取值:

audio_multilingual_global

ServiceParameters

JSONString

審核服務需要的參數集。JSON字串格式,關於每個字串的描述,請參見ServiceParameters

表 1. ServiceParameters

名稱

類型

是否必須

樣本值

描述

url

String

http://aliyundoc.com/test.flv

待檢測對象的URL:公網HTTP/HTTPS URL。

callback

String

http://aliyundoc.com

檢測結果回調通知您的URL,支援使用HTTP和HTTPS協議的地址。該欄位為空白時,您必須定時輪詢檢測結果。

callback介面必須支援POST方法、UTF-8編碼的傳輸資料,以及表單參數checksumcontent

Alibaba Content Security Service按照以下規則和格式設定checksumcontent,調用您的callback介面返回檢測結果。

  • checksum:字串格式,由使用者uid + seed + content拼成字串,通過SHA256演算法產生。使用者UID即阿里雲帳號ID,可以在阿里雲控制台查詢。為防篡改,您可以在擷取到推送結果時,按上述演算法產生字串,與checksum做一次校正。

    說明

    使用者UID必須是阿里雲帳號的UID,而不是RAM使用者的UID。

  • content:JSON字串格式,請自行解析反轉成JSON對象。關於content結果的樣本,請參見查詢檢測結果的返回樣本。

說明

您的服務端callback介面收到Alibaba Content Security Service推送的結果後,如果返回的HTTP狀態代碼為200,則表示接收成功,其他的HTTP狀態代碼均視為接收失敗。接收失敗時,Alibaba Content Security Service將最多重複推送16次檢測結果,直到接收成功。重複推送16次後仍未接收成功,則不再推送,建議您檢查callback介面的狀態。

seed

String

abc****

隨機字串,該值用於回調通知請求中的簽名。

由英文字母、數字、底線(_)組成,不超過64個字元。由您自訂,用於在接收到Alibaba Content Security Service的回調通知時校正請求由阿里雲Alibaba Content Security Service服務發起。

說明

當使用callback時,該欄位必須提供。

cryptType

String

SHA256

使用回調通知時(callback),設定對回調通知內容進行加密的演算法。Alibaba Content Security Service會將返回結果(由使用者uid + seed + content拼接的字串)按照您設定的密碼編譯演算法加密後,再發送到您的回調通知地址。取值:

  • SHA256(預設):使用SHA256密碼編譯演算法。

  • SM3:使用國密HMAC-SM3密碼編譯演算法,返回十六進位的字串,且字串由小寫字母和數字組成。例如,abc經國密SM3加密後返回66c7f0f462eeedd9d1f2d46bdc10e4e24167c4875cf2f7a2297da02b8f4ba8e0。

返回參數

名稱

類型

樣本值

描述

名稱

類型

樣本值

描述

Code

Integer

200

錯誤碼,和HTTP狀態代碼一致。更多資訊,請參見錯誤碼

Data

JSONObject

{"taskId": "AAAAA-BBBBB"}

審核結果資料。

Message

String

OK

請求訊息的響應訊息。

RequestId

String

AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****

請求ID。

樣本

請求樣本

{
  "service":"audio_multilingual_global",
  "serviceParameters":"{\"cryptType\":\"SHA256\",\"seed\":\"abc***123\",\"callback\":\"https://aliyun.com/callback\",\"url\":\"http://aliyundoc.com/test.flv"}"
}

正常返回樣本

{
  "code":200,
  "data":{
    "taskId":"AAAAA-BBBBB"
  },
  "message":"SUCCESS",
  "requestId":"AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

查詢任務結果

任務審核完成後,查詢結果會返回全部語音片段資料。

請求參數

名稱

類型

是否必須

樣本值

描述

名稱

類型

是否必須

樣本值

描述

Service

String

audio_multilingual_global

審核服務類型。

ServiceParameters

JSONString

審核服務需要的參數集。JSON字串格式,關於每個字串的描述,請參見ServiceParameters

表 2. ServiceParameters

名稱

類型

是否必須

樣本值

描述

taskId

String

AAAAA-BBBBB

提交任務返回的ID。

返回參數

名稱

類型

樣本值

描述

名稱

類型

樣本值

描述

Code

Integer

200

錯誤碼,和HTTP狀態代碼一致。更多資訊,請參見錯誤碼

Data

JSONObject

{"url":xxxx,"results":xxx}

返回參數JSON格式。

Message

String

OK

請求訊息的響應訊息。

RequestId

String

AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****

請求ID。

表 3. Data

名稱

類型

樣本值

描述

url

String

https://aliyundoc.com

檢測對象的URL。

sliceDetails

JSONArray

返回語音片段的詳細結果。具體內容,請參見sliceDetails

表 4. sliceDetails

名稱

類型

樣本值

描述

startTime

Integer

0

句子開始的時間,單位:秒。

endTime

Integer

4065

句子結束的時間,單位:秒。

startTimestamp

Integer

1678854649720

切片開始時間戳,單位:毫秒。

endTimestamp

Integer

1678854649720

切片結束時間戳記,單位:毫秒。

text

String

噁心的

語音轉換成常值內容。

url

String

https://aliyundoc.com

語音片段的臨時訪問地址。該地址有效時間為30分鐘,需要及時轉存。

labels

String

pullinTraffic

標籤,多個標籤用英文逗號(,)分隔。包括:

  • violence:暴恐

  • contraband:違禁品

  • sexuality:色情

  • profanity:褻瀆辱罵

  • pullinTraffic:廣告引流

  • regional:地區對立

  • C_customized:使用者庫命中

riskWords

String

AAA,BBB,CCC

命中風險詞,多個詞以逗號分隔。

riskTips

String

sexuality_Suggestive

細分標籤,多個標籤以逗號分隔。

extend

String

{\"riskTips\":\"sexuality_Suggestive\",\"riskWords\":\"pxxxxy\"}

保留欄位。

樣本

請求樣本

{
  "service":"audio_multilingual_global",
  "serviceParameters":"{\"taskId\":\"AAAAA-BBBBB"}"
}

正常返回樣本

{
  "code":200,
  "data":{
    "sliceDetails":[
      {
        "endTime":4065,
        "labels":"pullinTraffic",
        "startTime":0,
        "text":"pxxxxy xxxxxx",
        "riskTips":"sexuality_Suggestive",
        "riskWords":"pxxxxy",
        "url":"https://aliyundoc.com"
      }
    ]
  },
  "message":"OK",
  "requestId":"AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

回調訊息格式

回調訊息的資料為JSON格式的表單如下所示:

欄位名

欄位類型

描述

欄位名

欄位類型

描述

checksum

String

校正碼,字串格式,由使用者uid + seed + content拼成字串,通過SHA256演算法產生。

使用者UID即阿里雲帳號ID,可以在阿里雲控制台查詢。為防篡改,您可以在擷取到推送結果時,按上述演算法產生字串,與checksum做一次校正。

說明

使用者UID必須是阿里雲帳號的UID,而不是RAM使用者的UID。

taskId

String

回調訊息的任務ID。

content

String

序列化後的檢測結果,JSON字串格式,請自行解析反轉成JSON對象。關於content結果的格式,與查詢任務結果的返回一致。

錯誤碼

以下為介面返回code的含義說明,系統僅對code返回為200的請求計量計費,其他code不會計費。

Code

說明

Code

說明

200

請求正常。

280

檢測中。

400

請求參數為空白。

401

請求參數錯誤。

402

請求參數長度不符合介面規定,請檢查並修改。

403

請求超過QPS限制,請檢查並調整QPS限制。

404

傳入的檔案下載遇到錯誤,請檢查或重試。

405

傳入的檔案下載逾時,可能是因為檔案無法訪問,請檢查調整後重試。

406

傳入的檔案超過大小限制,請檢測調整後重試。

407

傳入的檔案格式暫不支援,請檢查調整後重試。

408

該帳號無許可權調用該介面,可能是帳號未開通或者已欠費,或者調用帳號未被授權訪問。

480

檢測並發路數超過限制,請檢查並調整並發。

500

系統異常。

  • 本頁導讀 (0, M)
  • 功能特性
  • 國際化標籤
  • 服務效能
  • 計費說明
  • 按量後付費
  • 接入指南
  • 步驟一:開通服務
  • 步驟二:為RAM使用者授權
  • 步驟三:安裝並接入SDK
  • API
  • 使用說明
  • 提交審核任務
  • 查詢任務結果
  • 回調訊息格式
  • 錯誤碼
文檔反饋