本文由簡體中文內容自動轉碼而成。阿里雲不保證此自動轉碼的準確性、完整性及時效性。本文内容請以簡體中文版本為準。

介面說明

更新時間:2025-02-05 10:52

對長時間的語音資料流進行識別,適用於會議演講、ApsaraVideo for Live等長時間不間斷識別的情境。

使用須知

說明

如需使用Android或iOS SDK,請參見移動端介面說明

  • 支援的輸入格式:單聲道(mono)、16 bit採樣位元,包括PCM、PCM編碼的WAV、OGG封裝的OPUS、OGG封裝的SPEEX、AMR、MP3、AAC。

  • 支援的音頻採樣率:8000 Hz、16000 Hz。

  • 支援設定返回結果:是否返回中間識別結果,在後處理中添加標點,將中文數字轉為阿拉伯數字輸出。

  • 支援情感分析:目前僅開放中文8k情感識別功能,且使用時需關閉語義斷句功能(即enable_semantic_sentence_detection=False)。

  • 支援設定多語言識別:在控制台編輯專案中進行模型選擇,詳情請參見管理專案

    目前支援的語種和方言模型如下:

    • 語種

      語言

      模型名稱

      採樣率

      標點

      ITN

      順滑

      語義斷句

      聲音和文本對齊

      英語

      通用-英文,教育直播-英文,教育內容分析-英文

      16k

      支援

      支援

      支援

      不支援

      支援

      電話客服(通用)

      8k

      支援

      支援

      支援

      不支援

      不支援

      日語

      通用-日語

      16k

      支援

      支援

      不支援

      不支援

      支援

      西班牙語

      通用-西班牙語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      通用-西班牙客服通用

      8k

      支援

      支援

      不支援

      不支援

      不支援

      阿拉伯語

      通用-阿拉伯語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      哈薩克語

      通用-哈薩克語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      韓語

      通用-韓語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      泰語

      通用-泰語

      16k

      不支援

      不支援

      不支援

      不支援

      不支援

      通用-泰語客服通用

      8k

      不支援

      不支援

      不支援

      不支援

      不支援

      印尼語

      通用-印尼語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      電話客服(通用)

      8k

      支援

      支援

      不支援

      不支援

      不支援

      俄語

      通用-俄語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      越南語

      通用-越南語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      通用-越南語客服通用

      8k

      支援

      支援

      不支援

      不支援

      不支援

      法語

      通用-法語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      德語

      通用-德語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      意大利語

      通用-意大利語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      印地語

      通用-印地語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      馬來語

      通用-馬來語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      通用-馬來語客服通用

      8k

      支援

      不支援

      不支援

      不支援

      不支援

      菲律賓語

      通用-菲律賓語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      電話客服(通用)

      8k

      支援

      支援

      不支援

      不支援

      不支援

      泰米爾語

      通用-泰米爾語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      葡萄牙語

      通用-葡萄牙語

      16k

      支援

      支援

      不支援

      不支援

      不支援

      土耳其語

      通用-土耳其語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      波蘭語

      通用-波蘭語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      烏克蘭語

      通用-烏克蘭語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      羅馬尼亞語

      通用-羅馬尼亞語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      荷蘭語

      通用-荷蘭語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      希臘語

      通用-希臘語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      匈牙利語

      通用-匈牙利語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      爪哇語

      通用-爪哇語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      孟加拉語

      通用-孟加拉語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      緬甸語

      通用-緬甸語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      寮國語

      通用-寮國語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      斯瓦希裡語

      通用-斯瓦希裡語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      阿塞拜疆語

      通用-阿塞拜疆語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      波斯語

      通用-波斯語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      僧伽羅語

      通用-僧伽羅語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      加泰羅尼亞語

      通用-加泰羅尼亞語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      高棉語

      通用-高棉語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      希伯來語

      通用-希伯來語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      克羅地亞語

      通用-克羅地亞語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      豪薩語

      通用-豪薩語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      馬拉地語

      通用-馬拉地語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      泰盧固語

      通用-泰盧固語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      旁遮普語

      通用-旁遮普語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      瑞典語

      通用-瑞典語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      保加利亞語

      通用-保加利亞語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      丹麥語

      通用-丹麥語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      挪威語

      通用-挪威語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      坎納達語

      通用-坎納達語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      馬拉雅拉姆語

      通用-馬拉雅拉姆語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      捷克語

      通用-捷克語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      烏爾都語

      通用-烏爾都語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      尼泊爾語

      通用-尼泊爾語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      蒙古語(外蒙)

      通用-蒙古語(外蒙)

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      烏茲別克語

      通用-烏茲別克語

      16k

      支援

      不支援

      不支援

      不支援

      不支援

    • 方言

      語言

      模型名稱

      採樣率

      標點

      ITN

      順滑

      語義斷句

      聲音和文本對齊

      粵語

      通用-粵語

      16k

      支援

      支援

      支援

      不支援

      支援

      電話客服(通用)

      8k

      支援

      支援

      支援

      不支援

      支援

      粵中自由說

      8k

      支援

      支援

      支援

      不支援

      不支援

      粵語(繁體)

      通用-粵語(繁體)

      8k

      支援

      不支援

      不支援

      不支援

      不支援

      通用-粵語(繁體)

      16k

      支援

      不支援

      不支援

      不支援

      不支援

      四川話

      通用-四川話

      16k

      支援

      支援

      支援

      支援

      支援

      電話客服(通用)

      8k

      支援

      支援

      支援

      支援

      支援

      湖北話

      通用-湖北話

      16k

      支援

      支援

      支援

      支援

      支援

      通用-湖北話

      8k

      支援

      支援

      支援

      支援

      支援

      上海話

      通用-上海話

      16k

      支援

      支援

      支援

      支援

      不支援

      湖南話

      通用-湖南話

      16k

      支援

      支援

      支援

      支援

      支援

      河南話

      通用-河南話

      16k

      支援

      支援

      支援

      支援

      支援

      通用-河南話

      8k

      支援

      支援

      支援

      支援

      支援

      浙江話

      通用-浙江話

      16k

      支援

      支援

      支援

      支援

      不支援

      東北話

      通用-東北話

      16k

      支援

      支援

      支援

      支援

      支援

      山東話

      通用-山東話

      16k

      支援

      支援

      支援

      支援

      支援

      天津話

      通用-天津話

      16k

      支援

      支援

      支援

      支援

      支援

      陝西話

      通用-陝西話

      16k

      支援

      支援

      支援

      支援

      支援

      山西話

      通用-山西話

      16k

      支援

      支援

      支援

      支援

      支援

      貴州話

      通用-貴州話

      16k

      支援

      支援

      支援

      支援

      支援

      雲南話

      通用-雲南話

      16k

      支援

      支援

      支援

      支援

      支援

      甘肅話

      通用-甘肅話

      16k

      支援

      支援

      支援

      支援

      支援

      維吾爾語

      通用-維吾爾語

      16k

      不支援

      不支援

      不支援

      不支援

      不支援

      通用-維吾爾語

      8k

      不支援

      不支援

      不支援

      不支援

      不支援

      蘇州話

      通用-蘇州話

      16k

      支援

      支援

      支援

      支援

      不支援

      閩南語

      通用-閩南語

      16k

      支援

      支援

      支援

      支援

      不支援

      江西話

      通用-江西話

      16k

      支援

      支援

      支援

      支援

      支援

      寧夏話

      通用-寧夏話

      16k

      支援

      支援

      支援

      支援

      支援

      廣西話

      通用-廣西話

      16k

      支援

      支援

      支援

      支援

      支援

      通用-廣西話

      8k

      支援

      支援

      支援

      支援

      支援

      中文普通話

      識音石 V1 - 端到端模型,教育內容分析,醫學內容分析,新聞媒體內容分析,娛樂視頻內容分析,音視頻離線轉寫(升級版),新零售領域識別模型,出行領域識別模型

      16k

      支援

      支援

      支援

      支援

      支援

      中英自由說

      16k

      支援

      支援

      支援

      支援

      不支援

      識音石 V1 - 端到端模型

      8k

      支援

      支援

      支援

      支援

      支援

就近地區智能接入

即時語音辨識支援就近地區智能接入,網域名稱為nls-gateway.aliyuncs.com

推薦終端使用者使用就近地區接入網域名稱。根據調用介面時用戶端所在的地理位置,系統會自動解析到最近的某個具體地區的伺服器。例如在北京地區發起請求,系統會自動解析到北京地區的伺服器,與指定網域名稱nls-gateway-cn-beijing.aliyuncs.com的實現效果一致。

服務地址

訪問類型

說明

URL

訪問類型

說明

URL

外網訪問(預設上海地區)

所有伺服器均可使用外網訪問URL(SDK中預設設定了外網訪問URL)。

  • 上海:wss://nls-gateway-cn-shanghai.aliyuncs.com/ws/v1

  • 北京:wss://nls-gateway-cn-beijing.aliyuncs.com/ws/v1

  • 深圳:wss://nls-gateway-cn-shenzhen.aliyuncs.com/ws/v1

ECS內網訪問

使用阿里雲上海、北京、深圳ECS(即ECS地區為華東2(上海)、華北2(北京)、華南1(深圳)),可使用內網訪問URL。 ECS的傳統網路不能訪問AnyTunnel,即不能在內網訪問Voice Messaging Service;如果希望使用AnyTunnel,需要建立專用網路在其內部訪問。

說明

  • 使用內網訪問方式,將不產生ECS執行個體的公網流量費用。

  • 關於ECS的網路類型請參見網路類型

  • 上海:ws://nls-gateway-cn-shanghai-internal.aliyuncs.com:80/ws/v1

  • 北京:ws://nls-gateway-cn-beijing-internal.aliyuncs.com:80/ws/v1

  • 深圳:ws://nls-gateway-cn-shenzhen-internal.aliyuncs.com:80/ws/v1

互動流程

image
說明

所有服務端的響應都會在返回資訊的header包含表示本次識別任務的Task_id參數。

1. 鑒權

用戶端與服務端建立WebSocket串連時,使用Token進行鑒權。關於Token擷取請參見擷取Token概述

2. 開始識別

用戶端發起請求,服務端確認請求有效。其中在請求訊息中需要進行參數設定,各參數由SDK中SpeechTranscriber對象的set方法設定,各參數含義如下:

參數

類型

是否必選

說明

參數

類型

是否必選

說明

appkey

String

管控台建立的專案Appkey。擷取Appkey請前往控制台

format

String

音頻格式,包括PCM、WAV、OPUS、SPEEX、AMR、MP3、AAC。

sample_rate

Integer

音頻採樣率,預設是16000 Hz,根據音頻採樣率在管控台對應專案中配置支援該採樣率及情境的模型。

enable_intermediate_result

Boolean

是否返回中間識別結果,預設是false。

enable_punctuation_prediction

Boolean

是否在後處理中添加標點,預設是false。

enable_inverse_text_normalization

Boolean

ITN(逆文本inverse text normalization)中文數字轉換阿拉伯數字。設定為True時,中文數字將轉為阿拉伯數字輸出,預設值:False。

customization_id

String

自學習模型ID。

vocabulary_id

String

定製泛熱詞ID。

max_sentence_silence

Integer

語音斷句檢測閾值,靜音時間長度超過該閾值會被認為斷句,參數範圍200ms~6000ms,預設值800ms。

開啟語義斷句enable_semantic_sentence_detection後,此參數無效。

enable_words

Boolean

是否開啟返回詞資訊,預設是false。

disfluency

Boolean

過濾語氣詞,即聲音順滑,預設值false(關閉)。

speech_noise_threshold

Float

噪音參數閾值,參數範圍:[-1,1]。取值說明如下:

  • 取值越趨於-1,噪音被判定為語音的機率越大。

  • 取值越趨於+1,語音被判定為噪音的機率越大。

重要

該參數屬進階參數,調整需謹慎並重點測試。

enable_semantic_sentence_detection

Boolean

是否開啟語義斷句,可選,預設是False。語義斷句參數需要和開啟中間結果配合使用,即開啟該語義斷句參數需將中間結果參數同時開啟:enable_intermediate_result=true。

special_word_filter

String(結構為JSON格式)

敏感詞過濾功能,支援開啟或關閉,支援自訂敏感詞。該參數可實現:

不處理(預設,即展示原文)、過濾替換為*。

具體調用說明請見下文的自訂過濾詞調用樣本。

自訂過濾詞調用樣本如下:

            // 以即時轉寫為例,
            JSONObject root = new JSONObject();
            root.put("system_reserved_filter", true);

            // 將以下詞語替換成空
            JSONObject root1 = new JSONObject();
            JSONArray array1 = new JSONArray();
            array1.add("開始");
            array1.add("發生");
            root1.put("word_list", array1);

            // 將以下詞語替換成*
            JSONObject root2 = new JSONObject();
            JSONArray array2 = new JSONArray();
            array2.add("測試");
            root2.put("word_list", array2);

						// 可以全部設定,也可以部分設定
            root.put("filter_with_empty", root1);
            root.put("filter_with_signed", root2);

            transcriber.addCustomedParam("special_word_filter", root);

3. 接收識別結果

用戶端迴圈發送語音資料,持續接收識別結果:

  • SentenceBegin事件表示服務端檢測到了一句話的開始。即時語音辨識服務的智能斷句功能會判斷出一句話的開始與結束,舉例如下:

    {
            "header": {
                    "namespace": "SpeechTranscriber",
                    "name": "SentenceBegin",
                    "status": 20000000,
                    "message_id": "a426f3d4618447519c9d85d1a0d1****",
                    "task_id": "5ec521b5aa104e3abccf3d361822****",
                    "status_text": "Gateway:SUCCESS:Success."
            },
            "payload": {
                    "index": 1,
                    "time": 0
            }
    }

    header對象參數說明:

    參數

    類型

    說明

    參數

    類型

    說明

    namespace

    String

    訊息所屬的命名空間。

    name

    String

    訊息名稱,SentenceBegin表示一個句子的開始。

    status

    Integer

    狀態代碼,表示請求是否成功,見服務狀態代碼。

    status_text

    String

    狀態訊息。

    task_id

    String

    任務全域唯一ID,請記錄該值,便於排查問題。

    message_id

    String

    本次訊息的ID。

    payload對象參數說明:

    參數

    類型

    說明

    參數

    類型

    說明

    index

    Integer

    句子編號,從1開始遞增。

    time

    Integer

    當前已處理的音頻時間長度,單位是毫秒。

  • TranscriptionResultChanged事件表示識別結果發生了變化。僅當enable_intermediate_result取值為true時會多次返回此訊息,即一句話的中間識別結果,舉例如下:

    {
            "header": {
                    "namespace": "SpeechTranscriber",
                    "name": "TranscriptionResultChanged",
                    "status": 20000000,
                    "message_id": "dc21193fada84380a3b6137875ab****",
                    "task_id": "5ec521b5aa104e3abccf3d361822****",
                    "status_text": "Gateway:SUCCESS:Success."
            },
            "payload": {
                    "index": 1,
                    "time": 1835,
                    "result": "北京的天",
                    "confidence": 1.0,
                    "words": [{
                            "text": "北京",
                            "startTime": 630,
                            "endTime": 930
                    }, {
                            "text": "的",
                            "startTime": 930,
                            "endTime": 1110
                    }, {
                            "text": "天",
                            "startTime": 1110,
                            "endTime": 1140
                    }]
            }
    }       

    header對象參數同上述表格說明,name為TranscriptionResultChanged:表示句子的中間識別結果。

    payload對象參數說明:

    參數

    類型

    說明

    參數

    類型

    說明

    index

    Integer

    句子編號,從1開始遞增。

    time

    Integer

    當前已處理的音頻時間長度,單位是毫秒。

    result

    String

    當前句子的識別結果。

    words

    List< Word >

    當前句子的詞資訊,需要將enable_words設定為true。

    confidence

    Double

    當前句子識別結果的信賴度,取值範圍:[0.0,1.0]。值越大表示信賴度越高。

  • SentenceEnd事件表示服務端檢測到了一句話的結束,並附帶返回該句話的識別結果,舉例如下:

    {
            "header": {
                    "namespace": "SpeechTranscriber",
                    "name": "SentenceEnd",
                    "status": 20000000,
                    "message_id": "c3a9ae4b231649d5ae05d4af36fd****",
                    "task_id": "5ec521b5aa104e3abccf3d361822****",
                    "status_text": "Gateway:SUCCESS:Success."
            },
            "payload": {
                    "index": 1,
                    "time": 1820,
                    "begin_time": 0,
                    "result": "北京的天氣。",
                    "confidence": 1.0,
                    "words": [{
                            "text": "北京",
                            "startTime": 630,
                            "endTime": 930
                    }, {
                            "text": "的",
                            "startTime": 930,
                            "endTime": 1110
                    }, {
                            "text": "天氣",
                            "startTime": 1110,
                            "endTime": 1380
                    }],
                      "emo_tag": "neutral",
                      "emo_confidence": 0.931
            }
    }
    

    header對象參數同上述表格說明,name為SentenceEnd表示識別到句子的結束。

    payload對象參數說明:

    參數

    類型

    說明

    參數

    類型

    說明

    index

    Integer

    句子編號,從1開始遞增。

    time

    Integer

    當前已處理的音頻時間長度,單位是毫秒。

    begin_time

    Integer

    當前句子對應的SentenceBegin事件的時間,單位是毫秒。

    result

    String

    當前的識別結果。

    words

    List< Word >

    當前句子的詞資訊,需要將enable_words設定為true。

    confidence

    Double

    當前句子識別結果的信賴度,取值範圍:[0.0,1.0]。值越大表示信賴度越高。

    emo_tag

    String

    當前句子的情感,包含positive(正面情感,如開心、滿意)、negative(負面情感,如憤怒、沉悶、失望)、neutral (無明顯情感)三種類別。

    emo_confidence

    Double

    當前句子識別情感的信賴度,取值範圍:[0.0,1.0]。值越大表示信賴度越高。

    Words對象參數說明:

    參數

    類型

    說明

    參數

    類型

    說明

    text

    String

    文本。

    startTime

    Integer

    詞開始時間,單位為毫秒。

    endTime

    Integer

    詞結束時間,單位為毫秒。

4. 結束識別

通知服務端語音資料發送完成,服務端識別結束後通知用戶端識別完畢。

服務狀態代碼

在服務的每一次響應中,都包含status欄位,即服務狀態代碼,此處列舉通用錯誤碼、網關錯誤碼、配置錯誤碼錶格,如下表所示。

通用錯誤碼

狀態代碼

狀態訊息

原因

解決方案

狀態代碼

狀態訊息

原因

解決方案

40000000

預設的用戶端錯誤碼,對應了多個錯誤訊息。

使用者使用了不合理的參數或者調用邏輯。

請參考官網文檔範例程式碼進行對比測實驗證。

40000001

The token 'xxx' has expired;

The token 'xxx' is invalid

使用者使用了不合理的參數或者調用邏輯。通用用戶端錯誤碼,通常是涉及Token相關的不正確使用,例如Token到期或者非法。

請參考官網文檔範例程式碼進行對比測實驗證。

40000002

Gateway:MESSAGE_INVALID:Can't process message in state'FAILED'!

無效或者錯誤的報文訊息。

請參考官網文檔範例程式碼進行對比測實驗證。

40000003

PARAMETER_INVALID;

Failed to decode url params

使用者傳遞的參數有誤,一般常見於RESTful介面調用。

請參考官網文檔範例程式碼進行對比測實驗證。

40000005

Gateway:TOO_MANY_REQUESTS:Too many requests!

並發請求過多。

如果是試用版調用,建議您升級為商用版本以增大並發。

如果已是商用版,可購買並發資源套件,擴充您的並發額度。

40000009

Invalid wav header!

錯誤的訊息頭。

如果您發送的是WAV語音檔案,且設定formatwav,請注意檢查該語音檔案的WAV頭是否正確,否則可能會被服務端拒絕。

40000009

Too large wav header!

傳輸的語音WAV頭不合法。

建議使用PCM、OPUS等格式發送音頻流,如果是WAV,建議關注語音檔案的WAV頭資訊是否為正確的資料長度大小。

40000010

Gateway:FREE_TRIAL_EXPIRED:The free trial has expired!

試用期已結束,並且未開通商用版、或帳號欠費。

請登入控制台確認服務開通狀態以及賬戶餘額。

40010001

Gateway:NAMESPACE_NOT_FOUND:RESTful url path illegal

不支援的介面或參數。

請檢查調用時傳遞的參數內容是否和官網文檔要求的一致,並結合錯誤資訊對比排查,設定為正確的參數。

比如您是否通過curl命令執行RESTful介面請求, 拼接的URL是否合法。

40010003

Gateway:DIRECTIVE_INVALID:[xxx]

用戶端側通用錯誤碼。

表示用戶端傳遞了不正確的參數或指令,在不同的介面上有對應的詳細報錯資訊,請參考對應文檔進行正確設定。

40010004

Gateway:CLIENT_DISCONNECT:Client disconnected before task finished!

在請求處理完成前用戶端主動結束。

無,或者請在服務端響應完成後再關閉連結。

40010005

Gateway:TASK_STATE_ERROR:Got stop directive while task is stopping!

用戶端發送了當前不支援的訊息指令。

請參考官網文檔範例程式碼進行對比測實驗證。

40020105

Meta:APPKEY_NOT_EXIST:Appkey not exist!

使用了不存在的Appkey。

請確認是否使用了不存在的Appkey,Appkey可以通過登入控制台後查看專案配置。

40020106

Meta:APPKEY_UID_MISMATCH:Appkey and user mismatch!

調用時傳遞的Appkey和Token並非同一個帳號UID所建立,導致不匹配。

請檢查是否存在兩個帳號混用的情況,避免使用帳號A名下的Appkey和帳號B名下產生的Token搭配使用。

403

Forbidden

使用的Token無效,例如Token不存在或者已到期。

請設定正確的Token。Token存在有效期間限制,請及時在到期前擷取新的Token。

41000003

MetaInfo doesn't have end point info

無法擷取該Appkey的路由資訊。

請檢查是否存在兩個帳號混用的情況,避免使用帳號A名下的Appkey和帳號B名下產生的Token搭配使用。

41010101

UNSUPPORTED_SAMPLE_RATE

不支援的採樣率格式。

當前即時語音辨識只支援8000 Hz和16000 Hz兩種採樣率格式的音頻。

41040201

Realtime:GET_CLIENT_DATA_TIMEOUT:Client data does not send continuously!

擷取用戶端發送的資料逾時失敗。

用戶端在調用即時語音辨識時請保持即時速率發送,發送完成後及時關閉連結。

50000000

GRPC_ERROR:Grpc error!

受機器負載、網路等因素導致的異常,通常為偶發出現。

一般重試調用即可恢複。

50000001

GRPC_ERROR:Grpc error!

受機器負載、網路等因素導致的異常,通常為偶發出現。

一般重試調用即可恢複。

52010001

GRPC_ERROR:Grpc error!

受機器負載、網路等因素導致的異常,通常為偶發出現。

一般重試調用即可恢複。

即時語音辨識錯誤碼

狀態代碼

狀態訊息

原因

解決方案

狀態代碼

狀態訊息

原因

解決方案

40000004

Gateway:IDLE_TIMEOUT:Websocket session is idle for too long time

請求建立連結後,長時間沒有發送任何資料,超過10s後,服務端會返回此錯誤資訊。

請在建立連結後和服務端保持互動,比如持續發送語音流,您可以在採集音訊同時進行發送, 發送結束後及時關閉連結。

40010004

Gateway:CLIENT_DISCONNECT:Client disconnected before task finished!

在請求處理完成前用戶端主動結束。

無,或者請在服務端響應完成後再關閉連結。

40270002

NO_VALID_AUDIO_ERROR

無效的音頻。

從音頻中沒有識別出有效文本。

40270003

DECODE_ERROR

音頻解碼失敗。

請根據實際音頻格式,設定對應的format參數。

41000002

APPKEY_KEY_IS_NULL

沒有正確設定appkey。

請參考官網文檔及範例程式碼。

  • 本頁導讀 (1, M)
  • 使用須知
  • 就近地區智能接入
  • 服務地址
  • 互動流程
  • 1. 鑒權
  • 2. 開始識別
  • 3. 接收識別結果
  • 4. 結束識別
  • 服務狀態代碼
  • 通用錯誤碼
  • 即時語音辨識錯誤碼
文檔反饋