服務 | 時效性 | 功能 | 適用情境 | 支援的語音格式 | 支援調用方式 | 免費調用量 | 購買 |
一句話識別 | 即時 | 識別一分鐘內的短語音。 | APP語音搜尋、語音電話客服、對話聊天、控制口令等情境。 | PCM(無壓縮的PCM或WAV檔案)、OPUS | Java/C++/Android/iOS | 最大2個並發 | 可單獨購買 |
即時語音辨識 | 即時 | 識別長時間的語音資料流。 | 會議演講、ApsaraVideo for Live等長時間不間斷語音情境。 | PCM(無壓縮的PCM或WAV檔案) | Java/C++/Android/iOS | 最大2個並發 | 可單獨購買 |
語音合成 | 即時 | 合成長度不超過300個字元(UTF-8編碼)的常值內容。 | 需要人工合成音的情境。 | PCM、WAV、MP3 | Java/C++/Android/iOS | 最大2個並發 | 可單獨購買 |
錄音檔案識別 | 非即時 | 錄音檔案上傳後(檔案大小不超過512 MB),針對免費使用者,可在24小時內完成識別並返回識別文本;針對付費使用者,可在6小時內完成識別並返回識別文本。 說明 一次性上傳大規模資料(半小時內上傳超過500小時時間長度的錄音)的除外,如果您有大規模資料轉寫需求,可與售前專家聯絡。 | 非即時識別情境。 | 支援單軌/雙軌的WAV、MP3 | Java/C++/GO/.NET/Node.js/PHP/Python | 每個自然日最多識別2小時時間長度的錄音檔案 | 可單獨購買 |
錄音檔案識別極速版 | 即時 | 識別檔案大小不超過100 MB,30分鐘以內時間長度的音頻,轉寫完成時間不超過10秒。 | 短視頻編輯工具、
電台和報社字幕內容。 | AAC、MP3、OPUS、WAV | HTTP POST/Android/iOS | 暫不支援免費試用 | 可單獨購買 |
長文本語音合成 | 非即時 | 將超長文本(千字或萬字)合成為語音位元據。 | 閱讀小說、文章等情境。 | PCM、WAV、MP3 | JAVA/C++/RESTful API | 暫不支援免費試用 | 可單獨購買 |
裝置端語音互動SDK | 即時 | 遠場訊號處理、語音喚醒、人聲檢測、線上語音辨識以及線上語音合成。 | 智能音箱、兒童教育故事機、語音IoT家電等需要遠近場語音互動的智能硬體裝置端。 | PCM、WAV | Android/iOS/Linux/RTOS | 10個免費裝置授權 | 可單獨購買 |