本文由簡體中文內容自動轉碼而成。阿里雲不保證此自動轉碼的準確性、完整性及時效性。本文内容請以簡體中文版本為準。

功能特性

更新時間:2024-12-18 11:48

本文為您介紹Intelligent Speech Interaction的各項功能及其對應情境、支援的語音格式和調用方式。

功能服務參數表

服務

時效性

功能

適用情境

支援的語音格式

支援調用方式

免費調用量

購買

服務

時效性

功能

適用情境

支援的語音格式

支援調用方式

免費調用量

購買

一句話識別

即時

識別一分鐘內的短語音。

APP語音搜尋、語音電話客服、對話聊天、控制口令等情境。

PCM(無壓縮的PCM或WAV檔案)、OPUS

Java/C++/Android/iOS

最大2個並發

可單獨購買

即時語音辨識

即時

識別長時間的語音資料流。

會議演講、ApsaraVideo for Live等長時間不間斷語音情境。

PCM(無壓縮的PCM或WAV檔案)

Java/C++/Android/iOS

最大2個並發

可單獨購買

語音合成

即時

合成長度不超過300個字元(UTF-8編碼)的常值內容。

需要人工合成音的情境。

PCM、WAV、MP3

Java/C++/Android/iOS

最大2個並發

可單獨購買

錄音檔案識別

非即時

錄音檔案上傳後(檔案大小不超過512 MB),針對免費使用者,可在24小時內完成識別並返回識別文本;針對付費使用者,可在6小時內完成識別並返回識別文本。

說明

一次性上傳大規模資料(半小時內上傳超過500小時時間長度的錄音)的除外,如果您有大規模資料轉寫需求,可與售前專家聯絡。

非即時識別情境。

支援單軌/雙軌的WAV、MP3

Java/C++/GO/.NET/Node.js/PHP/Python

每個自然日最多識別2小時時間長度的錄音檔案

可單獨購買

錄音檔案識別極速版

即時

識別檔案大小不超過100 MB,30分鐘以內時間長度的音頻,轉寫完成時間不超過10秒。

短視頻編輯工具、 電台和報社字幕內容。

AAC、MP3、OPUS、WAV

HTTP POST/Android/iOS

暫不支援免費試用

可單獨購買

長文本語音合成

非即時

將超長文本(千字或萬字)合成為語音位元據。

閱讀小說、文章等情境。

PCM、WAV、MP3

JAVA/C++/RESTful API

暫不支援免費試用

可單獨購買

裝置端語音互動SDK

即時

遠場訊號處理、語音喚醒、人聲檢測、線上語音辨識以及線上語音合成。

智能音箱、兒童教育故事機、語音IoT家電等需要遠近場語音互動的智能硬體裝置端。

PCM、WAV

Android/iOS/Linux/RTOS

10個免費裝置授權

可單獨購買

重要

  • 除錄音檔案識別和錄音檔案識別極速版以外的其他識別服務只支援單聲道(mono)語音資料。

  • 識別服務只支援8000Hz/16000Hz採樣率、16bit採樣位元的音頻。

  • 本頁導讀 (1, M)
  • 功能服務參數表
文檔反饋
phone 聯絡我們

立即和Alibaba Cloud在線服務人員進行交談,獲取您想了解的產品信息以及最新折扣。

alicare alicarealicarealicare