Intelligent Speech Interactionは、インテリジェントなQ&A、インテリジェントな品質検査、字幕翻訳、音声記録のトランスクリプションなど、さまざまなシナリオに適しています。Intelligent Speech Interactionは、金融、保険、電子商取引、スマートホームなど、多くの業界での適用に成功しています。また、自己学習プラットフォームを使用して音声認識精度を向上させることができ、包括的な管理コンソールと使いやすいSDKを提供します。ぜひこの機会にIntelligent Speech Interactionをご活用ください。
サービスの特徴
-
高い認識精度
Alibaba Cloud は、中国で最初に 単語レベルで LC-BLSTM および DFSMN-CTCモデルを使用したクラウドサービスプロバイダーです。 業界で従来用いられてきた CTC 方式と比較して、これらのモデルはエラー発生率が 20% 低く、音声認識の精度も大幅に向上します。
-
超高速の復号速度
Alibaba Cloud は、中国で初めて低フレームレート (LFR) 復号技術を使用したクラウドプロバイダーです。 認識精度を犠牲にすることなく、3 倍を超える復号速度の高速化により応答時間が大幅に短縮され、ユーザーエクスペリエンスが向上します。
-
新しい自己学習プラットフォーム
Intelligent Speech Interaction は、業界で初めて自己学習プラットフォームを備えたシステムです。 ホットワードを指定してビジネスに関連するデータをアップロードすることにより、認識精度を向上するための特定のモデルを構築できます。
-
幅広い業界に対応
現在、Intelligent Speech Interaction は、金融、保険、E コマース、スマートホームなど、多種多様な業界のお客様にご利用いただいています。 インテリジェントな Q&A、インテリジェントな品質検査、字幕翻訳、音声アシスタントなど、さまざまなシナリオに適しています。
製品とサービス
録音ファイル認識
ユーザーがアップロードした音声ファイルを、24 時間以内にテキストに変換します。 コールセンターの品質保証、訴訟記録、議事録の要約、診療記録など、時間的な制約が小さいシナリオに適しています。
リアルタイム音声認識
音声ストリームをリアルタイムでテキストに変換します。 インテリジェントセグメンテーションを使用して、文の開始と終了を認識します。 リアルタイム音声認識は、ライブビデオ、会議、裁判でのリアルタイム文字起こしなど、リアルタイム応答に関する要件が厳しいシナリオに適しています。
短文認識
短い音声 (1 分未満) をテキストに変換します。 音声検索、音声コマンド制御、音声ショートメッセージなどのリアルタイムシナリオに適しています。 短文認識は、さまざまなアプリケーション、スマートホーム家電、スマートアシスタントなどと統合できます。
音声合成
テキストを自然音声に変換します。 さまざまな種類の音声が用意され、スピード、イントネーション、音量を調整できます。 インテリジェントな顧客サービス、対話、オーディオブック、放送などのシナリオに適しています。
自己学習型プラットフォーム
ビジネスに関連するデータをアップロードして、特定のユーザーケースにおける認識精度を向上させることができます。現在は、言語モデルをカスタマイズするために、テキストのみをアップロードすることができます。将来的には、音響モデルをカスタマイズするために、音声データをアップロードできるようになる予定です。