ApsaraVideo Media Processing(MPS)を使用すると、オーディオファイルまたはビデオファイルを 1 つ以上のファイルに変換して、さまざまなネットワーク帯域幅、端末処理能力、ユーザーニーズに適応させることができます。 MPS は、メディアファイルのコンテンツ、テキスト、音声、シーンをマルチモーダル分析し、自動レビュー、コンテンツ認識、スマート編集などのさまざまな機能を提供します。
オーディオとビデオのトランスコーディング
オーディオとビデオのトランスコーディング機能を使用すると、オーディオストリームとビデオストリームの解像度、エンコード形式、またはコンテナ形式を変換して、さまざまなネットワーク帯域幅と再生デバイスに適応させることができます。 MPS は、主流のエンコード形式とコンテナ形式をサポートしており、トランスコーディング中に簡単な編集操作を実行したり、透かしや字幕を追加したりすることができます。次の表に、オーディオとビデオのトランスコーディング機能の仕様を示します。 MPS コンソールまたは API 操作では使用できない仕様を使用するには、営業担当者の助けを借りてテクニカルサポートにお問い合わせください。
次の表に記載されている機能を使用するには、トランスコーディングジョブを送信する必要があります。通常のトランスコーディング料金は、出力ビデオの仕様と長さによって課金されます。詳細については、「オーディオとビデオのトランスコーディング料金」をご参照ください。
項目 | パラメータ | 説明 |
入力ファイル | コンテナ形式 |
|
ビデオエンコード形式 | Apple ProRes、AVS+、AVS、AVS2、H.263、H.263+、H.264/AVC、H.265/HEVC、H.266/VVC、MJPEG、MPEG-1、MPEG-2、MPEG-4、QuickTime、RealVideo、VP8、VP9、WMV。 | |
オーディオエンコード形式 | AAC、AC3、ADPCM、AMR、DSD、EAC3、MP1、MP2、MP3、PCM、RealAudio、Vorbis、WMA。 | |
ファイルサイズ | 最大サイズは 100 GB です。 | |
クロマ | 例: 4:2:2、4:2:0。 | |
出力ファイル | コンテナ形式 | 説明
|
エンコード形式 |
| |
エンコードプロファイル |
| |
解像度 |
| |
ビットレート |
| |
フレームレート | 最大出力フレームレートは 60 フレーム/秒(FPS)です。 | |
サンプリングビット深度 |
| |
ピクセル形式 | 例: yuv420p、yuvj420p、yuv422p、yuvj422p、yuv444p、yuvj444。 | |
ビットレート制御 | 可変ビットレート(VBR)、固定ビットレート(CBR)、平均ビットレート(ABR)、定率係数(CRF)。 | |
スキャンモード | 入力ビデオのスキャンモード、自動インターレース解除、インターレーススキャン、シーケンシャルスキャンがサポートされています。 |
狭帯域 HDTM
狭帯域 HDTM は、Alibaba Cloud でサポートされているトランスコーディングテクノロジーに基づくメディア処理機能です。この機能を使用すると、画質を損なうことなく、ビデオの圧縮効率を向上させ、ファイルサイズを縮小できます。これにより、再生中のビデオの途切れを減らし、ストレージとトラフィックのコストを節約できます。
次の表で説明されている Narrowband HD™ 機能を使用するには、[トランスコーディングテンプレート] を選択してから、[トランスコーディングジョブを送信] する必要があります。 Narrowband HD™ トランスコーディング 料金は、出力ビデオの仕様と長さによって課金されます。
機能 | 説明 |
狭帯域 HDTM 1.0 | MPS は、ビデオ内のシーン、アクション、コンテンツ、テクスチャなどの詳細をインテリジェントに分析します。これにより、画質を変更することなくビットレートを 20%~ 40% 削減するか、同じネットワーク帯域幅条件下でビデオの解像度を向上させます。サポートされているコーデックは H.264 と H.265 です。その他の構成項目は、オーディオとビデオのトランスコーディングと同じです。無料トライアルを開始。 |
狭帯域 HDTM 2.0 | MPS は、エンコーダの上限を改善し、解像度の復元と拡張機能を統合します。これにより、画質を変更することなくビットレートを 40%~ 60% 削減するか、低いネットワーク帯域幅条件下でビデオの解像度を向上させます。サポートされているコーデックは H.264 と H.265 です。その他の構成項目は、オーディオとビデオのトランスコーディングと同じです。無料トライアルを開始。 |
オーディオエンハンスメント
オーディオエンハンスメント
ApsaraVideo Audio Lab は、信号処理と深層学習テクノロジーを組み合わせて、フルシナリオのオーディオエンハンスメントと修復ソリューションを提供します。
次の表に記載されているオーディオエンハンスメント機能を使用するには、トランスコーディングジョブを送信するときに適切なトランスコーディングテンプレートを選択する必要があります。オーディオエンハンスメント料金は、出力オーディオの仕様と長さによって課金されます。ビデオトランスコーディング料金は、使用する機能の請求ルールに基づいて課金されます。オーディオエンハンスメントのトランスコーディングテンプレートを設定するには、DingTalk グループ(ID 32171220)を検索して参加し、Alibaba Cloud テクニカルサポートにお問い合わせください。
機能 | 説明 |
サウンドエンハンスメント | MPS は、モノラルオーディオストリーム、バイノーラルオーディオストリーム、および 5.1 または 7.1 サラウンドサウンド形式を使用するオーディオストリームのサウンドエンハンスメントをサポートしています。イヤホンまたはスピーカーを使用して音楽、音声、またはビデオを再生する場合、MPS は高品質で自然でクリアなカスタマイズ可能なサウンドエフェクトを提供します。 |
音量正規化 | MPS は、ビデオの音量をインテリジェントに正規化します。これにより、短いビデオや音楽が連続再生されるシナリオで、コンテンツソースの音量の違いによる音量の不安定さの問題を解決できます。 |
高速トランスコーディング
MPS は、ビデオを複数のセグメントに分割し、それらを並列にトランスコードする高速トランスコーディング機能をサポートしています。これにより、トランスコーディング速度が 5 ~ 30 倍になり、処理時間が大幅に短縮されます。この機能は、ニュースやイベントなど、高い適時性を必要とする重要なコンテンツに適しています。
この機能を使用するには、高速トランスコーディング用の MPS キューを有効にし、この MPS キューにトランスコーディングジョブを送信する必要があります。高速トランスコーディング料金は、出力ビデオの仕様、長さ、およびトランスコーディング速度に基づいて課金されます。さらに、音声とビデオのトランスコーディングまたはオーディオビジュアルエンハンスメント機能についても課金されます。
機能 | 説明 |
速度向上 | トランスコーディング速度は、ビデオのフォーマット、解像度、ビットレートなど、入力ビデオのプロパティに応じて 5 ~ 30 倍に向上させることができます。高速トランスコーディング用の MPS キューに対して、5 倍、10 倍、20 倍、30 倍など、想定される速度向上を指定できます。 |
シナリオ | 30 分を超えるビデオ、または高フレームレート、超高解像度、オーディオビジュアルエンハンスメントを必要とするビデオには、高速トランスコーディングを使用することをお勧めします。詳細については、「制限」トピックの高速トランスコーディングの制限セクションをご参照ください。 |
ポリシー | 分割はすべてのビデオでサポートされているわけではありません。高速トランスコーディングでサポートされていないビデオを高速トランスコーディング用の MPS キューに送信すると、ビデオはデフォルトで通常の方法でトランスコードされます。 |
その他の機能
メディア情報
MPS は、オブジェクトストレージサービス(OSS)に保存されているオーディオファイルとビデオファイルに関する情報(ファイルの解像度、ビットレート、フレームレート、コーデック、形式など)を取得できます。
SubmitMediaInfoJob オペレーションを呼び出して、この機能を使用する必要があります。 API リクエストの数に基づいて課金されます。 詳細については、「オーディオとビデオのトランスコード料金」トピックの API 呼び出しの料金 セクションをご参照ください。
ビデオ編集
ビデオに対して簡単な編集操作を実行できます。 たとえば、オーディオまたはビデオの抽出、ビデオのマージ、ビデオのクリップ、オーディオのミキシングなどが可能です。
次の表で説明するビデオ編集機能を使用するには、トランスコードジョブを送信 する際に関連するパラメータを設定する必要があります。 トランスコード料金は、出力ビデオの仕様と長さによって異なります。
機能 | 説明 | API オペレーションのパラメータ | MPS コンソール |
オーディオ抽出 | この機能を使用すると、ビデオストリームを無効にすることで、ビデオからオーディオストリームを抽出できます。 | Remove | サポートされています |
ビデオ抽出 | この機能を使用すると、オーディオストリームを無効にすることで、ビデオからビデオストリームを抽出できます。 | Remove | サポートされています |
黒帯の削除 | この機能を使用すると、ビデオに黒帯が存在するかどうかを検出できます。 黒帯が存在する場合、システムは自動的に黒帯を削除します。 | Crop | サポートされていません |
ビデオのクロッピング | この機能を使用すると、ビデオ画像のサイズ変更、サイズ変更された画像の位置の調整、元の画像とサイズ変更された画像の間のギャップの削除を行うことができます。 | Crop | サポートされていません |
黒帯の追加 | この機能を使用すると、ビデオ画像のサイズ変更、サイズ変更された画像の位置の調整、元の画像とサイズ変更された画像の間のギャップを黒帯で埋めることができます。 | Pad | サポートされていません |
画面の自動回転 | この機能を使用すると、ビデオの幅と高さではなく、長辺と短辺に基づいてビデオの解像度を変換できます。 入力ビデオに横長モードと縦長モードのビデオが含まれている場合は、この機能を有効にすることをお勧めします。 | LongShortMode | サポートされています |
ビデオの回転 | この機能を使用すると、ビデオの回転角度を設定できます。 | Rotate | サポートされています |
ビデオのマージ | この機能を使用すると、最大 100 個のビデオを 1 つにマージできます。 マージする各ビデオの開始時点と長さを設定できます。 | MergeList または MergeConfigUrl | サポートされていません |
ビデオクリップ |
| Clip | サポートされています |
ビデオのヘッドとテール | この機能を使用すると、ビデオの冒頭に動的ロゴを追加し、ビデオの末尾のコンテンツを指定できます。 これにより、製品の認知度を高め、著作権情報を強調表示できます。 | OpeningList および TailSlateList | ビデオテールの追加はサポートされています。 |
ぼかし | この機能を使用すると、ビデオの指定された領域をぼかすことができます。 | DeWatermark | サポートされていません |
オーディオミキシング | この機能を使用すると、2 つのオーディオトラックを 1 つにマージできます。 この機能を使用して、BGM を追加できます。 | Amix | サポートされていません |
ビデオスナップショット
ビデオスナップショット機能を使用して、ビデオの特定の時点における特定のサイズのスナップショットを撮ることができます。 スナップショットは、ビデオのサムネイル、スプライト、プログレスバーのサムネイルに使用されます。
次の表で説明するビデオスナップショット機能を使用するには、スナップショットジョブを送信 する必要があります。 スナップショット料金は、スナップショットの数に基づいて課金されます。
機能 | 説明 | API オペレーションのパラメーター | MPS コンソール |
静的スナップショット | この機能を使用すると、動画の特定の時点における特定のサイズの静止画を JPG 形式で取得できます。次のスナップショットモードが提供されています。
| SnapshotConfig | サポート対象 |
スプライトスナップショット | この機能を使用すると、特定のルールに基づいて取得されたスナップショットを 1 つの画像にマージして、スプライトを作成できます。スプライトは JPG 形式です。このタイプのスナップショットは非同期で取得されます。ユーザーは、一度に複数の画像に関する情報を照会するリクエストを送信できます。これにより、画像に対する API リクエストの数が大幅に削減され、クライアントのパフォーマンスが向上します。 | TileOut および TileOutputFile | サポート対象外 |
WebVTT スナップショット | この機能を使用すると、取得されたスナップショットまたは作成されたスプライトの VTT ファイルを生成できます。VTT ファイルには、スナップショットが取得された時刻、スナップショットのパス、スプライト内のスナップショットの座標が含まれています。クライアントが画像をリクエストすると、対応する VTT ファイルが取得され、解析された後に画像が表示されます。この機能は、プログレスバーにサムネイルを表示するために使用できます。 | SubOut | サポート対象 |
キーフレームスナップショット | この機能を使用すると、キーフレームのみをキャプチャできます。指定された時点のフレームがキーフレームでない場合は、隣接するキーフレームがキャプチャされます。 | FrameType | サポート対象 |
黒画面検出 | この機能を使用すると、最初のスナップショットが黒画面かどうかを検出できます。この機能を使用するには、Time パラメーターを 0 に設定します。これは、動画の開始からスナップショットが取得されることを指定します。画像内の黒いピクセルの割合と黒いピクセルの色の値を指定することで、黒画面を定義できます。黒画面検出機能が有効になっている場合、システムは動画の最初の 5 秒間のフレームをチェックします。黒以外のフレームが存在する場合、黒以外のフレームがキャプチャされます。それ以外の場合、ジョブが単一スナップショットジョブの場合はジョブは失敗し、ジョブが複数スナップショットジョブの場合は最初の黒いフレームがキャプチャされます。 | BlackLevel および PixelBlackThreshold | サポート対象 |
ビデオのウォーターマーク
この機能を使用すると、企業ロゴやテレビ局のロゴなどの可視ウォーターマークをビデオに追加して、ブランドを強調したり、著作権を保護したり、製品の人気を高めたりできます。 また、著作権追跡のために、ビデオに不可視ウォーターマークを追加することもできます。 詳細については、このトピックの デジタルウォーターマーク セクションをご参照ください。
次の表で説明されているビデオのウォーターマーク機能を使用するには、トランスコードジョブを送信 し、ウォーターマークマテリアルとウォーターマークテンプレートを指定する必要があります。 ウォーターマークテンプレートはオプションです。 トランスコード 料金は、出力ビデオの仕様と長さによって異なります。 ウォーターマーク料金は、ウォーターマークの数に基づいて課金されます。
機能 | 説明 | API操作のパラメーター | MPSコンソール |
画像ウォーターマーク |
| WaterMarks | |
テキストウォーターマーク | WaterMarks | サポート対象外 |
キャプション
この機能を使用すると、ビデオにキャプションを追加して、理解と鑑賞を深めることができます。
次の表で説明されているキャプション機能を使用するには、トランスコードジョブを送信 するか、トランスコードワークフローを作成してワークフローをトリガー する必要があります。 トランスコード料金は、出力ビデオの仕様と長さによって異なります。
機能 | 説明 | API オペレーションのパラメーター | MPS コンソール |
キャプションのパッケージ化 | パッケージ化ワークフローを使用して、キャプションファイルとオーディオおよびビデオストリームを M3U8 または MPD 形式のマスタープレイリストに統合できます。マスタープレイリストには最大 4 つのキャプションを追加できます。これにより、異なるバージョンのキャプションを切り替えることができます。HTTP Live Streaming(HLS)パッケージ化ワークフローは、VTT 形式のキャプションをサポートしています。Dynamic Adaptive Streaming over HTTP(DASH)パッケージ化ワークフローは、VTT、STL、および TTML 形式のキャプションをサポートしています。 |
| 対応済み |
ビデオパッケージング
パッケージングとは、異なるビットレートの複数のビデオストリーム、複数のキャプションストリーム、および複数のオーディオストリームに対してマスタープレイリストが生成されるプロセスを示します。 パッケージング機能を使用すると、ストリーミングメディア再生中に次の操作を実行できます。
アダプティブストリーミング:スムーズなライブストリーミングを確保するために、自動ビットレート調整をサポートします。
広告の配置:セグメント間のビデオ広告の配置をサポートします。
次の表で説明されているビデオパッケージング機能を使用するには、トランスコードワークフローを作成してワークフローをトリガー する必要があります。 トランスコード 料金は、出力ビデオの仕様と長さによって異なります。
機能 | 説明 | API操作のパラメーター | MPSコンソール |
HLSパッケージング | セカンダリインデックスをサポートするHLSが動画のパッケージングに使用されます。 HLSは、M3U8形式のインデックスファイルとTS形式のビデオファイルをサポートしています。 | 詳細については、「HLSパッケージを実行する方法」をご参照ください。 | サポートされています |
CMAFパッケージング | HLSまたはDASHの出力形式をサポートするCommon Media Application Format(CMAF)がパッケージングに使用されます。 | 該当なし | サポートされていません |
カスタムセグメント長 | 動画をセグメント化したい最大10個の時点と、セグメントの長さを指定できます。セグメントの長さは1秒から60秒です。この機能により、メディアセグメントの長さを再生クライアントのネットワーク帯域幅に適合させることができます。このようにして、最初のフレームの読み込み時間が短縮されます。 | セグメント | サポートされていません |
ビデオの暗号化
次の表で説明されているビデオの暗号化機能を使用するには、トランスコードワークフローを作成してワークフローをトリガー する必要があります。 トランスコード 料金は、出力ビデオの仕様と長さによって異なります。
機能 | 説明 | API操作のパラメーター | MPSコンソール |
HLS暗号化 | この機能を使用すると、自己管理キーまたはKey Management Service ( KMS ) キーを使用して、HLS AES-128プロトコルに基づいて動画を暗号化できます。 HLSストリームをサポートするプレーヤーで動画を復号化して再生できます。 これにより、モバイルデバイスでの動画のセキュリティが確保され、高レベルのセキュリティと優れた端末互換性が提供されます。 | N/A | サポートされています |
Alibaba Cloud独自暗号化 | この機能を使用すると、Alibaba Cloud独自暗号化プロトコルに基づいて動画を暗号化し、暗号化されたHLS形式に変換できます。 KMSキーのみがサポートされています。 ApsaraVideo Playerを使用して動画を復号化して再生する必要があります。 それ以外の場合、動画をオンプレミスデバイスにダウンロードしても、再生または送信することはできません。 これにより、モバイルデバイスとFlashプレーヤーでの動画のセキュリティが確保されます。 この機能は、オンライン教育やサブスクリプションベースの視聴など、高レベルのセキュリティが必要なシナリオで使用できます。 | N/A | サポートされています |
高速トランスコーディング
自動レビュー
この機能を使用すると、メディアファイルのコンテンツ (タイトル、概要、サムネイル、ビデオ、オーディオなど) を確認できます。これにより、ビデオ内の禁止されているコンテンツを効率的に検出できます。この機能は、ショートビデオレビュー、ライブストリーミングレビュー、メディアレビューなど、複数のシナリオで使用できます。
次の表で説明されている自動レビュー機能を使用するには、メディアレビュージョブを送信する必要があります。自動レビュー料金は、処理されたビデオの長さに基づいて課金されます。
機能 | コンテンツ | 説明 |
コンテンツモデレーション | ポルノ検出 | 音声、テキスト、画像など、さまざまな側面からポルノや性的なコンテンツを検出します。 |
テロコンテンツ検出 | 武器、流血シーン、特定の衣装、煙と光のシーン、特別なシンボル、群衆、パレードなど、10以上の側面からテロコンテンツを検出します。 | |
広告違反検出 | 広告テキスト、透かし、QRコード、違法広告、ミニプログラムコードなど、さまざまな形式の広告を検出します。 | |
ロゴ検出 | 動画や画像内のロゴ (テレビ局のロゴ、商標、透かしなど) を検出します。これは著作権の保護に役立ちます。 | |
好ましくないコンテンツの検出 | 動画や画像内の好ましくないシーン (ピクチャインピクチャ (PiP)、喫煙、運転中のライブ配信、無意味な画像など) を検出します。 | |
音声スパム対策 | ポルノ、テロ、虐待など、音声内の違法コンテンツを検出します。中国語と英語の音声認識がサポートされています。 |
メディアフィンガープリント
メディアフィンガープリント機能は、Alibaba Cloud によって開発されたビデオ認識テクノロジーに基づいて実装されています。この機能は、フィンガープリントを使用してメディアファイルを一意にマークし、メディアファイル間でフィンガープリントを抽出して比較できるようにします。これにより、重複するビデオを検出し、ビデオクリップのソースを追跡できます。
次の表で説明されているメディアフィンガープリント機能を使用するには、メディアフィンガープリントジョブを送信する必要があります。メディアフィンガープリント料金は、処理されたビデオまたはオーディオの長さに基づいて課金されます。
機能 | 説明 |
メディアフィンガープリント | この機能を使用して、動画のフィンガープリントを抽出し、フィンガープリントライブラリに動画フィンガープリントをインポートおよび分析し、類似の動画を検索できます。 |
オーディオフィンガープリント | この機能を使用して、音声のフィンガープリントを抽出し、フィンガープリントライブラリに音声フィンガープリントをインポートおよび分析し、類似の音声を検索できます。 |
画像フィンガープリント | この機能を使用して、画像のフィンガープリントを抽出し、フィンガープリントライブラリに画像フィンガープリントをインポートおよび分析し、類似の画像を検索できます。 |
テキストフィンガープリント | この機能を使用して、テキストのフィンガープリントを抽出し、フィンガープリントライブラリにテキストフィンガープリントをインポートおよび分析し、類似のテキストを検索できます。 |
サービス管理
機能 | 説明 | API操作のパラメーター | MPSコンソール |
メディア管理 | メディアファイルをアップロード、管理、公開できます。 | 該当なし | 該当なし |
ワークフローオーケストレーション | オーディオファイルまたはビデオファイルをアップロードした後、MPSはクラウドでワークフローを自動的に実行します。 | 該当なし | サポート対象 |
トランスコーディングテンプレート | トランスコーディングテンプレートは、トランスコーディングパラメーターの集合です。トランスコーディングジョブを作成する場合、またはワークフローを使用する場合、トランスコーディングテンプレートを使用して操作を簡素化できます。 トランスコーディングテンプレートは、カスタムテンプレート、カスタマイズテンプレート、プリセットテンプレートの3つのタイプに分類できます。 | TemplateId | サポート対象 |
ウォーターマークテンプレート | ウォーターマークテンプレートは、ウォーターマークの位置とサイズを決定するパラメーターなど、複数のパラメーターの設定を指定します。 ウォーターマークテンプレートを使用すると、ウォーターマークプロセスを簡素化できます。 | WaterMarkTemplateId | サポート対象 |
トランスコーディングの優先順位 | MPSキュー内のトランスコーディングジョブの優先順位を指定できます。 最大10の優先順位レベルを指定できます。 | Priority | サポート対象外 |
条件付きトランスコーディング | 入力ビデオのビデオビットレート、ビデオ解像度、またはオーディオビットレートが指定された出力設定より小さい場合、ビデオは元の品質でトランスコードされるか、トランスコーディングは実行されません。 | 例: IsCheckReso および IsCheckResoFail | サポート対象 |
MPSキュー | トランスコーディングや非同期スナップショットジョブなどのMPSジョブは、非同期的に処理されます。 スケジューリングと実行のために、ジョブをMPSキューに追加する必要があります。 複数のMPSキューを作成し、MPSキュー内のジョブの優先順位を指定できます。 最大10の優先順位レベルがサポートされています。 | Priority | サポート対象外 |
メッセージ通知 | トランスコーディングや非同期スナップショットジョブなどのMPSジョブは、非同期的に処理されます。 メッセージサービス( MNS )を統合して、 MNS トピックまたはキューをMPSキューまたはワークフローに関連付けることができます。 MPSキュー内のジョブが完了したとき、またはワークフローが開始または停止したときに、MPSは指定された連絡先に通知を送信します。 | NotifyConfig | サポート対象 |