全部產品
Search
文件中心

ApsaraVideo VOD:音頻處理

更新時間:Jul 13, 2024

本文為您介紹通過OpenAPI進行視訊剪輯時音頻處理情境的Timeline常用配置樣本,包括整體靜音、指定區間靜音、提取音頻、視頻靜音+完整音頻混音、視頻靜音+音頻指定區間混音、視頻調節音量+音頻調節音量、音頻拼接、多軌音頻混音、綜合配音等樣本。

相關API

Timeline樣本

整體靜音

整體靜音指將視頻資源中的聲音進行整體消除,即靜音操作。如下樣本中使用了針對音訊Volume Effect。Gain的含義是音量增益,值為0表示靜音。

{
    "VideoTracks": [
        {
            "VideoTrackClips": [
                {
                    "MediaId": "3f7e62d41a334dec9ac802b0f165****",
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "0"
                        }
                    ]
                }
            ]
        }
    ]
}

指定區間靜音

指定區間靜音與視頻整體靜音的參數相比,增加了針對Volume Effect進行的入出點參數的設定。對視頻的第8秒到第60秒的區間進行靜音,視頻的剩餘部分維持原始音量不變,樣本如下:

{
    "VideoTracks": [
        {
            "VideoTrackClips": [
                {
                    "MediaId": "3f7e62d41a334dec9ac802b0f165****",
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "0",
                            "In": 8,
                            "Out": "60"
                        }
                    ]
                }
            ]
        }
    ]
}

提取音頻

提取音頻指在某些情境中,需要將視頻資源中的音頻提取為單獨的音頻資源,您可以參考下面的樣本,建立AudioTracks,將視頻資源傳入作為AudioTrackClips傳入即可,b3f37e05512043f49f697f7425b9****表示一個帶聲音的視頻資源ID。

{
    "AudioTracks": [
        {
            "AudioTrackClips": [
                {
                    "MediaId": "b3f37e05512043f49f697f7425b9****"
                }
            ]
        }
    ]
}

視頻靜音+完整音頻混音

視頻靜音+完整音頻混音指將原視頻靜音後重新配音,合成新的視頻,是一個典型的配音情境。樣本如下:

  • 所有與音頻處理相關的Clip都放入AudioTrack。

  • TimelineIn設為5,表明該音頻在輸出視頻的第5秒開始疊加。

  • TimelineOut不設,則預設為整段音頻都將進行混流,如果音訊尾部超過了視頻軌的總時間長度,則將對音頻進行截斷,播放至視頻軌的尾部。

說明

AudioTrackClip可以是純音頻資源,也可以是帶聲音的視頻資源。

{
    "VideoTracks": [
        {
            "VideoTrackClips": [
                {
                    "MediaId": "3f7e62d41a334dec9ac802b0f165****",
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "0"
                        }
                    ]
                }
            ]
        }
    ],
    "AudioTracks": [
        {
            "AudioTrackClips": [
                {
                    "MediaId": "4a71744998414cbe8ea1976435a7****",
                    "TimelineIn":5
                }
            ]
        }
    ]
}

視頻靜音+音頻指定區間混音

與視頻靜音+完整音頻混音相比,視頻靜音+音頻指定區間混音增加了對音頻Clip入出點的設定。截取音頻第10秒到第20秒的區間(即10秒的音頻片段),從輸出視頻的第5秒開始疊加,樣本如下:

說明

AudioTrackClip可以是純音頻資源,也可以是帶聲音的視頻資源。

{
    "VideoTracks": [
        {
            "VideoTrackClips": [
                {
                    "MediaId": "3f7e62d41a334dec9ac802b0f165****",
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "0"
                        }
                    ]
                }
            ]
        }
    ],
    "AudioTracks": [
        {
            "AudioTrackClips": [
                {
                    "MediaId": "4a71744998414cbe8ea1976435a7****",
                    "In":10,
                    "Out":20,
                    "TimelineIn":5
                }
            ]
        }
    ]
}

視頻調節音量+音頻調節音量

您可以通過Volume Effect設定音量,Gain表示音量大小。

Gain參數說明如下:

  • 0為靜音

  • 1為原始音量

  • 0~1之間的值表示小於原始音量,值越小則音量越小

  • 大於1的值表示大於原始音量,值越大則音量越大

說明

AudioTrackClip可以是純音頻資源,也可以是帶聲音的視頻資源。

{
    "VideoTracks": [
        {
            "VideoTrackClips": [
                {
                    "MediaId": "3f7e62d41a334dec9ac802b0f165****",
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "0.5"
                        }
                    ]
                }
            ]
        }
    ],
    "AudioTracks": [
        {
            "AudioTrackClips": [
                {
                    "MediaId": "4a71744998414cbe8ea1976435a7****",
                    "In":10,
                    "Out":20,
                    "TimelineIn":5,
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "2"
                        }
                    ]
                }
            ]
        }
    ]
}

音頻拼接

以上樣本都存在視頻軌,雲剪輯還支援對純音頻軌的處理。在同一個音軌,將兩個音頻資源截取指定的區間順序相接,合成總時間長度為30秒的音頻資源,樣本如下:

說明

AudioTrackClip可以是純音頻資源,也可以是帶聲音的視頻資源。

{
    "AudioTracks": [
        {
            "AudioTrackClips": [
                {
                    "MediaId": "b3f37e05512043f49f697f7425b9****",
                    "In": 100,
                    "Out": 120
                },
                {
                    "MediaId": "ab654a04ce554e4f806b5f9e5a34****",
                    "In": 50,
                    "Out": 60
                }
            ]
        }
    ]
}

多軌音頻混音

除同軌音頻拼接之外,雲剪輯還支援將多個音軌的音頻資源進行混音。合成一個總時間長度為20秒的音頻,樣本如下:

說明

AudioTrackClip可以是純音頻資源,也可以是帶聲音的視頻資源。

{
    "AudioTracks": [
        {
            "AudioTrackClips": [
                {
                    "MediaId": "b3f37e05512043f49f697f7425b9****",
                    "In": 100,
                    "Out": 120,
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "2"
                        }
                    ]
                }
            ]
        },
        {
            "AudioTrackClips": [
                {
                    "MediaId": "ab654a04ce554e4f806b5f9e5a34****",
                    "In": 50,
                    "Out": 60,
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "1"
                        }
                    ]
                }
            ]
        }
    ]
}

綜合配音

綜合配音指視頻+多軌音頻混音,下面是一個綜合應用音頻處理的例子,包括視頻指定區間靜音,指定區間調節音量,外加多個音頻軌混音等功能。具體操作:

  1. 視頻3f7e62d41a334dec9ac802b0f165****的第50秒~75秒靜音。同時在這段時間內,啟用兩個音軌進行混音,第一個音軌截取了音頻素材b3f37e05512043f49f697f7425b9****的第100秒~120秒區間,從50秒處開始插入,到70秒處結束,音量增大到2;第二個音軌截取了音頻素材ab654a04ce554e4f806b5f9e5a34****的第150秒~160秒區間,從65秒處開始插入,到75秒處結束。

  2. 視頻3f7e62d41a334dec9ac802b0f165****的第50秒~75秒、第120秒~125秒之外的區間,音量保持正常。

說明

AudioTrackClip可以是純音頻資源,也可以是帶聲音的視頻資源。

樣本如下:

{
    "VideoTracks": [
        {
            "VideoTrackClips": [
                {
                    "MediaId": "3f7e62d41a334dec9ac802b0f165****",
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "0",
                            "In": 50,
                            "Out": "75"
                        },
                        {
                            "Type": "Volume",
                            "Gain": "0.8",
                            "In": 120,
                            "Out": "125"
                        },

                    ]
                }
            ]
        }
    ],
    "AudioTracks": [
        {
            "AudioTrackClips": [
                {
                    "MediaId": "b3f37e05512043f49f697f7425b9****",
                    "In": 100,
                    "Out": 120,
                    "TimelineIn":50
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "2"
                        }
                    ]
                }
            ]
        },
        {
            "AudioTrackClips": [
                {
                    "MediaId": "ab654a04ce554e4f806b5f9e5a34****",
                    "In": 150,
                    "Out": 160,
                    "TimelineIn":65
                    "Effects": [
                        {
                            "Type": "Volume",
                            "Gain": "1"
                        }
                    ]
                }
            ]
        }
    ]
}

音頻配置淡入淡出

通過添加"Type": "AFade"欄位,實現音訊淡入淡出效果。例如,對音頻軌上的媒資配置3秒淡入,4秒淡出,音量呈線性漸強—漸弱。

{
  "AudioTracks": [
    {
      "AudioTrackClips": [
        {
          "MediaId": "f044b3adc7967ba8f5cdf044b059****",
          "Effects": [
            {
              "Type": "AFade",
              "SubType": "In",
              "Duration": 3,
              "Curve": "tri"
            },
            {
              "Type": "AFade",
              "SubType": "Out",
              "Duration": 4,
              "Curve": "tri"
            }
          ]
        }
      ]
    }
  ]
}

參數欄位

類型

是否必填

描述

SubType

string

音頻淡入淡出子類型,取值:

  • In:淡入。

  • Out:淡出。

Duration

float

淡入或淡出的時間長度,單位:秒。淡入作用於素材片段的開始,淡出作用於素材片段的結束。預設時間長度為0,即無淡入淡出效果。

Curve

string

音頻淡入淡出音量曲線,取值:

  • exp(預設值):音量呈指數型漸強至漸弱。

  • tri:音量呈線性漸強至漸弱。

視頻的音頻配置淡入淡出

與音頻配置淡入淡出類似,視頻的音頻也可以配置淡入淡出效果。例如,對視頻軌上含有音訊媒資配置了3秒淡入,4秒淡出,音量呈線性漸強至漸弱。

{
  "VideoTracks": [
    {
      "VideoTrackClips": [
        {
          "MediaId": "f044b3adc7967ba8f5cdf044b059****",
          "Effects": [
            {
              "Type": "AFade",
              "SubType": "In",
              "Curve": "tri",
              "Duration": 3
            },
            {
              "Type": "AFade",
              "SubType": "Out",
              "Duration": 4,
              "Curve": "tri"
            }
          ]
        }
      ]
    }
  ]
}