LVM資料處理演算法提供了視頻清洗、視頻分類、視頻內容清理、視頻基本資料的提取、視頻caption產生的功能。您可以根據實際需求組合不同的演算法,從而過濾出合適的視頻資料並產生相應的文本描述,方便為後續的視頻產生模型訓練提供優質的視頻資料。本文為您介紹Designer中視頻資料過濾打標預置模板的使用說明。
使用限制
視頻資料過濾打標預置模板僅支援華東1(杭州)、華東2(上海)、華北2(北京)、華南1(深圳)地區使用。
準備視頻資料
上傳視頻檔案至OSS,視頻檔案格式要求如下:
視頻檔案為MP4格式。
視頻檔案名稱不包含中文字元。
建立並運行工作流程
進入Designer頁面。
登入PAI控制台。
在頂部左上方根據實際情況選擇地區。
在左側導覽列選擇工作空間列表,單擊指定工作空間名稱,進入對應工作空間。
在左側導覽列選擇模型開發與訓練 > 可視化建模(Designer),進入Designer頁面。
建立工作流程。
在預置模板頁簽下,選擇業務領域 > 多模態大模型,單擊視頻資料過濾打標模板卡片上的建立。
配置工作流程參數(或保持預設),單擊確定。
在工作流程列表,選擇已建立的工作流程,單擊進入工作流程。
配置工作流程。
關鍵配置如下:
運行工作流程。運行結束後,查看產生的檔案:
video_meta.jsonl檔案:運行時會在視頻資料OSS路徑的上一級目錄下產生視頻中繼資料檔案video_meta.jsonl。
結果檔案:在輸出檔案的OSS路徑中查看結果檔案。
關於結果檔案詳細說明,請參見視頻預先處理運算元中輸出檔案的OSS路徑參數介紹。