LVM資料處理演算法樣本模板 - Platform For AI

LVM資料處理演算法提供了視頻清洗、視頻分類、視頻內容清理、視頻基本資料的提取、視頻caption產生的功能。您可以根據實際需求組合不同的演算法，從而過濾出合適的視頻資料並產生相應的文本描述，方便為後續的視頻產生模型訓練提供優質的視頻資料。本文為您介紹Designer中視頻資料過濾打標預置模板的使用說明。

使用限制

視頻資料過濾打標預置模板僅支援華東1（杭州）、華東2（上海）、華北2（北京）、華南1（深圳）地區使用。

準備視頻資料

上傳視頻檔案至OSS，視頻檔案格式要求如下：

視頻檔案為MP4格式。
視頻檔案名稱不包含中文字元。

建立並運行工作流程

進入Designer頁面。
1. 登入PAI控制台。
2. 在頂部左上方根據實際情況選擇地區。
3. 在左側導覽列選擇工作空間列表，單擊指定工作空間名稱，進入對應工作空間。
4. 在左側導覽列選擇模型開發與訓練 > 可視化建模（Designer），進入Designer頁面。
建立工作流程。
1. 在預置模板頁簽下，選擇業務領域 > 多模態大模型，單擊視頻資料過濾打標模板卡片上的建立。
2. 配置工作流程參數（或保持預設），單擊確定。
3. 在工作流程列表，選擇已建立的工作流程，單擊進入工作流程。
配置工作流程。
關鍵配置如下：
- 讀OSS資料群組件：配置組件的OSS資料路徑，即準備視頻資料中視頻檔案上傳的OSS目錄。
- LVM視頻演算法組件：分別配置LVM演算法組件，詳情請參見視頻預先處理運算元。
運行工作流程。運行結束後，查看產生的檔案：
- video_meta.jsonl檔案：運行時會在視頻資料OSS路徑的上一級目錄下產生視頻中繼資料檔案video_meta.jsonl。
- 結果檔案：在輸出檔案的OSS路徑中查看結果檔案。
關於結果檔案詳細說明，請參見視頻預先處理運算元中輸出檔案的OSS路徑參數介紹。

Platform For AI：視頻資料過濾打標

使用限制

準備視頻資料

建立並運行工作流程

相關參考