iTAG是PAI產品的智能化資料標註平台,支援映像、文本、視頻、音頻等多種資料類型的標註以及多模態的混合標註。iTAG提供了豐富的標註內容組件和題目組件,您可以直接使用平台預置的標註模板,也可以根據自己的情境自訂模板進行資料標註。
任務流程
在iTAG中,完整的資料標註流程包括以下步驟:
通過資料集管理模組將待標註的未經處理資料建立為資料集,從而產生.manifest索引檔案。
對於已建立的資料集,通過iTAG提供的通用模板或自訂模板建立標註任務並分發任務。任務分發流程分為打標、質檢及驗收三個環節,其中打標為必選環節,質檢和驗收為可選環節。因此建立標註任務時,您可以選擇以下四種流程:打標、打標-檢測、打標-驗收、打標-檢測-驗收。任務分發各環節的主要任務如下:
按照任務流程為任務包進行打標、質檢或驗收,從而獲得標註好的資料。
將標註結果匯出至指定的OSS目錄,從而將其用於模型訓練。
資料格式
智能標註的輸入資料格式
在建立標註任務過程中需要選擇已建立的資料集,該資料集需要滿足.manifest格式。您可通過PAI資料集管理模組建立資料集,系統會為該資料集自動產生標註所需要的.manifest資料格式。具體的資料格式請參見建立資料集:用於資料標註和建立資料集:用於資料標註。
匯出的標註結果的資料格式
iTAG的標註結果為.manifest格式,標註流程中,打標、質檢、驗收環節的資料格式請參見匯出標註結果資料。
聯絡我們
如果您在使用iTAG時遇到問題,或有標註外包服務的相關需求,請使用DingTalk搜尋群號:21930006619,併入群進行諮詢。