iTAG是PAI產品的智能化資料標註平台,支援映像、文本、視頻、音頻等多種資料類型的標註以及多模態的混合標註。iTAG提供了豐富的標註內容組件和題目組件,您可以直接使用平台預置的標註模板,也可以根據實際業務情境自訂模板進行資料標註。
任務流程
在iTAG中,完整的資料標註流程包括以下步驟:
通過資料集管理模組將待標註的未經處理資料建立為資料集,從而產生.manifest索引檔案。
對於已建立的資料集,通過iTAG提供的通用模板或自訂模板建立標註任務並分發任務。任務分發流程分為打標、質檢及驗收三個環節,其中打標為必選環節,質檢和驗收為可選環節。因此建立標註任務時,您可以選擇以下四種流程:標註、標註-檢查、標註-驗收、標註-檢查-驗收。任務分發各環節的主要任務如下:
標註:標註員在標註任務頁面,先領取標註任務包,再完成標註,最後提交相應的標註任務。
檢查:標註環節完成後,標註員在質檢任務頁面,領取已經標註完成的任務包後,對其進行檢查、修改或駁回。
驗收:需求方將標註完成或質檢完成的任務進行最後一步的驗收。需求方在驗收任務頁面,領取相應任務包後,對其進行驗收、修改或駁回。
按照任務流程為任務包進行打標、質檢或驗收,從而獲得標註好的資料。
將標註結果匯出至指定的OSS目錄,從而將其用於模型訓練。
資料格式
智能標註的輸入資料格式
在建立標註任務過程中需要選擇已建立的資料集,該資料集需要滿足.manifest格式。您可通過PAI資料集管理模組建立資料集,系統會為該資料集自動產生標註所需要的.manifest資料格式。具體的資料格式請參見建立資料集:用於資料標註。
匯出的標註結果的資料格式
iTAG支援匯出.manifest格式的標註結果資料,標註流程中,標註、質檢、驗收環節的資料格式請參見匯出標註結果資料。
聯絡我們
如果您在使用iTAG時遇到問題,或有標註外包服務的相關需求,請使用DingTalk搜尋群號21930006619,進群諮詢。