全部產品
Search
文件中心

Platform For AI:智能標註(iTAG)

更新時間:Dec 04, 2024

iTAG是PAI產品的智能化資料標註平台,支援映像、文本、視頻、音頻等多種資料類型的標註以及多模態的混合標註。iTAG提供了豐富的標註內容組件和題目組件,您可以直接使用平台預置的標註模板,也可以根據實際業務情境自訂模板進行資料標註。

任務流程

iTAG中,完整的資料標註流程包括以下步驟:

  1. 建立資料集:用於資料標註

    通過資料集管理模組將待標註的未經處理資料建立為資料集,從而產生.manifest索引檔案。

  2. 建立標註任務

    對於已建立的資料集,通過iTAG提供的通用模板或自訂模板建立標註任務並分發任務。任務分發流程分為打標、質檢及驗收三個環節,其中打標為必選環節,質檢和驗收為可選環節。因此建立標註任務時,您可以選擇以下四種流程:標註標註-檢查標註-驗收標註-檢查-驗收。任務分發各環節的主要任務如下:

    • 標註:標註員在標註任務頁面,先領取標註任務包,再完成標註,最後提交相應的標註任務。

    • 檢查:標註環節完成後,標註員在質檢任務頁面,領取已經標註完成的任務包後,對其進行檢查、修改或駁回。

    • 驗收:需求方將標註完成或質檢完成的任務進行最後一步的驗收。需求方在驗收任務頁面,領取相應任務包後,對其進行驗收、修改或駁回。

  3. 處理標註任務

    按照任務流程為任務包進行打標、質檢或驗收,從而獲得標註好的資料。

  4. 匯出標註結果資料

    將標註結果匯出至指定的OSS目錄,從而將其用於模型訓練。

資料格式

  • 智能標註的輸入資料格式

    在建立標註任務過程中需要選擇已建立的資料集,該資料集需要滿足.manifest格式。您可通過PAI資料集管理模組建立資料集,系統會為該資料集自動產生標註所需要的.manifest資料格式。具體的資料格式請參見建立資料集:用於資料標註

  • 匯出的標註結果的資料格式

    iTAG支援匯出.manifest格式的標註結果資料,標註流程中,標註、質檢、驗收環節的資料格式請參見匯出標註結果資料

聯絡我們

如果您在使用iTAG時遇到問題,或有標註外包服務的相關需求,請使用DingTalk搜尋群號21930006619,進群諮詢。