全部產品
Search
文件中心

Platform For AI:建立標註任務

更新時間:Jul 13, 2024

建立完成用於資料標註的資料集後,您可以使用iTAG開展標註任務。PAI為您提供通用模板用於建立標註任務。如果通用模板無法滿足需求,您也可以根據實際情境,通過拼接內容組件和題目組件自訂模板。本文為您介紹如何通過預置的通用模板建立標註任務。

前提條件

使用限制

僅管理員或標註管理員可以進行標註相關操作。如果您的帳號沒有許可權,請聯絡管理員為您的帳號授予標註管理員權限,操作詳情請參見管理工作空間成員

操作步驟

  1. 進入智能標註(iTAG)。

    1. 登入PAI控制台

    2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應的工作空間。

    3. 在左側導覽列,選擇資料準備 > 智能標註(iTAG)

  2. 智能標註(iTAG)頁面的工作中樞頁簽,單擊建立任務

  3. 建立標註任務頁面,關鍵參數配置如下,其它參數按需配置。

    參數

    描述

    任務名稱

    長度為1~100個字元,以小寫字母、大寫字母、數字或中文開頭,可以包含底線(_)或短劃線(-)。

    輸入資料集

    選擇在PAI資料集管理中已經建立的資料集。

    模板類型

    支援以下類型的模型:

    • 通用模板:平台預置的常用模板。

    • 自訂模板:根據自己特定的情境,參考頁面提示拼接內容組件題目組件,從而通過自訂模板建立標註任務。

      自訂模板適用於自訂的情境,模板的輸入輸出資料格式詳情請參見自訂模板

    模板

    模板類型通用模板時,支援選擇細分的通用模板類型,當前支援:

    • 映像類

      模板的詳細應用情境,以及此類模板的輸入輸出資料格式詳情請參見映像類

      • 圖片OCR:對圖片框選地區內的文字進行OCR。

      • 目標檢測:對映像中的具體目標進行定位。

      • 映像分類:按照預設的標籤對映像進行分類標記。

      • PDF:對PDF進行OCR和標籤分類。

      • 審核摳圖:對圖片進行審核和摳圖任務。

      • 表格識別:利用演算法預先對錶格核心元素進行識別,按需進行編輯。

    • 文本類

      模板的詳細應用情境,以及此類模板的輸入輸出資料格式詳情,請參見文本類

      • 實體識別:建立文本實體之間的關係。

      • 文本分類:對文本按照預設標籤進行分類標記,支援單標籤和多標籤分類。

      • 實體關聯:文本實體之間的關係,用於知識圖譜情境。

    • 視頻類

      模板的詳細應用情境,以及此類模板的輸入輸出資料格式詳情請參見視頻類

      • 視頻分類:對視頻按照預設標籤進行分類標記,支援單標籤和多標籤分類。

    • 音頻類

      模板的詳細應用情境,及此類模板的輸入輸出資料格式詳情請參見語音類

      • 音頻分類:對音頻按照預設標籤進行分類標記,支援單標籤和多標籤分類。

      • 音頻分割:對音頻資料集的內容進行分割並分段添加標籤。

      • 音頻識別:將音頻內容的文字進行識別。

    OCR識別結果配置

    僅當在模板選擇映像類中的圖片OCR時,支援配置該參數。

    預設選中OCR識別結果,表示支援對圖片框選地區的文字進行OCR。

    標籤配置

    在本標註任務中,需要依次輸入後續打標人員需要識別、框選並打標的標籤名稱,然後按斷行符號鍵完成添加。

    例如,對圖片中的貓進行識別時,您可以添加標籤:“貓”、“美短”、“英短”等,便於後續的打標人員對樣本進行打標。

    您可以同時設定本標註任務中,打標人員對一個樣本的一次框選打標時,可以對框選的對象打一個或多個標籤。

    • 當一次框選打標只能打一個標籤時,可將該標籤設定為單選

    • 當一次框選打標可以打多個標籤時,可將該標籤設定為多選

    例如,對圖片中的貓進行識別時,如果標籤設定為多選,標註人員框選出樣本中的貓後,可以同時打上標籤“貓”、“美短”。

    說明

    此處的單選多選指的是對一個樣本的一次框選打標過程中,支援添加一個或多個標籤,而非對一個樣本進行多次框選打標。

    是否開啟智能標註

    具體配置詳情請參見資料預標註:智能標註配置

    任務說明

    標註任務的簡要說明,以區分不同的任務。

    子任務包分配

    iTAG會將所有資料集中的標註任務按照指定規則匯總分配為一個個子任務包。在標註任務處理過程中,處理人員可以搶單擷取子任務包,進行子任務包內的所有標註任務的處理。

    當前支援通過以下規則來分配子任務包:

    • 固定大小:每個子任務包中包含的標註任務數量為固定值。

      設定為固定大小時,資料集的資料量與子任務包中的任務數範圍有如下對應關係:

      • 當資料集大小為0~2萬條資料時,子任務包大小範圍是1~200條。

      • 當資料集大小為2萬~10萬條資料時,子任務包大小範圍是5~200條。

      • 當資料集大小為10萬~50萬條資料時,子任務包大小的範圍為25~200條。

      • 當資料集大小為50萬~100萬條資料時,子任務包的大小範圍為50~200條。

    • 按匯入欄位:按照資料集中所選欄位來劃分子任務包,該欄位數值相同的資料會放在同一個子任務包中。

    • 定向派單:針對特定標註人員或團隊進行劃分子任務包。

    檢查比例

    如果您選擇的任務流程包括檢查環節,例如打標-檢查打標-檢查-驗收,則需要配置在檢查過程中,對標註任務進行抽查的比例,預設為100%。

    人員配置

    根據選擇的任務流程,配置標註人員/組、檢查人員/組、驗收人員/組或任務管理員/組。您可以與該工作空間下的多個成員協作完成標註任務。iTAG中的角色許可權,請參見概述

  4. 配置完成後,單擊建立

查看工作清單

建立完成打標、檢查、驗收任務後,您可以在智能標註的工作中樞頁面看到當前所有工作清單,可查看任務的狀態,並通過操作列的操作入口瞭解子任務包詳情和擷取標註結果等操作。

image

地區

任務

說明

處理標註任務

您可以單擊頁面右上方的前往標註頁面進入iTAG標註頁面,對待處理的打標、檢查、驗收任務進行搶單處理。操作詳情請參見處理標註任務

查看任務的狀態

您可以在工作中樞頁面查看所有任務的狀態。

子任務包詳情

對於未完成的任務,您可以單擊子任務包詳情,進一步查看子任務包的完成情況。

對於未完成的子任務包,您可以單擊轉派,將子任務包直接轉交給其他人員進行處理,或單擊釋放,釋放後的子任務包可以被其他人員搶單繼續處理。

擷取標註結果

查看匯出進度

對已完成的任務,您可以單擊擷取標註結果,根據介面提示將標註結果匯出。

單擊擷取記錄,查看匯出的進度和結果。操作詳情請參見匯出標註結果資料

更多操作

您可以單擊任務操作列後的image,對任務進行下線、上線等管理操作。

後續步驟

您可以搶單來認領標註任務並進行標註處理,詳情請參見處理標註任務