iTAG支援通過智能標註配置進行資料預標註,您可以在預標註結果的基礎上進行正式標註。在正式標註時,您僅需要對預標註結果進行校正和修正,可以提升標註效率。ITAG支援離線預標註和線上服務兩種預標註方式。離線預標註是指您匯入帶有預標註格式的資料,從而自動完成打標。線上服務預標註是指通過一個API線上服務自動完成對資料的預打標。本文為您介紹預標註檔案格式要求、預標註任務配置要點和結果樣本。
使用限制
目前iTAG預標註僅支援分類情境,例如映像分類、文本分類。
離線預標註
離線預標註檔案格式要求
準備離線預標註資料檔案(prelabel_offline.manifest),並建立為OSS類型的資料集。
離線預標註資料檔案的格式如下,需要包含自訂欄位和source兩個欄位,且離線預標註資料檔案中,自訂欄位不能缺少,且支援添加多個自訂欄位。
{ "data": { "label": "label_2", "source": "阿里巴巴集團慶祝創立十周年,同時成立阿里雲計算" } }
其中:
label:離線產生的預標註結果。
source:未經處理資料。
不同標註類型檔案的整體格式要求請參見建立資料集:用於資料標註。如果離線預標註資料檔案不滿足格式要求,可能會導致預標註結果不能正常顯示。
將離線預標註資料檔案建立為資料集時,需建立為OSS類型的資料集,操作詳情請參見建立資料集:本地上傳。
離線預標註任務配置要點
在建立標註任務時,您可以在智能標註配置設定精靈頁面配置以下參數,具體參數說明如下。
在服務配置地區,支援配置的參數如下所示。
參數
說明
標註方式
支援以下三種標註方式:
不使用:不使用智能標註配置。
使用離線預標註結果:上傳的資料集中已經包含了預標註結果,iTAG平台支援展示預標註結果。
線上服務預測:上傳的資料集中沒有包含預標註結果,您可以在建立標註任務時選擇線上服務預測,並調用線上的模型服務對資料集進行預測,並將預測結果作為預標註結果在iTAG平台進行展示。
預測結果與題目映射
將離線預標註資料檔案中的預標註結果列與題目名稱進行關聯,配置題目的預標註結果。
當您需要為多種題目進行打標時,您可以單擊添加預測結果與題目映射為更多題目名稱關聯預標註結果列。
在服務生效配置地區中,支援配置的生效環節如下所示:
預標註:表示預標註結果僅在預標註環節生效,標註員仍需要在正式標註環節標註資料,可以對預標註結果進行校正和修正。
正式標註:表示預標註結果在正式標註環節生效。標註員不需要在正式標註環節標註資料,可以直接進入檢查或驗收環節。
離線預標註任務配置結果樣本
在標註結果頁面,題目會顯示預標註結果。
線上服務預測
iTAG支援線上服務預測,首先需要建立一個模型服務,詳見文檔:模型服務。
選擇服務:進行模型服務的選擇。
服務入參映射:服務入參欄位為需要識別的資料欄位。
預測結果與題目映射:將標註的題目和模型服務的出參欄位進行映射。