iTAG是PAI产品的智能化数据标注平台,支持图像、文本、视频、音频等多种数据类型的标注以及多模态的混合标注。iTAG提供了丰富的标注内容组件和题目组件,您可以直接使用平台预置的标注模板,也可以根据实际业务场景自定义模板进行数据标注。
任务流程
在iTAG中,完整的数据标注流程包括以下步骤:
通过数据集管理模块将待标注的原始数据创建为数据集,从而生成.manifest索引文件。
对于已创建的数据集,通过iTAG提供的通用模板或自定义模板创建标注任务并分发任务。任务分发流程分为打标、质检及验收三个环节,其中打标为必选环节,质检和验收为可选环节。因此创建标注任务时,您可以选择以下四种流程:标注、标注-检查、标注-验收、标注-检查-验收。任务分发各环节的主要任务如下:
标注:标注员在标注任务页面,先领取标注任务包,再完成标注,最后提交相应的标注任务。
检查:标注环节完成后,标注员在质检任务页面,领取已经标注完成的任务包后,对其进行检查、修改或驳回。
验收:需求方将标注完成或质检完成的任务进行最后一步的验收。需求方在验收任务页面,领取相应任务包后,对其进行验收、修改或驳回。
按照任务流程为任务包进行打标、质检或验收,从而获得标注好的数据。
将标注结果导出至指定的OSS目录,从而将其用于模型训练。
数据格式
智能标注的输入数据格式
在创建标注任务过程中需要选择已创建的数据集,该数据集需要满足.manifest格式。您可通过PAI数据集管理模块创建数据集,系统会为该数据集自动生成标注所需要的.manifest数据格式。具体的数据格式请参见创建数据集:用于数据标注。
导出的标注结果的数据格式
iTAG支持导出.manifest格式的标注结果数据,标注流程中,标注、质检、验收环节的数据格式请参见导出标注结果数据。
联系我们
如果您在使用iTAG时遇到问题,或有标注外包服务的相关需求,请使用钉钉搜索群号21930006619,进群咨询。