画像ラベリングテンプレート - Platform For AI - Alibaba Cloud ドキュメントセンター

AI (PAI) の機械学習プラットフォームのiTAGは、光学式文字認識 (OCR) 、オブジェクト検出、および画像分類用のラベリングテンプレートを提供します。イメージラベル付けジョブを作成するときに、ビジネスシナリオに基づいてラベル付けテンプレートを選択できます。このトピックでは、画像ラベル付けテンプレートのシナリオと、これらのテンプレートの入力データと出力データのデータ構造について説明します。

背景情報

iTAGは、次の機能をサポートする画像ラベリングテンプレートを提供します。

OCR
オブジェクト検出
画像分類

OCR

OCRは、入力画像からテキストを抽出し、テキストに基づいて画像を分類するために使用されます。

シナリオ
このラベリングテンプレートは、身分証明書、チケット、ナンバープレート、銀行カードの認識などのシナリオに適用されます。

データ構造

入力データ
の各行. マニフェストオブジェクトを含む入力データのファイル。各行にsourceフィールドを含める必要があります。
```
{"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/demo_test/ocr_pic/img6.jpeg"}}
...
```

出力データ

の各行. マニフェスト出力データのファイルには、オブジェクトとそのオブジェクトのラベル付け結果が含まれます。次のコードは、各行のJSON文字列の例を示しています。

{
    "data": {
        "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/demo_test/ocr_pic/img6.jpeg"
    }, 
    "label-144863699223676****": {
        "results": [
            {
                "questionId": "1", 
                "data": [
                    {
                        "id": "ecdb7552-2a4e-4d0e-8abb-0f1a2dc0****", 
                        "type": "image/polygon", 
                        "value": [
                            [
                                368.1112214498511, 
                                71.72740814299901
                            ], 
                            [
                                444.34359483614696, 
                                71.72740814299901
                            ], 
                            [
                                444.34359483614696, 
                                106.26762661370405
                            ], 
                            [
                                368.1112214498511, 
                                106.26762661370405
                            ]
                        ], 
                        "labels": {
                            "OCR result": "Financial consultant", 
                            "Single-choice": "Label 1"
                        }
                    }
                ], 
                "rotation": 0, 
                "markTitle": "Label configuration for OCR", 
                "width": 1024, 
                "type": "image", 
                "height": 1024
            }
        ]
    }
}

オブジェクト検出

オブジェクト検出は、画像内の特定のオブジェクトの位置を特定するために使用されます。長方形の選択ツールが一般的に使用されます。

シナリオ
このラベリングテンプレートは、車両検出、乗客検出、画像検索などのシナリオに適用されます。

データ構造

入力データ
の各行. マニフェストオブジェクトを含む入力データのファイル。各行にsourceフィールドを含める必要があります。
```
{"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/pic_ocr/img17.jpeg"}}
...
```

出力データ

{
    "data": {
        "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/pic_ocr/img17.jpeg"
    }, 
    "label-144853549785619****": {
        "results": [
            {
                "questionId": "1", 
                "data": [
                    {
                        "id": "e02a574b-9fd9-45e9-8c8a-9682567b****", 
                        "type": "image/polygon", 
                        "value": [
                            [
                                499.93454545454546, 
                                255.0981818181818
                            ], 
                            [
                                911.0109090909091, 
                                255.0981818181818
                            ], 
                            [
                                911.0109090909091, 
                                338.6836363636363
                            ], 
                            [
                                499.93454545454546, 
                                338.6836363636363
                            ]
                        ], 
                        "labels": {
                            "Single-choice": "Label 1"
                        }
                    }
                ], 
                "rotation": 0, 
                "markTitle": "Label configuration for object detection", 
                "width": 1024, 
                "type": "image", 
                "height": 1024
            }
        ]
    }
}

イメージの分類

画像分類は、1組のラベルから入力画像と一致する1つ以上のラベルを見つけ、そのラベルを画像に追加するために使用される。このテンプレートは、単一ラベルおよび複数ラベルの画像分類をサポートします。

シナリオ
このラベリングテンプレートは、画像分類、画像認識、画像検索、コンテンツの推奨などのシナリオに適用されます。

データ構造

入力データ
の各行. マニフェストオブジェクトを含む入力データのファイル。各行にsourceフィールドを含める必要があります。
```
{"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/pic/1.jpg"}}
...
```

出力データ

{
    "data": {
        "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/pic/3.jpg"
    }, 
    "label-143082452899667****": {
        "results": [
            {
                "questionId": "2", 
                "data": [
                    "Label 1", 
                    "Label 2"
                ], 
                "markTitle": "Multiple-choice", 
                "type": "survey/multivalue"
            }
        ]
    }
}