AI (PAI) のiTAGは、名前付きエンティティ認識 (NER) 、テキスト分類、および名前付きエンティティの関係分析のためのラベリングテンプレートを提供します。 テキストラベル付けジョブを作成するときに、ビジネスシナリオに基づいてラベル付けテンプレートを選択できます。 このトピックでは、テキストラベル付けテンプレートのシナリオと、これらのテンプレートの入力データと出力データのデータ構造について説明します。
背景情報
iTAGは、次の機能をサポートするテキストラベル付けテンプレートを提供します。
NER
NERは、選択ボックスを名前付きエンティティ上にドラッグし、名前付きエンティティにラベルを付けるために使用されます。
シナリオ
このラベリングテンプレートは、商品名やニュースコンテンツのキーワード認識などのシナリオに適用されます。
データ構造
入力データ
の各行. マニフェストオブジェクトを含む入力データのファイル。 各行にsourceフィールドを含める必要があります。
{"data":{"source":"Alibaba Group acquired Vendio and Auctiva, two e-commerce platforms that serve American small enterprises. In the same month, Alibaba Group launched mobile apps for Taobao."}} ...
出力データ
出力データの. マニフェストファイルの各行には、オブジェクトとそのオブジェクトのラベル付け結果が含まれます。 次のコードは、各行のJSON文字列の例を示しています:
{ "data": { "source": "Alibaba Group acquired Vendio and Auctiva, two e-commerce platforms that serve American small enterprises. In the same month, Alibaba Group launched mobile apps for Taobao." }, "label-1430082002522152960": { "results": [ { "objects": [ { "result": { "Text content": [ "Label 1" ] }, "color": null, "id": null, "text": "Optical character recognition (OCR) result 1", "start": 49, "end": 51 }, { "result": { "Text content": [ "Label 2", "Label 3" ] }, "color": null, "id": null, "text": "OCR result 2", "start": 34, "end": 40 }, ], "empty": false } ] } }
テキスト分類
テキスト分類は、ラベルのセットから入力テキストと一致する1つ以上のラベルを見つけ、ラベルをテキストに追加するために使用されます。 このテンプレートは、単一ラベルおよび複数ラベルのテキスト分類をサポートします。
シナリオ
このラベリングテンプレートは、ニュースの推奨、ナレッジ管理、迷惑コンテンツのフィルタリングなどのシナリオに適用されます。
データ構造
入力データ
入力データの. マニフェストファイルの各行にはオブジェクトを含む。 各行にsourceフィールドを含める必要があります。
{"data":{"source":"Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan."}} ...
出力データ
出力データの. マニフェストファイルの各行には、オブジェクトとそのオブジェクトのラベル付け結果が含まれます。 次のコードは、各行のJSON文字列の例を示しています:
{ "data": { "source": "Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan." }, "label-1432989439570944000": { "results": [ { "questionId": "2", "data": [ "Label 2", "Label 1" ], "markTitle": "Multiple-choice", "type": "survey/multivalue" } ] } }
名前付きエンティティのリレーションシップ分析
名前付きエンティティの関係分析を使用して、名前付きエンティティ間の既存の関係をラベル付けします。 このテンプレートは、トリプルとナレッジグラフを使用して情報を構造化するシナリオに適用されます。
シナリオ
このラベリングテンプレートは、ナレッジグラフなどのシナリオに適用されます。
データ構造
入力データ
入力データの. マニフェストファイルの各行オブジェクトを含む。 各行にsourceフィールドを含める必要があります。
{"data":{"source":"Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan."}} ...
出力データ
の各行. マニフェスト出力データのファイルには、オブジェクトとそのオブジェクトのラベル付け結果が含まれます。 次のコードは、各行のJSON文字列の例を示しています:
{ "data": { "source": "Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan." }, "label-1435488346167255040": { "results": [ { "objects": [ { "result": { "Multiple-choice": [ "Label 3" ] }, "color": null, "id": null, "text": "Group buying website", "start": 32, "end": 35 }, { "result": { "Multiple-choice": [ "Label 2" ] }, "color": null, "id": null, "text": "1688", "start": 18, "end": 21 }, { "result": { "Multiple-choice": [ "Label 1" ] }, "color": null, "id": null, "text": "Businesses", "start": 9, "end": 12 } ], "empty": false }, [ { "result": { "Single-choice": "Label 4" }, "from": { "x": -225, "y": -126, "start": 9, "end": 12, "text": "Businesses" }, "to": { "x": -233, "y": 75, "start": 18, "end": 21, "text": "1688" } }, { "result": { "Single-choice": "Label 6" }, "from": { "x": -225, "y": -126, "start": 9, "end": 12, "text": "Businesses" }, "to": { "x": 24, "y": -93, "start": 32, "end": 35, "text": "Group buying website" } }, { "result": { "Single-choice": "Label 4" }, "from": { "x": -233, "y": 75, "start": 18, "end": 21, "text": "1688" }, "to": { "x": 24, "y": -93, "start": 32, "end": 35, "text": "Group buying website" } } ] ] } }