Platform for AI(PAI)の iTAG は、固有表現抽出(NER)、テキスト分類、および固有表現の関係分析のためのラベリングテンプレートを提供します。テキストラベリングジョブを作成する際に、ビジネスシナリオに基づいてラベリングテンプレートを選択できます。このトピックでは、テキストラベリングテンプレートのシナリオと、これらのテンプレートの入力データと出力データのデータ構造について説明します。
背景情報
固有表現抽出
固有表現抽出は、固有表現の上に選択ボックスをドラッグし、固有表現にラベルを付けるために使用されます。
シナリオ
このラベリングテンプレートは、商品名やニュースコンテンツのキーワード認識などのシナリオに適用されます。
データ構造
入力データ
入力データの [.manifest] ファイルの各行には、オブジェクトが含まれています。各行には、source フィールドが含まれている必要があります。
{"data":{"source":"Alibaba Group acquired Vendio and Auctiva, two e-commerce platforms that serve American small enterprises. In the same month, Alibaba Group launched mobile apps for Taobao."}} ...出力データ
出力データの [.manifest] ファイルの各行には、オブジェクトとそのオブジェクトのラベリング結果が含まれています。次のコードは、各行の JSON 文字列の例を示しています。
{ "data": { "source": "Alibaba Group acquired Vendio and Auctiva, two e-commerce platforms that serve American small enterprises. In the same month, Alibaba Group launched mobile apps for Taobao." // Alibabaグループは、アメリカの零細企業にサービスを提供する2つのEコマースプラットフォームであるVendioとAuctivaを買収しました。同じ月に、Alibabaグループは淘宝網のモバイルアプリを立ち上げました。 }, "label-1430082002522152960": { "results": [ { "objects": [ { "result": { "Text content": [ // テキストコンテンツ "Label 1" // ラベル1 ] }, "color": null, "id": null, "text": "Optical character recognition (OCR) result 1", // 光学式文字認識(OCR)結果1 "start": 49, "end": 51 }, { "result": { "Text content": [ // テキストコンテンツ "Label 2", // ラベル2 "Label 3" // ラベル3 ] }, "color": null, "id": null, "text": "OCR result 2", // OCR結果2 "start": 34, "end": 40 } ], "empty": false // 空ではない } ] } }
テキスト分類
テキスト分類は、入力テキストに一致する1つ以上のラベルをラベルセットから見つけ、テキストにラベルを追加するために使用されます。このテンプレートは、単一ラベルと複数ラベルのテキスト分類をサポートしています。
シナリオ
このラベリングテンプレートは、ニュースの推奨、ナレッジマネジメント、ジャンクコンテンツのフィルタリングなどのシナリオに適用されます。
データ構造
入力データ
入力データの [.manifest] ファイルの各行には、オブジェクトが含まれています。各行には、source フィールドが含まれている必要があります。
{"data":{"source":"Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan."}} ...出力データ
出力データの [.manifest] ファイルの各行には、オブジェクトとそのオブジェクトのラベリング結果が含まれています。次のコードは、各行の JSON 文字列の例を示しています。
{ "data": { "source": "Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan." // Alibabaグループは、中国企業にサービスを提供するプラットフォームの名前を1688に変更しました。同じ月にAlibabaグループは、Juhuasuanと呼ばれる共同購入ウェブサイトを立ち上げました。 }, "label-1432989439570944000": { "results": [ { "questionId": "2", "data": [ "Label 2", // ラベル 2 "Label 1" // ラベル 1 ], "markTitle": "Multiple-choice", // 複数選択 "type": "survey/multivalue" } ] } }
固有表現の関係分析
固有表現の関係分析は、固有表現間の既存の関係にラベルを付けるために使用されます。このテンプレートは、トリプルと知識グラフを使用して情報を構造化するシナリオに適用されます。
シナリオ
このラベリングテンプレートは、知識グラフなどのシナリオに適用されます。
データ構造
入力データ
入力データの [.manifest] ファイルの各行には、オブジェクトが含まれています。各行には source フィールドが含まれている必要があります。
{"data":{"source":"Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan."}} ...出力データ
出力データの [.manifest] ファイルの各行には、オブジェクトとそのオブジェクトのラベリング結果が含まれています。次のコードは、各行の JSON 文字列の例を示しています。
{ "data": { "source": "Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan." // Alibabaグループは、中国企業にサービスを提供するプラットフォームの名前を1688に変更しました。同じ月に、AlibabaグループはJuhuasuanと呼ばれる共同購入ウェブサイトを立ち上げました。 }, "label-1435488346167255040": { "results": [ { "objects": [ { "result": { "Multiple-choice": [ // 複数選択 "Label 3" // ラベル 3 ] }, "color": null, "id": null, "text": "Group buying website", // 共同購入ウェブサイト "start": 32, "end": 35 }, { "result": { "Multiple-choice": [ // 複数選択 "Label 2" // ラベル 2 ] }, "color": null, "id": null, "text": "1688", "start": 18, "end": 21 }, { "result": { "Multiple-choice": [ // 複数選択 "Label 1" // ラベル 1 ] }, "color": null, "id": null, "text": "Businesses", // 企業 "start": 9, "end": 12 } ], "empty": false // 空ではない }, [ { "result": { "Single-choice": "Label 4" // 単一選択 }, "from": { "x": -225, "y": -126, "start": 9, "end": 12, "text": "Businesses" // 企業 }, "to": { "x": -233, "y": 75, "start": 18, "end": 21, "text": "1688" } }, { "result": { "Single-choice": "Label 6" // 単一選択 }, "from": { "x": -225, "y": -126, "start": 9, "end": 12, "text": "Businesses" // 企業 }, "to": { "x": 24, "y": -93, "start": 32, "end": 35, "text": "Group buying website" // 共同購入ウェブサイト } }, { "result": { "Single-choice": "Label 4" // 単一選択 }, "from": { "x": -233, "y": 75, "start": 18, "end": 21, "text": "1688" }, "to": { "x": 24, "y": -93, "start": 32, "end": 35, "text": "Group buying website" // 共同購入ウェブサイト } } ] ] } }