条件付きランダムフィールド予測コンポーネントは、オンライン予測モデル線形条件付きランダムフィールド (LinearCRF) に基づいて機械学習デザイナー (以前は機械学習スタジオとして知られていました) によって提供されるアルゴリズムコンポーネントです。 このコンポーネントは、シーケンスラベリングタスクを処理するために使用されます。 このトピックでは、条件付きランダムフィールド予測コンポーネントのパラメーターを設定する方法について説明します。 このトピックでは、条件付きランダムフィールド予測コンポーネントの使用方法の例も示します。
パラメーターの設定
条件付きランダムフィールド予測コンポーネントのパラメーターは、Machine Learning Platform for AI (PAI) コンソールで設定できます。
パラメーター | 説明 |
ID列 | 各サンプルのIDを含む列。 サンプルはn − タプルに保存される。 |
フィーチャー列 | 注釈を付ける単語とその特徴。 |
ターゲット列 | 選択する列。 |
予測結果列 | 予測結果列の名前。 デフォルト値: prediction_result。 |
予測スコア列 | 予測スコア列の名前。 デフォルト値: prediction_score。 |
予測詳細コラム | 予測の詳細列の名前。 予測の詳細列が必要ない場合は、このパラメーターを空のままにすることができます。 |
例:
オンライン予測モデルLinearCRFのオンライン予測フェーズでは、入出力 (I/O) 構造のトレーニングモデルを使用する必要があります。 次の表に、トレーニングデータテーブルの形式を示します。
文_id | ワード | f1 | f2 | ラベル |
1 | ロックウェル | NNP | POS | B-NP |
1 | 国際 | NNP | NP | I-NP |
1 | 株式会社 | NNP | PO | I-NP |
1 | の | POS | NN | B-NP |
... | ... | ... | ... | ... |
入力フォーマットにおける特徴名word、f1、およびf2は、訓練データテーブルにおける特徴の対応する列名と同じでなければならない。 オンライン予測の入力要求では、異なる単語の特徴をスペースで分離します。 次のコードは、オンライン予測モデルLinearCRFの入力形式を示しています。
"inputs":[
{
"word":{
"dataType": 50、
"dataValue":"Rockwell International Corpの..."
},
"f1": {
"dataType": 50、
"dataValue":"NNP NNP NNP POS ..."
},
"f2": {
"dataType": 50、
"dataValue":"POS NP PO NN ..."
}
}]
}
出力形式のoutputValueセクションでは、入力形式のすべての単語に一致するprediction_resultフィールド、prediction_scoreフィールド、prediction_detailフィールドがJSON形式で生成されます。 次のコードは、オンライン予測モデルLinearCRFの出力形式を示しています。
{
"outputs": [
{
"outputLabel": "CRFProcessor_Result",
"outputValue": {
"dataType": 50,
"dataValue": {
"Rockwell NNP POS": {
"prediction_result":"B-NP",
"prediction_score":0.99,
"prediction_detail":{"B-ADJP":0.000145, "B-NP":0.99, ...}
},
"International NNP NP": ...
}
}
}
]
}
入力形式が無効な場合、プログラムは次のコードに示すようにエラーメッセージを表示します
{
"outputs": [
{
"outputLabel": "CRFProcessor_Result",
"outputValue": {
"dataType":50,
"dataValue": "Failed: The input format is incorrect"
}
}
]
}