このトピックでは、Machine Learning Designerでプリセットテンプレートを使用して、発電所の出力を予測するモデルを構築する方法について説明します。
背景情報
以下のサンプルパイプラインでは、コンバインドサイクル発電プラントの発電データを使用して、出力電力を予測するモデルを構築します。 この例は、工業生産における機械学習の応用も示しています。 風力エネルギー変換器の出力電力は、1つの発電機が生成することができる電気エネルギーを決定する。 発電機の出力電力を正確に予測できれば、電力生産計画を評価して実装し、資源の無駄を減らすことができます。
前提条件
ワークスペースが作成済み。 詳細については、「ワークスペースの作成」をご参照ください。
MaxComputeリソースはワークスペースに関連付けられています。 詳細については、「ワークスペースの管理」をご参照ください。
データセット
次のサンプルパイプラインで使用されるコンバインドサイクル発電所のデータセットは、カリフォルニア大学アーバイン校 (UCI) がMachine Learning Repositoryで提供するデータセットです。 詳細については、「複合サイクル発電所データセット」をご参照ください。 データセットは、9,568のデータエントリを含む。 各データエントリは、温度、圧力、湿度、圧力強度、および出力電力の測定値を順番に示すAT、V、AP、RH、およびPEフィールドを含む。 次の図は、パイプラインで使用されるサンプルデータを示しています。
手順
Machine Learning Designerページに移動します。
PAIコンソールにログインします。
左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。
ワークスペースページの左側のナビゲーションウィンドウで、 機械学習デザイナーページに移動します。
パイプラインを作成します。
可视化モデリング (デザイナー)ページで、プリセットテンプレートタブをクリックします。
発電所の出力予測テンプレートを検索し、作成をクリックします。
[パイプラインの作成] ダイアログボックスで、必要なパラメーターを設定します。 デフォルト値を使用できます。
Pipeline Data Pathパラメーターに指定された値は、パイプラインのランタイム中に生成された一時データおよびモデルのObject Storage Service (OSS) バケットパスです。
OKをクリックします。
パイプラインの作成には約10秒かかります。
[パイプライン] タブで、作成した発電所の出力予測パイプラインを開くパイプライン。
次の図に示すように、キャンバス上のパイプラインのコンポーネントを表示します。 システムは、プリセットテンプレートに基づいてパイプラインを自動的に作成します。
エリア
説明
①
Corrcoefコンポーネントは、出力パワーに対する各フィーチャの影響を測定します。 パイプラインを実行した後、キャンバス上のCorrcoefコンポーネントを右クリックし、[Visual Analysis] を選択して、出力電力に対する各フィーチャの影響を表示できます。
②
分割コンポーネントは、データセットを8対2の比率でトレーニングデータセットと予測データセットに分割する。
③
線形回帰コンポーネントは、回帰モデリングを実行します。
④
予測コンポーネントは、予測データセットに基づいて出力パワーを予測します。 Evaluationコンポーネントは、モデルの予測精度を評価します。
パイプラインを実行し、結果を表示します。
キャンバスの左上隅で、実行アイコンが表示されます。
パイプラインを実行した後、コレリーフキャンバス上のコンポーネントを選択し、ビジュアル分析.
では、Corrcoefセクション、出力パワーの各特徴の影響を見て下さい。
前の図は、温度が出力電力に最大の影響を与え、次に圧力、湿度、および圧力強度が続くことを示しています。
キャンバス上のリニア回帰コンポーネントを右クリックし、 を選択し、モデルの評価結果を表示します。
キャンバス上の評価コンポーネントを右クリックし、 を選択し、モデルのパフォーマンスを示す結果を表示します。