このトピックでは、Machine Learning Designerでプリセットテンプレートを使用して、発電所の出力を予測するモデルを構築する方法について説明します。
背景情報
以下のサンプルパイプラインでは、コンバインドサイクル発電プラントの発電データを使用して、出力電力を予測するモデルを構築します。 この例は、工業生産における機械学習の応用も示しています。 風力エネルギー変換器の出力電力は、1つの発電機が生成することができる電気エネルギーを決定します。 発電機の出力電力を正確に予測できれば、電力生産計画を評価して実装し、資源の無駄を減らすことができます。
前提条件
ワークスペースが作成済み。 詳細については、「ワークスペースの作成」をご参照ください。
MaxComputeリソースはワークスペースに関連付けられています。 詳細については、「ワークスペースの管理」をご参照ください。
データセット
次のサンプルパイプラインで使用されるコンバインドサイクル発電所のデータセットは、カリフォルニア大学アーバイン校 (UCI) がMachine Learning Repositoryで提供するデータセットです。 詳細については、「複合サイクル発電所データセット」をご参照ください。 データセットは、9,568のデータエントリを含みます。 各データエントリは、温度、圧力、湿度、圧力強度、および出力電力の測定値を順番に示すAT、V、AP、RH、およびPEフィールドを含みます。 次の図は、パイプラインで使用されるサンプルデータを示しています。
手順
Machine Learning Designerページに移動します。
PAIコンソールにログインします。
左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
パイプラインを作成します。
可视化モデリング (デザイナー)ページをクリックし、プリセットテンプレートタブをクリックします。
発電所の出力予測テンプレートを見つけて、作成をクリックします。
[パイプラインの作成] ダイアログボックスで、必要なパラメーターを設定します。 デフォルト値を使用できます。
Pipeline Data Pathパラメーターに指定された値は、パイプラインのランタイム中に生成された一時データおよびモデルのObject Storage Service (OSS) バケットパスです。
OKをクリックします。
パイプラインの作成には約10秒かかります。
[パイプライン] タブで、作成した発電所の出力予測パイプラインをダブルクリックしてパイプラインを開きます。
次の図に示すように、キャンバス上のパイプラインのコンポーネントを表示します。 システムは、プリセットテンプレートに基づいてパイプラインを自動的に作成します。
地域
説明
①
Corrcoefコンポーネントは、出力パワーに対する各フィーチャの影響を測定します。 パイプラインを実行した後、キャンバス上のCorrcoefコンポーネントを右クリックし、[Visual Analysis] を選択して、出力電力に対する各フィーチャの影響を表示できます。
②
分割コンポーネントは、データセットを8対2の比率でトレーニングデータセットと予測データセットに分割します。
③
線形回帰コンポーネントは、回帰モデリングを実行します。
④
予測コンポーネントは、予測データセットに基づいて出力パワーを予測します。 Evaluationコンポーネントは、モデルの予測精度を評価します。
パイプラインを実行し、結果を表示します。
キャンバスの左上隅で、アイコンをクリックします。
パイプラインを実行した後、キャンバスのコレリーフコンポーネントを右クリックし、ビジュアル分析を選択します。
Corrcoefセクションで、出力パワーの各特徴の影響を見て下さい。
前の図は、温度が出力電力に最大の影響を与え、次に圧力、湿度、および圧力強度が続くことを示しています。
キャンバスのリニア回帰コンポーネントを右クリックし、 を選択してモデルの評価結果を表示します。
キャンバスの評価コンポーネントを右クリックし、 を選択してモデルのパフォーマンスを示す結果を表示します。