このトピックでは、Platform for AI (PAI) のMachine Learning Designerが提供するパイプラインテンプレートを使用して、電気を盗むユーザーや漏電に関与しているユーザーを識別するモデルを構築する方法について説明します。 これにより、電気検査スタッフの検査作業負荷が大幅に削減され、正常で安全な電力使用が保証されます。
背景情報
電気の盗難および漏電および計測装置の故障を識別する従来の方法には、定期的な検査、電気メータの定期的なチェック、ならびにユーザからの電気の盗難および漏電の報告が含まれる。 これらの方法は、手動操作を必要とし、電気を盗んだり漏電したりするユーザを識別するのに非効率的である。 電力供給局のスタッフは、電気使用量を測定するために既存の自動化システムを使用します。 電気使用量をオンラインで監視するために、スタッフはシステムを使用して異常な電気使用量のアラートをトリガーし、電気使用量データを照会します。 システムは、異常な電気使用、異常な負荷、端末およびプライマリサイトによって報告されたアラート、および異常な回線損失に関するデータを収集します。 このようにして、関係するスタッフは、電気の盗難、電気の漏れ、および計量装置の故障を特定できます。 アラートがトリガーされた後、システムは、アラート時間の前後の電流、電圧、および負荷に基づいて、異常な電気使用量を分析するためのモデルを構築します。 これは、関連するスタッフが電気の盗難、電気の漏れ、および計量装置の故障を特定するのにも役立ちます。
電気使用量を計量するための既存の自動システムは、異常な電気使用量を監視できます。 しかしながら、電気を盗んだり、漏電に巻き込まれたりしたユーザを正確に識別することは、誤検出及び誤検出が頻繁に起こるために困難である。 さらに、専門家は、知識と経験に基づいてモデルの各メトリックの重みを決定する必要があります。 このプロセスは主観的であり、不十分な効果をもたらす。
電気使用量を測定するための既存の自動化システムは、電流、電圧、および電力データなどの電気負荷データ、ならびに端末が報告するアラートデータを収集することができる。 負荷データは、ユーザの電気使用を反映することができる。 電気検査スタッフは、オンライン検査システムから、または現場検査を実施することによって、電気の盗難や漏電データを収集し、システムにデータを記録することができます。 前述のデータに基づいて、PAIは、電気を盗んだ、または電気漏電に関与しているユーザーの主要な特徴を抽象化し、これらのユーザーを識別するためのモデルを構築して、電気の盗難または漏電を自動的に識別できます。 これにより、電気検査スタッフの検査作業負荷が大幅に削減され、正常で安全な電力使用が保証されます。
前提条件
ワークスペースが作成済み。 詳細については、「ワークスペースの作成」をご参照ください。
MaxComputeリソースはワークスペースに関連付けられています。 詳細については、「ワークスペースの管理」をご参照ください。
データセット
次の表に、このトピックで使用されるデータセットのフィールドについて説明します。
項目 | データ型 | パラメーター |
power_usage_decline_level | BIGINT | 電力使用量のトレンド。 |
line_loss_rate | BIGINT | ラインロス。 |
warning_num | BIGINT | アラートの数。 |
is_theff | BIGINT | ユーザーが電気を盗むか、電気漏れに関与しているかを示します。 |
手順
Machine Learning Designerページに移動します。
PAIコンソールにログインします。
左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。
ワークスペースページの左側のナビゲーションウィンドウで、 機械学習デザイナーページに移動します。
パイプラインを作成します。
Visualized Modeling (Designer) ページで、プリセットテンプレートタブをクリックします。
[プリセットテンプレート] タブで、パワー盗難の識別テンプレートをクリックし、作成.
[パイプラインの作成] ダイアログボックスで、パラメーターを設定します。 デフォルト値を使用できます。
Pipeline Data Pathパラメーターに指定された値は、パイプラインのランタイム中に生成された一時データおよびモデルのObject Storage Service (OSS) バケットパスです。
[OK] をクリックします。
パイプラインの作成には約10秒かかります。
[パイプライン] タブで、パワー盗難の識別パイプラインを入力します。
次の図に示すように、キャンバス上のパイプラインのコンポーネントを表示します。 システムは、プリセットテンプレートに基づいてパイプラインを自動的に作成します。
セクション
説明
①
このセクションに表示されるコンポーネントは、統計分析を実行します。
Correcoefコンポーネントは、ユーザーが電気を盗むか、漏電に関与しているかを判断する際の各機能の影響を分析します。
Feature Meta Runnerコンポーネントは、フィーチャ列とラベル列のデータの分布を視覚化します。 このパイプラインでは、feature columnsはpower_usage_decline_level、line_loss_rate、およびwarning_numです。 ラベル列は _theftです。
②
Splitコンポーネントは、データセットをトレーニングデータセットと予測データセットに
8:2
の比率で分割します。③
ロジスティック回帰コンポーネントは、トレーニングデータセットに対して回帰モデリングを実行するために使用されます。 このパイプラインのトレーニングデータセットでは、feature列はpower_usage_decline_level、line_loss_rate、warning_numです。 ラベルの列は_theftです。
④
予測コンポーネントは、モデルを予測データセットに適用した結果を予測します。 Evaluateコンポーネントは、予測精度を評価します。
パイプラインを実行し、結果を表示します。
キャンバスの上部にある実行アイコンをクリックして、パイプラインを実行します。
パイプラインを実行した後、コレリーフキャンバス上のコンポーネントを選択し、ビジュアル分析.
では、Corrcoefセクションでは、ユーザーが電気を盗むか、電気漏れに関与しているかを判断する際の各機能の影響を表示します。
power_usage_deline_level、line_loss_rate、およびwarning_numの各機能は、is_theftと明確な相関関係がありません。 これは、複数の特徴に基づいてユーザが電気を盗むか漏電に関与しているかを判定することを意味する。
右クリック評価キャンバスをクリックしてビジュアル分析.
[評価レポート] ダイアログボックスで、[グラフ] タブをクリックして、モデル評価インデックスを表示します。
1に近いAUC値は、モデルのより高い予測精度を示す。 前の図では、AUC値は0.8より大きい。 これは、モデルの予測精度が高いことを示している。
関連ドキュメント
Machine Learning Designerを使用して、他のAI開発タスクを実行できます。 詳細については、「機械学習デザイナーの概要」をご参照ください。