Platform for AI (PAI) は、クラウドネイティブのPAIFlowツールに基づいて開発されたワンストップ機械学習可視化モデリングツールとして機械学習デザイナーを提供します。 Machine Learning DesignerはMachine Learning Studioからアップグレードされます。 さらに、Machine Learning Designerは、実績のある複数の組み込み機械学習アルゴリズムを提供し、MaxCompute、Flink、一般的なトレーニングリソースなどのコンピューティングリソースに基づく大規模な分散コンピューティングをサポートします。 Machine Learning Designerは、製品の推奨、財務リスク管理、広告予測など、さまざまなシナリオでビジネス要件を満たすことができます。
アーキテクチャ
機能
機械学習デザイナーを使用するには、Alibaba Cloudアカウントを使用するか、RAM (Resource Access Management) ユーザーとしてPAIコンソールにログインします。 RAMユーザーとしてログインする場合は、Alibaba Cloudアカウントを使用してRAMユーザーに必要な権限を付与する必要があります。 詳細については、「Machine Learning Designerの使用に必要な権限の付与」をご参照ください。
Machine Learning Designerでは、最初から、またはテンプレートを使用してパイプラインを作成できます。 テンプレートからパイプラインを作成する場合、パイプラインが正常に実行された後、パイプラインによって生成されたモデルを直接デプロイできます。 パイプラインの作成方法と管理方法については、「パイプラインの概要」をご参照ください。
Machine Learning Designerは、数百ものコンポーネントを提供し、AI開発で使用されるアルゴリズムをカプセル化し、MaxComputeテーブルやObject Storage Service (OSS) バケットなどの複数のデータソースをサポートします。 Machine Learning Designerでは、これらのアルゴリズムコンポーネントを使用してモデルを作成し、Elastic algorithm Service (EAS) にモデルをデプロイできます。
Machine Learning Designerでは、パイプラインのタスクとバージョンを管理し、パイプラインのバージョンをロールバックすることもできます。 詳細については、「モデルトレーニング」をご参照ください。
Machine Learning Designerには、視覚化されたダッシュボード機能があり、モデルトレーニング中に生成されたデータ、モデル情報、評価メトリックを分析して最適なモデルを取得するのに役立ちます。
Machine Learning Designerでは、現在のワークスペースのメンバーとパイプラインを共有したり、定期的なタスクとしてDataWorksにパイプラインをデプロイしたり、カスタムテンプレートとしてパイプラインを公開したりできます。 詳細については、「DataWorksタスクを使用してMachine Learning Designerでパイプラインをスケジュールする」および「カスタムテンプレートからパイプラインを作成する」をご参照ください。
Machine Learning Designerでは、すぐにデプロイできるモデルをモデル管理モジュールに登録して、個々のモデルサービスまたは複合モデルとしてデプロイできます。 詳細については、「モデル予測の概要」をご参照ください。
パイプラインコンポーネント
Machine Learning Designerは、さまざまなシナリオで要件を満たす数百のコンポーネントを提供します。 詳細については、「コンポーネントリファレンス: すべてのコンポーネントの概要」をご参照ください。
使用シナリオに応じて、コンポーネントは次のカテゴリに分類できます。
従来の機械学習コンポーネント
これらのコンポーネントは、データ前処理、機能エンジニアリング、統計分析、外れ値検出、推奨、時系列分析、およびネットワーク分析で使用されます。
深層学習フレームワークコンポーネント
これらのコンポーネントは、PAI-Easyフレームワークと、TensorFlowやPyTorchなどの他の深層学習フレームワークに基づいて、ビジュアル、オーディオ、または自然言語処理アルゴリズムを提供します。
カスタムアルゴリズムコンポーネント
これらのコンポーネントには、SQLスクリプト、Pythonスクリプト、およびPyAlinkスクリプトが含まれます。 これらのコンポーネントを使用して、ビジネス要件に基づいてカスタムパイプラインを作成できます。
フレームワークとサポートされるコンピューティングリソースに従って、コンポーネントはAlinkベースとPAICommandベースに分けることができます。 両方のフレームワークには、コンポーネントに固有の機能があります。
Alinkベースのアルゴリズムコンポーネント (紫色の点でマーク) は、MaxComputeコンピューティングエンジン、Realtime compute for Apache Flinkリソース、および一般的なトレーニングリソースで実行できます。
Alinkベースのアルゴリズムコンポーネントは、デプロイのためにパイプラインにパックできます。 詳細については、「オンラインサービスとしてのパイプラインのデプロイ」をご参照ください。
Alinkコンポーネントはグループで作成して実行できます。 詳細については、「高度な機能: Alinkコンポーネントがグループで実行される」をご参照ください。
PAIコマンドベースのコンポーネントのサポートは、コンポーネントパラメーターを直接指定するか、SQLスクリプトコンポーネント、DataWorks DataStudio、またはMaxComputeクライアントでPAIコマンドを実行することによって使用できます。
機械学習デザイナーの使用
次の図は、Machine Learning Designerを使用するプロセスを示しています。
Machine Learning Designerを使用してモデルをトレーニングする前に、パイプラインを作成する必要があります。 パイプラインは、複数のメソッドを使用して作成できます。 ビジネス要件に基づいて1つを選択できます。
Machine Learning Designerの [パイプライン構成] タブで、コンポーネントをキャンバスにドラッグし、コンポーネントのコンピューティングリソースを構成し、コンポーネントを接続してパイプラインを作成します。 次に、パイプラインを実行して、トレーニング済みモデルを微調整します。 パイプラインを実行した後、パイプラインを定期的なタスクとしてスケジュールして、パイプラインによって生成されたモデルを自動更新できるようにします。
(オプション) [可視化されたレポートの表示]
モデルをトレーニングした後、視覚化されたダッシュボードで分析レポートを表示して、モデルが期待どおりに機能するかどうかを確認できます。
モデルをトレーニングした後、運用環境にモデルをデプロイして、新しいデータに対して推論を実行できます。
Pipelineスケジューリングエンジン: PAIFlow
PAIFlowは、Machine Learning Designerのパイプラインスケジューリングエンジンです。 パイプラインタスクをPAIFlowに送信することで、パイプラインをスケジュールできます。
PAIFlowの [パイプラインタスク] ページには、すべてのパイプラインタスクが表示されます。
機械学習デザイナーを使用して手動で実行し、DataWorksを使用して定期的にスケジュールします。 詳細については、「パイプラインタスクの管理」をご参照ください。