すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:AutoMLとは

最終更新日:Jul 22, 2024

AutoMLは、Platform for AI (PAI) が提供する強化された機械学習サービスで、ハイパーパラメータの組み合わせを自動的に見つけるのに役立ちます。 ハイパーパラメータの組み合わせが複雑で、大量のトレーニングリソースとワークロードの微調整が必要なモデルトレーニングシナリオでは、AutoMLを使用してハイパーパラメータを効率的に微調整し、モデルの品質を向上させることができます。

基本概念

  • Hyperparameter: モデルのトレーニングに使用される外部パラメーター。 モデルのトレーニングを開始する前に、ハイパーパラメータを設定する必要があります。 モデルのハイパーパラメータを設定した後、モデルのトレーニング中、ハイパーパラメータは変更されません。 対照的に、モデルのパラメータは、機械学習プロセス中に絶えず更新され、最適化される。

  • ハイパーパラメータ最適化 (HPO): 手動または自動のハイパーパラメータの微調整を可能にするプロセス。 このトピックでは、HPOは、AutoMLによって提供されるハイパーパラメータを自動的に検索して微調整するサービスを指します。 HPOは、最適なハイパーパラメータを取得し、モデルのパフォーマンスを効率的に向上させるのに役立ちます。 HPOにより、アルゴリズム開発者はモデリングに集中することもできます。

  • 検索スペース: ハイパーパラメータの組み合わせの可能な値の範囲。 AutoMLは、この範囲内で最適なハイパーパラメータの組み合わせを検索します。

  • 実験: 実験を作成することで、検索空間でモデルの最適なハイパーパラメータの組み合わせを検索できます。

  • トライアル: 各トライアルは、特定のハイパーパラメータの組み合わせを使用することによるモデルのトレーニング、生成、および評価を含みます。 実験は複数の試行を実行し、試行の結果を比較して最適なハイパーパラメータの組み合わせを見つける。 詳細については、「AutoMLの仕組み」をご参照ください。

  • ジョブタイプ: トライアルのトレーニングに使用されるリソースと環境。 有効な値: Deep Learning Containers (DLC) およびMaxCompute。

背景情報

機械学習では、ハイパーパラメータはモデルのトレーニングに使用されるパラメータのセットです。

HPOは、最適なハイパーパラメータを見つけるプロセスです。 モデルに多次元ベクトルなどの複数のハイパーパラメータがある場合、HPOは、このモデルのベクトル値のすべての範囲にわたって最適なモデル性能を提供する特定のベクトル値を見つけます。

例えば、モデルは、2つのハイパーパラメータa及びBを有する。Aの可能な値はa、bおよびcであり、Bの可能な値はdおよびeである。 この場合、モデルは6つのハイパーパラメータの組み合わせを有する。 このモデルでは、HPOは、モデルが他のモデルよりも優れているAとBの特定の組み合わせを見つけます。 最適なハイパーパラメータの組み合わせを取得するには、同じトレーニングデータセットでのモデルトレーニングにAとBの6つの組み合わせを別々に使用します。 次に、同じテストデータセットを使用してモデルのパフォーマンスを比較します。

AutoMLのHPO

ハイパーパラメータの微調整は、プロセスが大量のモデルハイパーパラメータと、様々なデータタイプおよびハイパーパラメータの値範囲とを含むため、複雑である。 例えば、モデルは複数のハイパーパラメータを有し、いくつかのハイパーパラメータは整数型であり、いくつかのパラメータは浮動小数点型である。 この場合、手動のハイパーパラメータチューニングは、大量のコンピューティングリソースを必要とする。 この場合、タスクを完了するには自動システムが必要です。 AutoMLのHPO機能は、さまざまなハイパーパラメータを自動的に微調整するのに役立ちます。

AutoMLを使用して、シンプルで効率的かつ正確な方法でハイパーパラメータを微調整できます。 次のセクションでは、AutoMLを使用する利点について説明します。

  • 簡易微調整: AutoMLは、自動化ツールを使用することで、ハイパーパラメータの微調整のプロセスを大幅に簡素化し、時間を節約します。

  • モデル品質の向上: AutoMLは、PAIの複数のアルゴリズムを統合して、最適なハイパーパラメータの組み合わせをすばやく見つけます。 これにより、モデルをより正確かつ効率的にトレーニングできます。

  • コンピューティングリソースの削減: AutoMLは、トレーニング中にモデルのパフォーマンスを評価し、現在のトレーニングを終了して別のハイパーパラメータの組み合わせを評価するかどうかを判断します。 AutoMLを使用すると、すべての組み合わせを評価することなく、最適なハイパーパラメータの組み合わせを取得できます。 これにより、コンピューティングリソースを節約できます。

  • コンピューティングパワーの柔軟な使用: AutoMLでDLCおよびMaxComputeリソースを便利で柔軟な方法で使用できます。

シナリオ

AutoMLは、機械学習トレーニングのすべてのハイパーパラメータの微調整シナリオに適しています。 次のセクションでは、機械学習の一般的なシナリオについて説明します。

  • ユーザーが有料ユーザーであるかどうかの判断など、バイナリ分類タスク。

  • ユーザーが7日以内に行う支払い金額の見積もりなどの回帰タスク。

  • 都市の化粧品ブランドの支店数を決定するなどのクラスタリングタスク。

  • ランキングや検索モデルの微調整、曲線下面積 (AUC) メトリックの改善などの推奨タスク。

  • 画像多分類やビデオ多分類の精度を向上させるなどのディープラーニングタスク。

参照

  • AutoMLのしくみ

    (お勧めします。) このトピックでは、AutoMLの仕組みと、実験、トライアル、トレーニングタスクの関係について説明します。 これは、概念に精通し、構成を容易にするのに役立ちます。

  • Create an experiment

    このトピックでは、PAIコンソールで実験を作成する方法と、主要なパラメーターを設定する方法について説明します。

  • AutoMLユースケース

    このトピックでは、AutoMLを使用してハイパーパラメータを微調整する方法のユースケースについて説明します。