GMM予測コンポーネントのトレーニングされたガウス混合モデル (GMM) を使用して、クラスタリング予測を実行できます。 このトピックでは、GMM予測コンポーネントを設定する方法について説明します。
制限事項
GMM予測コンポーネントは、MaxComputeのコンピューティングリソースとPAIのFlinkのみに基づいて使用できます。
PAIコンソールでコンポーネントを設定する
AI (PAI) コンソールでGMM予測コンポーネントのパラメーターを設定できます。
タブ | パラメーター | 説明 |
フィールド設定 | vectorCol | ベクトル列の名前。 |
reservedCols | アルゴリズムによって予約される列。 | |
パラメーター設定 | predictionCol | 予測列の名前。 |
predictionDetailCol | 予測の詳細列の名前。 | |
numThreads | コンポーネントのスレッド数。 デフォルト値は 1 です。 | |
実行チューニング | 数の労働者 | コアの数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。 詳細については、「付録: リソース使用量の見積もり方法」をご参照ください。 |
ワーカあたりのメモリ、単位MB | 各コアのメモリサイズ。 有効値: 1024〜64 × 1024。 単位:MB。 詳細については、「付録: リソース使用量の見積もり方法」をご参照ください。 |
付録: リソース使用量を推定する方法
リソース使用量の見積もりについては、次のセクションを参照してください。
各ノードで使用されるメモリを推定するにはどうすればよいですか?
各ノードによって使用されるメモリは、およそモデルサイズの30倍である。
たとえば、入力モデルサイズが1 GBの場合、各ノードのメモリを30 GBに設定できます。
必要なノードの数を推定するにはどうすればよいですか?
分散トレーニングタスクは、通信オーバーヘッドのためにノードの数が増加するにつれて、高速化し、その後低速化する。 タスクが遅くなった場合は、ノード数の増加を停止します。 このノード量を使用することができる。