Platform for AI (PAI) は、機械学習のためのオールインワンソリューションを提供します。 このトピックでは、PAIの概要について説明します。
機械学習とは
機械学習は、確率論、統計、近似理論、および複雑なアルゴリズムの知識をカバーする学際的な主題です。 機械学習は、コンピューターをツールとして使用して、人間が本物のリアルタイムで学習する方法をシミュレートし、既存の知識を分類して学習効率を向上させます。 機械学習を使用してモデルを構築する場合、構造またはタイプを仮定し、モデルをトレーニングしてパラメーターを取得し、パラメーターとトレーニング済みモデルを使用して分析と予測を実行できます。 機械学習は、次のシナリオに適用されます。
コンテンツ生成: ビジネス要件に基づいて、トピックに関連するテキスト、画像、ビデオ、およびオーディオコンテンツを生成します。
マーケティング: 商品の推奨、ユーザーのプロファイリング、ターゲット広告。
ファイナンス: ローンの信用リスク予測、金融リスク管理、株式予測、金価格予測。
ソーシャルネットワーク: 主要なオピニオンリーダーとリレーショナルネットワークの分析。
テキスト処理: ニュース分類、キーワード抽出、テキスト要約、およびテキスト分析。
非構造化データ処理: 光学式文字認識 (OCR) に基づく画像分類およびテキスト抽出。
その他の予測シナリオ: 降雨量予測とサッカーの試合結果予測。
機械学習には、従来の機械学習とディープラーニングが含まれ、次の学習モードに分類されます。
教師付き学習: 各サンプルには期待値があります。 入力フィーチャベクトルをターゲット値にマップするモデルを作成できます。 教師付き学習を使用して、回帰と分類の問題を解決できます。
教師なし学習: サンプルには目標値がありません。 教師なし学習を使用して、サンプルデータから潜在的な規則的パターンを発見する。 教師なし学習を使用して、クラスタリングの問題を解決できます。
強化学習: この学習モードは複雑です。 システムは常に外部環境と相互作用してフィードバックを取得し、ターゲットの長期最適化を達成するために独自の動作を決定します。 強化学習の例は、AlphaGoと自動運転です。
PAIとは何ですか?
PAIは、淘宝網、アリペイ、d Amap.comなどのアリババグループ内のビジネスに役立つように設計されました。 Alibaba Groupの開発者は、AIテクノロジーを効率的、簡潔、標準的な方法で使用できます。 PAIは2018年に正式にリリースされました。 何万もの企業と個々の開発者を獲得し、中国のクラウド上の主要な機械学習プラットフォームの1つになりました。
PAIは、以下の基盤となるコンピューティングフレームワークをサポートします。
Flink、ストリームコンピューティングフレームワーク。
TensorFlow、PyTorch、Megatron、DeepSpeedは、最適化されたオープンソースの深層学習フレームワークです。
パラメータサーバーは、数千億のサンプルを並行して処理できるコンピューティングフレームワークです。
Spark、PySpark、MapReduce、およびその他の主流のオープンソースコンピューティングフレームワーク。
PAIは以下のサービスを提供します。
Machine Learning Designer: 視覚化されたモデリングと分散トレーニングのためのサービス。 デザイナーの概要。
Data Science Workshop (DSW): インタラクティブなAI研究開発のためのノートブックベースのサービス。 DSWの概要
Deep Learning Containers (DLC): AI向けの基本的なクラウドネイティブプラットフォーム。 あなたが始める前に。
Elastic Algorithm Service (EAS): モデルをオンライン予測サービスとして展開できるサービスです。 オンラインモデルサービスEASの概要。
PAIは、Alibaba CloudとAlibaba Groupのサービス年数に基づいて以下のメリットを提供します。
AIの研究開発のためのフルライフサイクルのエンドツーエンドのサービス:
データラベリング、モデル開発、モデルトレーニング、モデル最適化、モデル展開、AI O&MをワンストップAIプラットフォームとしてサポートします。
140種類以上の最適化された組み込みアルゴリズムコンポーネントを提供します。
TensorFlowやPyTorchなどの複数の深層学習フレームワークをサポートします。
複数のモード、ビッグデータエンジンとの深い統合、マルチフレームワークの互換性、カスタムイメージなどのコア機能を提供します。
クラウドネイティブのAI開発、トレーニング、およびデプロイサービスを提供します。
多様なサービスモード:
パブリッククラウド向けのフルマネージドおよびセミマネージドのサービスをサポートします。
高性能AIコンピューティングクラスターと軽量サービスモードを提供します。
業界をリードするAI最適化:
高性能トレーニングフレームワーク、スパーストレーニングシナリオ、数十億から数百億のスパース機能、数百億から数十億のサンプル、数千人のワーカーの分散型増分トレーニングをサポートします。
PAI Bladeを使用して、RestNet50やTransformer言語モデル (LM) などの主流フレームワークモデルの高速化をサポートします。
個別または組み合わせて使用するサービスをサポートします。 PAIは、機械学習用のオールインワンプラットフォームを提供します。 Object Storage Service (OSS) またはMaxComputeでトレーニングデータを準備した後、PAIを使用して、データのアップロード、データの前処理、機能エンジニアリング、モデルトレーニング、モデル評価、オンラインおよびオフライン環境へのモデルパブリッシングなど、すべてのワークフローを合理化できます。
DataWorksと統合し、SQL、ユーザー定義関数 (UDF) 、ユーザー定義集計関数 (UDAF) 、およびMapReduceを使用してデータを処理できます。 これにより、より高い柔軟性と効率が保証されます。
DataWorksを使用して、モデルのトレーニングと生成に使用される実験をスケジュールできます。 スケジューリングされたタスクは、ステージング環境または運用環境で実行できます。 これにより、データの分離が可能になります。