すべてのシナリオでの異種コンピューティングをサポート
Elastic GPU Service には、ソフトウェアとハードウェアの組み合わせにより、リソースの柔軟な割り当て、システムの柔軟なスケーリング、コンピューティングパワーの向上、AI 関連ビジネスのコストの削減を支援するサービスが揃っています。 深層学習、ビデオのエンコードとデコード、ビデオ処理、科学的コンピューティング、グラフィック可視化、クラウドゲームなどのシナリオに適用できます。
Elastic GPU Service は、GPU で高速化されたコンピューティング機能と、すぐに使用できるスケーラブルな GPU コンピューティングリソースを提供します。 GPU は、数学的および幾何学的コンピューティング、特に浮動小数点および並列コンピューティングの実行で独自の特長を備えています。 GPU は、対応する CPU の 100 倍の計算能力を発揮します。
さまざまなコンピューティング機能
GPU は、大規模な並列計算に使用できる多数の算術論理演算ユニット (ALU) を備えています。 Elastic GPU Service では、最新の GPU アクセラレーションチップを使用し、ビジネスの目的 (AI、グラフィックス、トランスコード、暗号化など) に対応するさまざまなアクセラレーターカード (FPGA、GPU、ASICなど) を使用できます。
使いやすい
GPU リソースは、世界中の異なる地理的な場所に展開されています。 シンプルなロジック制御ユニットを使用して、ビジネス要件に基づいてシステムを拡張できます。 Elastic GPU Service では、補助ツール (AIACC、FastGPU、cGPUなど) も使用できます。
高いネットワーク性能
SHENLONG アーキテクチャを使用して、サーバーのパフォーマンスを向上し、I/O の遅延を削減しています。 GPU は、最大 2400 万 pps、VPC 上で最大 64 Gbit/s の帯域幅、800G RDMA ネットワークをサポートします。 複数のスレッドを並列に実行してコンピューティングタスクを処理する高スループットシナリオに適しています。
コンピューティング効率を向上する GPU ソフトウェア
AIACC-Training
Alibaba Cloud AIACC-Training は、Alibaba Cloud 環境向けに最適化された AI アクセラレーターです。 AI の分散トレーニングとネットワーク帯域幅使用率の効率を大幅に向上できます。 AIACC-Training は 2 つの世界記録を樹立しています。DAWNBench ImageNet コンペティション (スタンフォード大学開催) で最速のトレーニングスピード
DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低いトレーニングコスト
詳細を見る >
機能
-
主流のフレームワークをサポート
分散トレーニングフレームワーク:TensorFlow、PyTorch、MXNet、Caffe
-
パフォーマンスが 50% ~ 300% 向上
帯域幅集約型ネットワークモデル
-
1 つ以上のマルチ GPU サーバーの高性能通信
FP16 グラデーション圧縮と混合精度圧縮をサポート
-
MXNet 用 API 拡張
InsightFace タイプのデータ並列処理とモデル並列処理をサポート
-
RDMA ネットワーク向けに最適化
ハイブリッドリンク通信 (RDMA と VPC)
関連プロダクト
AIACC-Inference
Alibaba Cloud AIACC-Inference は、Alibaba Cloud 環境向けに最適化された AI アクセラレーターです。 GPU の使用率と推論のパフォーマンスを大幅に向上できます。 AIACC-Inference は 2 つの世界記録を樹立しています。DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低い推論レイテンシ
DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低い推論コスト
詳細を見る >
機能
-
複数のフレームワークをサポート
Tensorflow、Pytorch、MXNet、およびその他の深層学習フレームワークでは、Open Neural Network Exchange (ONNX) 形式でモデルをエクスポートして、推論のパフォーマンスを向上できます。
-
パフォーマンスが 30% ~ 400% 向上
コンピューティング集約型ネットワークモデル
-
複数のモデル精度をサポート
FP32 と FP16 でモデルを最適化
関連プロダクト
GPU クラスターデプロイツール
Alibaba Cloud FastGPU は、数回のクリックでクラウド上に GPU コンピューティングリソースをデプロイできる、GPU クラスター向けの高速デプロイツール群です。 FastGPU はすぐに設定でき、どこでも簡単に使用できます。 FastGPU は、時間を節約し、費用対効果が高く、使いやすいソリューションで GPUクラスターの迅速なデプロイを実現します。
詳細を見る >
機能
-
すばやくデプロイ
GPU クラスターでオフライントレーニングおよび推論スクリプトを迅速にデプロイするための API 操作
-
簡単に管理
GPU クラスターのステータスとライフサイクルを管理するコマンドラインツールを使用可能
-
効率的で省時間
Alibaba Cloud の IAAS レイヤーでは、コンピューティング、ストレージ、ネットワークのデプロイ操作を実行する必要はありません。 クラスターリソースを取得すると、適切な環境に自動的に設定されます。
関連プロダクト
コンテナー用 GPU 共有ソフトウェア
GPU リソースを分割して複数の分離されたコンテナーに割り当てることで、複数のコンテナーで単一の GPU を使用できます。 cGPU は、単一の GPU で複数のコンテナーを実行し、コンテナー間で GPU アプリケーションを分離できます。 GPU ハードウェアのリソース利用率を改善できます。
詳細を見る >
機能
-
GPU 分割
GPUリソースを分割して GPU 使用率を改善
-
GPU 共有
複数の AI アプリケーションでGPUを共有することによるコスト削減
-
柔軟性
コンピューティングパワーと GPU メモリを柔軟に分割してアプリケーションの要件を満足します。
Elastic GPU Service と自社管理 のGPU 高速化サーバーの比較
項目 | Elastic GPU Service | 自社管理の GPU 高速化サーバー |
---|---|---|
|
· 1 つ以上の GPU アクセラレーションインスタンスを簡単に作成可能 · インスタンスタイプのアップグレードやダウングレードなど、vCPU 数とメモリサイズの異なるインスタンスタイプ間のオンライン変更をサポート · 帯域幅を調整可能 |
· サブスクリプション期間の延長が必要 · 設定を変更できない · 調整できないアウトバウンド帯域幅の 1 回限りの購入が必要 |
|
· オンライン管理のための Web ベースのコンソールを使用可能 · 主流オペレーティングシステム (ライセンス認証済みの純正 Windows オペレーティングシステムなど) を搭載し、オペレーティングシステムをオンラインで交換可能 · インスタンスの購入時に GPU ドライバーを購入およびインストール可能 |
· オンライン管理ツールを提供されないため、手動の管理とメンテナンスが必要 · オペレーティングシステムの用意、インストール、交換を自社で実施 · オペレーティングシステムの準備とインストールを自社で実施 |
|
· データごとに 3 つのコピーを格納。 1 つのコピーが破損しても、データをすばやく復元可能 · ハードウェア障害から自動ですばやく回復可能 |
· ディザスタリカバリ環境の主導による構築と、高価な従来のストレージデバイスの使用が必要 · 破損したデータは手動での修正が必要 |
|
· 課金方法はサブスクリプションと従量課金をサポート。 ビジネスニーズに基づいて適切な課金方法を選択可能 · 大規模な先行投資を行うことなく、オンデマンドのリソースを購入可能 |
· ピーク時の設定要件を満足するには、前払いでのリソース購入が必要 · 高額の先行投資が必要で、リソースの無駄が発生 |
シナリオ
業界をリードするソリューションと高性能
Alibaba Cloud Elastic GPU Service は、エンジニアリングシミュレーションと分析で高いパフォーマンス、スケーラビリティ、エンタープライズグレードの信頼性を実現する先進のソリューションを実現します。 大きな GPU メモリサイズと高い GPU パフォーマンスによる計算能力を活用して複雑なシミュレーションを実行し、困難な問題を解決できます。
メリット
-
最適化されたソリューション
CFD モデリングを活用して解決時間を大幅に短縮
-
計算電磁気学の電子設計を高速化
電磁性能をシミュレートし、電磁放射、干渉、伝送を予測することで、高性能な電子製品とコンポーネントの設計を支援します
-
エンジニアリングシミュレーション
生産性を向上し、IT 予算を削減するクラウド上の仮想化アプリケーション
関連プロダクト
高品質表示のための HD ビデオ処理
ビデオ処理タスクでは、さまざまな問題 (大量のデータや長い処理時間など) が発生します。 GPU はタスクを並列に計算できるため、ビデオ処理の最適化に使用できます。 GPU は主に、大規模な高精細ビデオのトランスコード、4K および 8K ライブストリーミング、マルチユーザービデオ会議、ビデオソースの修復などの分野で使用されます。
メリット
-
ハイパフォーマンス
最適化によりコンピューティングパフォーマンスを向上
-
優れたコンピューティングパワー
マルチフレームデータの高速処理と多数のコンピューティングタスクを処理するためのコンピューティングパワーをサポート
関連プロダクト
ハイパフォーマンスコンピューティング
GPUは、大規模な並列コンピューティングを必要とする科学コンピューティング (気象予測、炭化水素探査、分子動力学研究など) において重要な役割を果たします。 エラスティックコンピューティングと組み合わせて、GPU は大規模な浮動小数点演算に必要な計算能力を提供します。 オンラインとオフラインの両方で計算能力を利用できます。
メリット
-
自動スケーリング
ESS および SLB と統合して自動スケーリングを実装
-
優れたコンピューティングパワー
科学的コンピューティングにおける大規模なコンピューティング要件を満足するための最新の GPU と迅速なデプロイ方法