Elastic GPU Service

人工知能 (特に深層学習と機械学習)、ハイパフォーマンスコンピューティング、
プロフェッショナル向け画像処理などのシナリオに適した、GPU コンピューティングアクセラレーターを備えた
柔軟なコンピューティングインスタンス

今すぐ購入お問い合わせ

概要
インスタンスファミリー
GPU 関連のソフトウェア
比較
シナリオ
料金
ドキュメント

お問い合わせ

概要

お問い合わせ

概要
インスタンスファミリー
GPU 関連のソフトウェア
比較
シナリオ
料金
ドキュメント

すべてのシナリオでの異種コンピューティングをサポート

Elastic GPU Service には、ソフトウェアとハードウェアの組み合わせにより、リソースの柔軟な割り当て、システムの柔軟なスケーリング、コンピューティングパワーの向上、AI 関連ビジネスのコストの削減を支援するサービスが揃っています。深層学習、ビデオのエンコードとデコード、ビデオ処理、科学的コンピューティング、グラフィック可視化、クラウドゲームなどのシナリオに適用できます。

Elastic GPU Service は、GPU で高速化されたコンピューティング機能と、すぐに使用できるスケーラブルな GPU コンピューティングリソースを提供します。 GPU は、数学的および幾何学的コンピューティング、特に浮動小数点および並列コンピューティングの実行で独自の特長を備えています。 GPU は、対応する CPU の 100 倍の計算能力を発揮します。

さまざまなコンピューティング機能

GPU は、大規模な並列計算に使用できる多数の算術論理演算ユニット (ALU) を備えています。 Elastic GPU Service では、最新の GPU アクセラレーションチップを使用し、ビジネスの目的 (AI、グラフィックス、トランスコード、暗号化など) に対応するさまざまなアクセラレーターカード (FPGA、GPU、ASICなど) を使用できます。

使いやすい

GPU リソースは、世界中の異なる地理的な場所に展開されています。シンプルなロジック制御ユニットを使用して、ビジネス要件に基づいてシステムを拡張できます。 Elastic GPU Service では、補助ツール (AIACC、FastGPU、cGPUなど) も使用できます。

高いネットワーク性能

SHENLONG アーキテクチャを使用して、サーバーのパフォーマンスを向上し、I/O の遅延を削減しています。 GPU は、最大 2400 万 pps、VPC 上で最大 64 Gbit/s の帯域幅、800G RDMA ネットワークをサポートします。複数のスレッドを並列に実行してコンピューティングタスクを処理する高スループットシナリオに適しています。

GPU アクセラレーションインスタンスファミリー

GPU アクセラレーションコンピューティング最適化インスタンスファミリー GPU アクセラレーション ECS Bare Metal Instance ファミリー vGPU アクセラレーションインスタンスファミリー

インスタンスタイプ

最大 GPU 数

最大メモリ

最大 GPU メモリ

最大 PPS

料金

デプロイ可能リージョン：
中国 (北京)、中国 (ウランチャブ) 、中国 (杭州)、中国 (上海)、中国 (深セン)、中国 (河源)、中国 (広州)、中国 (成都)、中国 (香港)、日本 (東京)、韓国 (ソウル)、シンガポール、タイ (バンコク)、米国 (バージニア)、ドイツ (フランクフルト)

シナリオ：
• 画像認識、音声認識、動作識別など、高性能な CPU、メモリ、GPU を必要とする同時 AI 推論タスク。

gn7i

NVIDIA A10 * 4

752GB

24GB * 4

2400 万 pps

USD 676.49～/ 月

今すぐ購入

デプロイ可能リージョン：
中国 (青島)、中国 (北京)、中国 (張家口)、中国 (フフホト)、中国 (ウランチャブ)、中国 (深セン)、中国 (河源)、中国 (広州)、中国 (杭州)、中国 (上海)、中国 (南京)、中国 (成都)、中国 (香港)、米国 (バージニア)、米国 (シリコンバレー)、イギリス (ロンドン) 、ドイツ (フランクフルト)、UAE (ドバイ)、マレーシア (クアラルンプール)、インド (ムンバイ)、日本 (東京)、オーストラリア (シドニー)、シンガポール、インドネシア (ジャカルタ)、韓国 (ソウル)、タイ (バンコク)

シナリオ：
• 画像分類、自動運転車、音声認識で使用される AI アルゴリズムのトレーニングおよび推論アプリケーションなどのディープラーニングアプリケーション。
• 数値流体力学、金融工学、分子動力学、環境分析などの科学的コンピューティングアプリケーション。

gn6e

NVIDIA V100 * 8

736GB

32GB * 8

480 万 pps

USD 1319.93～/ 月

今すぐ購入

デプロイ可能リージョン：
中国 (青島)、中国 (北京)、中国 (張家口)、中国 (ウランチャブ)、中国 (杭州)、中国 (上海)、中国 (深セン)、シンガポール、米国 (バージニア)

シナリオ：
• 画像分類、自動運転車、音声認識で使用される AI アルゴリズムのトレーニングおよび推論アプリケーションなどのディープラーニングアプリケーション。
• 数値流体力学、金融工学、分子動力学、環境分析などの科学的コンピューティングアプリケーション。

gn6v

NVIDIA V100 * 8

336GB

16GB * 8

450 万 pps

USD 884.54～/ 月

今すぐ購入

デプロイ可能リージョン：
中国 (青島)、中国 (北京)、中国 (張家口)、中国 (ウランチャブ)、中国 (杭州)、中国 (上海)、中国 (南京)、中国 (深セン)、中国 (河源)、中国 (広州)、中国 (福州)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、インド (ムンバイ)、米国 (バージニア)、米国 (シリコンバレー)、サウジアラビア (リヤド)、ドイツ (フランクフルト)

シナリオ：
• コンピュータービジョン、音声認識、音声合成、自然言語処理 (NLP) 、機械翻訳、レコメンデーションシステム向けの AI (深層学習および機械学習) 推論。
• クラウドゲーム向けリアルタイムレンダリング
• AR および VR アプリケーション向けリアルタイムレンダリング
• グラフィックスワークステーションまたは過負荷グラフィックスコンピューティング
• GPU 高速化データベース
• ハイパフォーマンスコンピューティング

gn6i

NVIDIA T4 * 4

372GB

16GB * 4

480 万 pps

USD 466.34～/ 月

今すぐ購入

デプロイ可能リージョン：
中国 (青島)、中国 (北京)、中国 (張家口)、中国 (杭州)、中国 (上海)、中国 (深セン)

シナリオ：
• 深層学習の推論
• マルチメディアのエンコードやデコードなど、サーバー側 GPU コンピューティングワークロード

gn5i

NVIDIA P4 * 2

224GB

8GB * 2

200 万 pps

USD 290.2～/ 月

今すぐ購入

デプロイ可能リージョン：
中国 (北京)、中国 (張家口)、中国 (フフホト)、中国 (ウランチャブ) 、中国 (杭州)、中国 (上海)、中国 (深セン)、中国 (香港)、日本 (東京)、シンガポール (シンガポール)、オーストラリア (シドニー)、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、インド (ムンバイ)、米国 (バージニア)、米国 (シリコンバレー), ドイツ (フランクフルト)

シナリオ：
• 深層学習
• 数値流体力学、金融工学、ゲノミクス、環境分析などの科学的コンピューティングアプリケーション。
• ハイパフォーマンスコンピューティング、レンダリング、マルチメディアのエンコードとデコードなどのサーバー側 GPU コンピューティングワークロード

gn5

NVIDIA P100 * 8

480GB

16GB * 8

400 万 pps

USD 520.9～/ 月

今すぐ購入

コンピューティング効率を向上する GPU ソフトウェア

Alibaba Cloud が補助ツールを提供

AIACC-Training

Alibaba Cloud AIACC-Training は、Alibaba Cloud 環境向けに最適化された AI アクセラレーターです。 AI の分散トレーニングとネットワーク帯域幅使用率の効率を大幅に向上できます。 AIACC-Training は 2 つの世界記録を樹立しています。DAWNBench ImageNet コンペティション (スタンフォード大学開催) で最速のトレーニングスピード
DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低いトレーニングコスト

詳細を見る >

機能

主流のフレームワークをサポート

分散トレーニングフレームワーク：TensorFlow、PyTorch、MXNet、Caffe
パフォーマンスが 50% ～ 300% 向上

帯域幅集約型ネットワークモデル
1 つ以上のマルチ GPU サーバーの高性能通信

FP16 グラデーション圧縮と混合精度圧縮をサポート
MXNet 用 API 拡張

InsightFace タイプのデータ並列処理とモデル並列処理をサポート
RDMA ネットワーク向けに最適化

ハイブリッドリンク通信 (RDMA と VPC)

AIACC-Inference

Alibaba Cloud AIACC-Inference は、Alibaba Cloud 環境向けに最適化された AI アクセラレーターです。 GPU の使用率と推論のパフォーマンスを大幅に向上できます。 AIACC-Inference は 2 つの世界記録を樹立しています。DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低い推論レイテンシ
DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低い推論コスト

詳細を見る >

機能

複数のフレームワークをサポート

Tensorflow、Pytorch、MXNet、およびその他の深層学習フレームワークでは、Open Neural Network Exchange (ONNX) 形式でモデルをエクスポートして、推論のパフォーマンスを向上できます。
パフォーマンスが 30% ～ 400% 向上

コンピューティング集約型ネットワークモデル
複数のモデル精度をサポート

FP32 と FP16 でモデルを最適化

GPU クラスターデプロイツール

Alibaba Cloud FastGPU は、数回のクリックでクラウド上に GPU コンピューティングリソースをデプロイできる、GPU クラスター向けの高速デプロイツール群です。 FastGPU はすぐに設定でき、どこでも簡単に使用できます。 FastGPU は、時間を節約し、費用対効果が高く、使いやすいソリューションで GPUクラスターの迅速なデプロイを実現します。

詳細を見る >

機能

すばやくデプロイ

GPU クラスターでオフライントレーニングおよび推論スクリプトを迅速にデプロイするための API 操作
簡単に管理

GPU クラスターのステータスとライフサイクルを管理するコマンドラインツールを使用可能
効率的で省時間

Alibaba Cloud の IAAS レイヤーでは、コンピューティング、ストレージ、ネットワークのデプロイ操作を実行する必要はありません。クラスターリソースを取得すると、適切な環境に自動的に設定されます。

コンテナー用 GPU 共有ソフトウェア

GPU リソースを分割して複数の分離されたコンテナーに割り当てることで、複数のコンテナーで単一の GPU を使用できます。 cGPU は、単一の GPU で複数のコンテナーを実行し、コンテナー間で GPU アプリケーションを分離できます。 GPU ハードウェアのリソース利用率を改善できます。

詳細を見る >

機能

GPU 分割

GPUリソースを分割して GPU 使用率を改善
GPU 共有

複数の AI アプリケーションでGPUを共有することによるコスト削減
柔軟性

コンピューティングパワーと GPU メモリを柔軟に分割してアプリケーションの要件を満足します。

関連プロダクト

Elastic Compute Service (ECS)

Container Service for Kubernetes (ACK)

{"moduleinfo":{"title":"Elastic GPU Service と自社管理 のGPU 高速化サーバーの比較","des":"","width":"small"},"head":[{"text":"項目","row":"1","col":"1","highlighted":true},{"text":"Elastic GPU Service","row":"1","col":"1","highlighted":true},{"text":"自社管理の GPU 高速化サーバー","row":"1","col":"1","highlighted":true}],"list":[{"cell":[{"style":"text","text":"<center>柔軟性</center>","row":"1","col":"1"},{"style":"text","text":"· 1 つ以上の GPU アクセラレーションインスタンスを簡単に作成可能 · インスタンスタイプのアップグレードやダウングレードなど、vCPU 数とメモリサイズの異なるインスタンスタイプ間のオンライン変更をサポート · 帯域幅を調整可能 ","row":"1","col":"1"},{"style":"text","text":"· サブスクリプション期間の延長が必要 · 設定を変更できない · 調整できないアウトバウンド帯域幅の 1 回限りの購入が必要","row":"1","col":"1"}]},{"cell":[{"style":"text","text":"<center>使いやすさ</center>","row":"1","col":"1"},{"style":"text","text":"· オンライン管理のための Web ベースのコンソールを使用可能 · 主流オペレーティングシステム (ライセンス認証済みの純正 Windows オペレーティングシステムなど) を搭載し、オペレーティングシステムをオンラインで交換可能 · インスタンスの購入時に GPU ドライバーを購入およびインストール可能","row":"1","col":"1"},{"style":"text","text":"· オンライン管理ツールを提供されないため、手動の管理とメンテナンスが必要 · オペレーティングシステムの用意、インストール、交換を自社で実施 · オペレーティングシステムの準備とインストールを自社で実施","row":"1","col":"1"}]},{"cell":[{"style":"text","text":"<center>ディザスタリカバリとバックアップ</center>","row":"1","col":"1"},{"style":"text","text":"· データごとに 3 つのコピーを格納。 1 つのコピーが破損しても、データをすばやく復元可能 · ハードウェア障害から自動ですばやく回復可能","row":"1","col":"1"},{"style":"text","text":"· ディザスタリカバリ環境の主導による構築と、高価な従来のストレージデバイスの使用が必要 · 破損したデータは手動での修正が必要 ","row":"1","col":"1"}]},{"cell":[{"style":"text","text":"<center>コスト</center>","row":"1","col":"1"},{"style":"text","text":"· 課金方法はサブスクリプションと従量課金をサポート。 ビジネスニーズに基づいて適切な課金方法を選択可能 · 大規模な先行投資を行うことなく、オンデマンドのリソースを購入可能 ","row":"1","col":"1"},{"style":"text","text":" · ピーク時の設定要件を満足するには、前払いでのリソース購入が必要 · 高額の先行投資が必要で、リソースの無駄が発生","row":"1","col":"1"}]}],"$root":{"moduleinfo":{"title":"Elastic GPU Service と自社管理 のGPU 高速化サーバーの比較","des":"","width":"small"},"head":[{"text":"項目","row":"1","col":"1","highlighted":true},{"text":"Elastic GPU Service","row":"1","col":"1","highlighted":true},{"text":"自社管理の GPU 高速化サーバー","row":"1","col":"1","highlighted":true}],"list":[{"cell":[{"style":"text","text":"<center>柔軟性</center>","row":"1","col":"1"},{"style":"text","text":"· 1 つ以上の GPU アクセラレーションインスタンスを簡単に作成可能 · インスタンスタイプのアップグレードやダウングレードなど、vCPU 数とメモリサイズの異なるインスタンスタイプ間のオンライン変更をサポート · 帯域幅を調整可能 ","row":"1","col":"1"},{"style":"text","text":"· サブスクリプション期間の延長が必要 · 設定を変更できない · 調整できないアウトバウンド帯域幅の 1 回限りの購入が必要","row":"1","col":"1"}]},{"cell":[{"style":"text","text":"<center>使いやすさ</center>","row":"1","col":"1"},{"style":"text","text":"· オンライン管理のための Web ベースのコンソールを使用可能 · 主流オペレーティングシステム (ライセンス認証済みの純正 Windows オペレーティングシステムなど) を搭載し、オペレーティングシステムをオンラインで交換可能 · インスタンスの購入時に GPU ドライバーを購入およびインストール可能","row":"1","col":"1"},{"style":"text","text":"· オンライン管理ツールを提供されないため、手動の管理とメンテナンスが必要 · オペレーティングシステムの用意、インストール、交換を自社で実施 · オペレーティングシステムの準備とインストールを自社で実施","row":"1","col":"1"}]},{"cell":[{"style":"text","text":"<center>ディザスタリカバリとバックアップ</center>","row":"1","col":"1"},{"style":"text","text":"· データごとに 3 つのコピーを格納。 1 つのコピーが破損しても、データをすばやく復元可能 · ハードウェア障害から自動ですばやく回復可能","row":"1","col":"1"},{"style":"text","text":"· ディザスタリカバリ環境の主導による構築と、高価な従来のストレージデバイスの使用が必要 · 破損したデータは手動での修正が必要 ","row":"1","col":"1"}]},{"cell":[{"style":"text","text":"<center>コスト</center>","row":"1","col":"1"},{"style":"text","text":"· 課金方法はサブスクリプションと従量課金をサポート。 ビジネスニーズに基づいて適切な課金方法を選択可能 · 大規模な先行投資を行うことなく、オンデマンドのリソースを購入可能 ","row":"1","col":"1"},{"style":"text","text":" · ピーク時の設定要件を満足するには、前払いでのリソース購入が必要 · 高額の先行投資が必要で、リソースの無駄が発生","row":"1","col":"1"}]}]},"$moduleId":"7820933590"}

Elastic GPU Service と自社管理のGPU 高速化サーバーの比較

項目	Elastic GPU Service	自社管理の GPU 高速化サーバー
柔軟性	· 1 つ以上の GPU アクセラレーションインスタンスを簡単に作成可能 · インスタンスタイプのアップグレードやダウングレードなど、vCPU 数とメモリサイズの異なるインスタンスタイプ間のオンライン変更をサポート · 帯域幅を調整可能	· サブスクリプション期間の延長が必要 · 設定を変更できない · 調整できないアウトバウンド帯域幅の 1 回限りの購入が必要
使いやすさ	· オンライン管理のための Web ベースのコンソールを使用可能 · 主流オペレーティングシステム (ライセンス認証済みの純正 Windows オペレーティングシステムなど) を搭載し、オペレーティングシステムをオンラインで交換可能 · インスタンスの購入時に GPU ドライバーを購入およびインストール可能	· オンライン管理ツールを提供されないため、手動の管理とメンテナンスが必要 · オペレーティングシステムの用意、インストール、交換を自社で実施 · オペレーティングシステムの準備とインストールを自社で実施
ディザスタリカバリとバックアップ	· データごとに 3 つのコピーを格納。 1 つのコピーが破損しても、データをすばやく復元可能 · ハードウェア障害から自動ですばやく回復可能	· ディザスタリカバリ環境の主導による構築と、高価な従来のストレージデバイスの使用が必要 · 破損したデータは手動での修正が必要
コスト	· 課金方法はサブスクリプションと従量課金をサポート。ビジネスニーズに基づいて適切な課金方法を選択可能 · 大規模な先行投資を行うことなく、オンデマンドのリソースを購入可能	· ピーク時の設定要件を満足するには、前払いでのリソース購入が必要 · 高額の先行投資が必要で、リソースの無駄が発生

シナリオ

業界をリードするソリューションと高性能

Alibaba Cloud Elastic GPU Service は、エンジニアリングシミュレーションと分析で高いパフォーマンス、スケーラビリティ、エンタープライズグレードの信頼性を実現する先進のソリューションを実現します。大きな GPU メモリサイズと高い GPU パフォーマンスによる計算能力を活用して複雑なシミュレーションを実行し、困難な問題を解決できます。

メリット

最適化されたソリューション

CFD モデリングを活用して解決時間を大幅に短縮
計算電磁気学の電子設計を高速化

電磁性能をシミュレートし、電磁放射、干渉、伝送を予測することで、高性能な電子製品とコンポーネントの設計を支援します
エンジニアリングシミュレーション

生産性を向上し、IT 予算を削減するクラウド上の仮想化アプリケーション

高品質表示のための HD ビデオ処理

ビデオ処理タスクでは、さまざまな問題 (大量のデータや長い処理時間など) が発生します。 GPU はタスクを並列に計算できるため、ビデオ処理の最適化に使用できます。 GPU は主に、大規模な高精細ビデオのトランスコード、4K および 8K ライブストリーミング、マルチユーザービデオ会議、ビデオソースの修復などの分野で使用されます。

メリット

ハイパフォーマンス

最適化によりコンピューティングパフォーマンスを向上
優れたコンピューティングパワー

マルチフレームデータの高速処理と多数のコンピューティングタスクを処理するためのコンピューティングパワーをサポート

ハイパフォーマンスコンピューティング

GPUは、大規模な並列コンピューティングを必要とする科学コンピューティング (気象予測、炭化水素探査、分子動力学研究など) において重要な役割を果たします。エラスティックコンピューティングと組み合わせて、GPU は大規模な浮動小数点演算に必要な計算能力を提供します。オンラインとオフラインの両方で計算能力を利用できます。

メリット

自動スケーリング

ESS および SLB と統合して自動スケーリングを実装
優れたコンピューティングパワー

科学的コンピューティングにおける大規模なコンピューティング要件を満足するための最新の GPU と迅速なデプロイ方法

成功事例

最大の決め手は認識精度でした。Vision AI Platform は検証の初期段階からモザイク処理対象のナンバープレートを 90% 以上の精度で認識していました。

さらに細かなチューニングを施した結果、導入時には 95％を超える精度で認識・モザイク処理を自動で行えるようになりました。

– 株式会社IDOMフリマ事業部フリママーケティングセクションセクションリーダー内山千章氏

株式会社 IDOM (東京都千代田区) は国内最大級規模の車両流通データを取り扱う中古車の販売・買取事業を展開、昨今では、整備・板金・アフターサービスを充実させた超大型店を出店しています。

IDOM プラットフォームを使用すると、利用者は売りたい車の写真を自由にアップロードできますが、セルフサービスの制限や手動チェックや手直しによる労働時間の増加の問題に直面していました。 Alibaba Cloud は、高精度の画像認識技術と対面サポートを提供しています。

全文ビデオを見る

Ms-meta.HK は、Alibaba Cloud のソリューションを実装する際にさまざまなサービスを活用しました。これらのサービス (Alibaba Cloud の現地の技術専門家および専任サポートチーム) により、メタバースサービスを容易に一般公開することができました。

Ms-meta.HK は、香港を拠点とするコミュニティ主導の分散型メタバースプロジェクトです。 Ms-meta.HK は、メタバースで Alibaba Cloud のクラウドレンダリングとトラフィック分散テクノロジーを積極的に活用しています。 Alibaba Cloud とのコラボレーションにより、メタバースの仮想シーンを最適化し、読み込み時間を短縮して、より優れたユーザーエクスペリエンスを提供しています。さらに、Alibaba Cloud の堅牢なセキュリティサービスにより、公開サーバーを保護しています。 Ms-meta.HK は、Alibaba Cloud の支援により、メタバースインフラストラクチャサービスをさらに最適化したいと考えています。

全文ビデオを見る

ADVANCE では、コアビジネスの一環として、Alibaba Cloud のさまざまなクラウドネイティブのデータストレージと管理ソリューションを利用して AI および機械学習アルゴリズムのデータウェアハウスとデータ分析プロセスを管理しています。たとえば、ADVANCE では、インメモリキャッシュと高速アクセスに ApsaraDB For Redis、柔軟な半構造化データストレージに ApsaraDB for MongoDB、さまざまなデータソース間のデータ集約、処理、ガバナンスに DataWorks、リアルタイムビッグデータ処理に Realtime Compute for Apache Flink を使用しています。

Advance Intelligence Group (ADVANCE) は、アジア太平洋地域の Al 主導のテクノロジー企業です。東南アジア (SEA) 市場、特にインドネシアでは大手の一角を占めています。

ADVANCE は、強化された AI サービスを顧客に提供することに取り組んでいます。 Alibaba Cloudは、革新的なクラウドインフラストラクチャサービスを通じた成功を達成するために、引き続き ADVANCE をサポートします。 AI とクラウドコンピューティングの組み合わせにより、より高い効率、生産性、デジタルセキュリティで、より多くの価値を顧客に提供します。

全文