Elastic GPU Service

人工知能 (特に深層学習と機械学習)、ハイパフォーマンスコンピューティング、
プロフェッショナル向け画像処理などのシナリオに適した、GPU コンピューティングアクセラレーターを備えた
柔軟なコンピューティングインスタンス

すべてのシナリオでの異種コンピューティングをサポート

Elastic GPU Service には、ソフトウェアとハードウェアの組み合わせにより、リソースの柔軟な割り当て、システムの柔軟なスケーリング、コンピューティングパワーの向上、AI 関連ビジネスのコストの削減を支援するサービスが揃っています。 深層学習、ビデオのエンコードとデコード、ビデオ処理、科学的コンピューティング、グラフィック可視化、クラウドゲームなどのシナリオに適用できます。

Elastic GPU Service は、GPU で高速化されたコンピューティング機能と、すぐに使用できるスケーラブルな GPU コンピューティングリソースを提供します。 GPU は、数学的および幾何学的コンピューティング、特に浮動小数点および並列コンピューティングの実行で独自の特長を備えています。 GPU は、対応する CPU の 100 倍の計算能力を発揮します。

さまざまなコンピューティング機能

GPU は、大規模な並列計算に使用できる多数の算術論理演算ユニット (ALU) を備えています。 Elastic GPU Service では、最新の GPU アクセラレーションチップを使用し、ビジネスの目的 (AI、グラフィックス、トランスコード、暗号化など) に対応するさまざまなアクセラレーターカード (FPGA、GPU、ASICなど) を使用できます。

使いやすい

GPU リソースは、世界中の異なる地理的な場所に展開されています。 シンプルなロジック制御ユニットを使用して、ビジネス要件に基づいてシステムを拡張できます。 Elastic GPU Service では、補助ツール (AIACC、FastGPU、cGPUなど) も使用できます。

高いネットワーク性能

SHENLONG アーキテクチャを使用して、サーバーのパフォーマンスを向上し、I/O の遅延を削減しています。 GPU は、最大 2400 万 pps、VPC 上で最大 64 Gbit/s の帯域幅、800G RDMA ネットワークをサポートします。 複数のスレッドを並列に実行してコンピューティングタスクを処理する高スループットシナリオに適しています。

コンピューティング効率を向上する GPU ソフトウェア

Alibaba Cloud が補助ツールを提供

AIACC-Training

Alibaba Cloud AIACC-Training は、Alibaba Cloud 環境向けに最適化された AI アクセラレーターです。 AI の分散トレーニングとネットワーク帯域幅使用率の効率を大幅に向上できます。 AIACC-Training は 2 つの世界記録を樹立しています。DAWNBench ImageNet コンペティション (スタンフォード大学開催) で最速のトレーニングスピード
DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低いトレーニングコスト

詳細を見る >

機能

  • 主流のフレームワークをサポート

    分散トレーニングフレームワーク:TensorFlow、PyTorch、MXNet、Caffe

  • パフォーマンスが 50% ~ 300% 向上

    帯域幅集約型ネットワークモデル

  • 1 つ以上のマルチ GPU サーバーの高性能通信

    FP16 グラデーション圧縮と混合精度圧縮をサポート

  • MXNet 用 API 拡張

    InsightFace タイプのデータ並列処理とモデル並列処理をサポート

  • RDMA ネットワーク向けに最適化

    ハイブリッドリンク通信 (RDMA と VPC)

関連プロダクト

AIACC-Inference

Alibaba Cloud AIACC-Inference は、Alibaba Cloud 環境向けに最適化された AI アクセラレーターです。 GPU の使用率と推論のパフォーマンスを大幅に向上できます。 AIACC-Inference は 2 つの世界記録を樹立しています。DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低い推論レイテンシ
DAWNBench ImageNet コンペティション (スタンフォード大学が開催) で最も低い推論コスト

詳細を見る >

機能

  • 複数のフレームワークをサポート

    Tensorflow、Pytorch、MXNet、およびその他の深層学習フレームワークでは、Open Neural Network Exchange (ONNX) 形式でモデルをエクスポートして、推論のパフォーマンスを向上できます。

  • パフォーマンスが 30% ~ 400% 向上

    コンピューティング集約型ネットワークモデル

  • 複数のモデル精度をサポート

    FP32 と FP16 でモデルを最適化

関連プロダクト

GPU クラスターデプロイツール

Alibaba Cloud FastGPU は、数回のクリックでクラウド上に GPU コンピューティングリソースをデプロイできる、GPU クラスター向けの高速デプロイツール群です。 FastGPU はすぐに設定でき、どこでも簡単に使用できます。 FastGPU は、時間を節約し、費用対効果が高く、使いやすいソリューションで GPUクラスターの迅速なデプロイを実現します。

詳細を見る >

機能

  • すばやくデプロイ

    GPU クラスターでオフライントレーニングおよび推論スクリプトを迅速にデプロイするための API 操作

  • 簡単に管理

    GPU クラスターのステータスとライフサイクルを管理するコマンドラインツールを使用可能

  • 効率的で省時間

    Alibaba Cloud の IAAS レイヤーでは、コンピューティング、ストレージ、ネットワークのデプロイ操作を実行する必要はありません。 クラスターリソースを取得すると、適切な環境に自動的に設定されます。

関連プロダクト

コンテナー用 GPU 共有ソフトウェア

GPU リソースを分割して複数の分離されたコンテナーに割り当てることで、複数のコンテナーで単一の GPU を使用できます。 cGPU は、単一の GPU で複数のコンテナーを実行し、コンテナー間で GPU アプリケーションを分離できます。 GPU ハードウェアのリソース利用率を改善できます。

詳細を見る >

機能

  • GPU 分割

    GPUリソースを分割して GPU 使用率を改善

  • GPU 共有

    複数の AI アプリケーションでGPUを共有することによるコスト削減

  • 柔軟性

    コンピューティングパワーと GPU メモリを柔軟に分割してアプリケーションの要件を満足します。

Elastic GPU Service と自社管理 のGPU 高速化サーバーの比較

項目 Elastic GPU Service 自社管理の GPU 高速化サーバー
柔軟性
· 1 つ以上の GPU アクセラレーションインスタンスを簡単に作成可能
· インスタンスタイプのアップグレードやダウングレードなど、vCPU 数とメモリサイズの異なるインスタンスタイプ間のオンライン変更をサポート
· 帯域幅を調整可能
· サブスクリプション期間の延長が必要
· 設定を変更できない
· 調整できないアウトバウンド帯域幅の 1 回限りの購入が必要
使いやすさ
· オンライン管理のための Web ベースのコンソールを使用可能
· 主流オペレーティングシステム (ライセンス認証済みの純正 Windows オペレーティングシステムなど) を搭載し、オペレーティングシステムをオンラインで交換可能
· インスタンスの購入時に GPU ドライバーを購入およびインストール可能
· オンライン管理ツールを提供されないため、手動の管理とメンテナンスが必要
· オペレーティングシステムの用意、インストール、交換を自社で実施
· オペレーティングシステムの準備とインストールを自社で実施
ディザスタリカバリとバックアップ
· データごとに 3 つのコピーを格納。 1 つのコピーが破損しても、データをすばやく復元可能
· ハードウェア障害から自動ですばやく回復可能
· ディザスタリカバリ環境の主導による構築と、高価な従来のストレージデバイスの使用が必要
· 破損したデータは手動での修正が必要
コスト
· 課金方法はサブスクリプションと従量課金をサポート。 ビジネスニーズに基づいて適切な課金方法を選択可能
· 大規模な先行投資を行うことなく、オンデマンドのリソースを購入可能
· ピーク時の設定要件を満足するには、前払いでのリソース購入が必要
· 高額の先行投資が必要で、リソースの無駄が発生

シナリオ

業界をリードするソリューションと高性能

Alibaba Cloud Elastic GPU Service は、エンジニアリングシミュレーションと分析で高いパフォーマンス、スケーラビリティ、エンタープライズグレードの信頼性を実現する先進のソリューションを実現します。 大きな GPU メモリサイズと高い GPU パフォーマンスによる計算能力を活用して複雑なシミュレーションを実行し、困難な問題を解決できます。

メリット

  • 最適化されたソリューション

    CFD モデリングを活用して解決時間を大幅に短縮

  • 計算電磁気学の電子設計を高速化

    電磁性能をシミュレートし、電磁放射、干渉、伝送を予測することで、高性能な電子製品とコンポーネントの設計を支援します

  • エンジニアリングシミュレーション

    生産性を向上し、IT 予算を削減するクラウド上の仮想化アプリケーション

関連プロダクト

高品質表示のための HD ビデオ処理

ビデオ処理タスクでは、さまざまな問題 (大量のデータや長い処理時間など) が発生します。 GPU はタスクを並列に計算できるため、ビデオ処理の最適化に使用できます。 GPU は主に、大規模な高精細ビデオのトランスコード、4K および 8K ライブストリーミング、マルチユーザービデオ会議、ビデオソースの修復などの分野で使用されます。

メリット

  • ハイパフォーマンス

    最適化によりコンピューティングパフォーマンスを向上

  • 優れたコンピューティングパワー

    マルチフレームデータの高速処理と多数のコンピューティングタスクを処理するためのコンピューティングパワーをサポート

関連プロダクト

ハイパフォーマンスコンピューティング

GPUは、大規模な並列コンピューティングを必要とする科学コンピューティング (気象予測、炭化水素探査、分子動力学研究など) において重要な役割を果たします。 エラスティックコンピューティングと組み合わせて、GPU は大規模な浮動小数点演算に必要な計算能力を提供します。 オンラインとオフラインの両方で計算能力を利用できます。

メリット

  • 自動スケーリング

    ESS および SLB と統合して自動スケーリングを実装

  • 優れたコンピューティングパワー

    科学的コンピューティングにおける大規模なコンピューティング要件を満足するための最新の GPU と迅速なデプロイ方法

成功事例

最大の決め手は認識精度でした。Vision AI Platform は検証の初期段階からモザイク処理対象のナンバープレートを 90% 以上の精度で認識していました。

さらに細かなチューニングを施した結果、導入時には 95% を超える精度で認識・モザイク処理を自動で行えるようになりました。

– 株式会社IDOMフリマ事業部 フリママーケティングセクション セクションリーダー 内山 千章 氏

株式会社 IDOM (東京都千代田区) は国内最大級規模の車両流通データを取り扱う中古車の販売・買取事業を展開、昨今では、整備・板金・アフターサービスを充実させた超大型店を出店しています。

IDOM プラットフォームを使用すると、利用者は売りたい車の写真を自由にアップロードできますが、セルフサービスの制限や手動チェックや手直しによる労働時間の増加の問題に直面していました。 Alibaba Cloud は、高精度の画像認識技術と対面サポートを提供しています。

Ms-meta.HK は、Alibaba Cloud のソリューションを実装する際にさまざまなサービスを活用しました。 これらのサービス (Alibaba Cloud の現地の技術専門家および専任サポートチーム) により、メタバースサービスを容易に一般公開することができました。

Ms-meta.HK は、香港を拠点とするコミュニティ主導の分散型メタバースプロジェクトです。 Ms-meta.HK は、メタバースで Alibaba Cloud のクラウドレンダリングとトラフィック分散テクノロジーを積極的に活用しています。 Alibaba Cloud とのコラボレーションにより、メタバースの仮想シーンを最適化し、読み込み時間を短縮して、より優れたユーザーエクスペリエンスを提供しています。 さらに、Alibaba Cloud の堅牢なセキュリティサービスにより、公開サーバーを保護しています。 Ms-meta.HK は、Alibaba Cloud の支援により、メタバースインフラストラクチャサービスをさらに最適化したいと考えています。

ADVANCE では、コアビジネスの一環として、Alibaba Cloud のさまざまなクラウドネイティブのデータストレージと管理ソリューションを利用して AI および機械学習アルゴリズムのデータウェアハウスとデータ分析プロセスを管理しています。 たとえば、ADVANCE では、インメモリキャッシュと高速アクセスに ApsaraDB For Redis、柔軟な半構造化データストレージに ApsaraDB for MongoDB、さまざまなデータソース間のデータ集約、処理、ガバナンスに DataWorks、リアルタイムビッグデータ処理に Realtime Compute for Apache Flink を使用しています。

Advance Intelligence Group (ADVANCE) は、アジア太平洋地域の Al 主導のテクノロジー企業です。東南アジア (SEA) 市場、特にインドネシアでは大手の一角を占めています。

ADVANCE は、強化された AI サービスを顧客に提供することに取り組んでいます。 Alibaba Cloudは、革新的なクラウドインフラストラクチャサービスを通じた成功を達成するために、引き続き ADVANCE をサポートします。 AI とクラウドコンピューティングの組み合わせにより、より高い効率、生産性、デジタルセキュリティで、より多くの価値を顧客に提供します。

phone お問い合わせ