全场景支持异构计算
阿里云GPU云服务器提供软件与硬件结合的完整服务体系,助力您在人工智能业务中实现资源的灵活分配、弹性扩展、算力的提升以及成本的控制,通常适用于深度学习,视频编解码,视频处理,科学计算,图形可视化,云游戏等场景。
阿里云GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。GPU在执行复杂的数学和几何计算方面有着独特的优势,特别是在浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。
多样化计算能力
拥有大量擅长处理大规模并发计算的算术逻辑单元(ALU),持续采用最新GPU加速芯片,提供FPGA, GPU, ASIC等多种加速卡,为AI,图形,转码,加密等不同业务提供服务。
简单易用
全球部署GPU资源充裕,分布广泛,逻辑控制单元相对简单,可以随时应对客户业务弹性扩容。 提供AIACC AI加速引擎,FastGPU套件,cGPU套件等专有的辅助工具。
高网络性能
采用神龙计算架构提升服务器性能降低IO延迟,最大支持2400万pps和64GbpsVPC网络及800G高带宽RDMA网络,能够支持多线程并行的高吞吐量运算。
为您提升计算效率的GPU软件
神龙AI加速训练引擎
AIACC-Training是阿里云推出的神龙AI加速训练引擎,针对阿里云环境进行了深度优化,能够显著提升分布式训练效率,大幅提高网络带宽利用率。目前,AIACC-Training已创造两项世界纪录:
斯坦福Dawnbench Imagenet 训练速度最快
斯坦福Dawnbench Imagenet 训练成本最低
查看详情 >
能够提供
-
支持四种主流框架
Tensorflow, Pytorch, MXNet和Caffe四种分布式训练框架
-
性能提升50%至300%
适用于带宽密度的网络模型
-
单机多卡/多机多卡间高性能通信
支持FP16梯度压缩及混合精度压缩
-
MXNet的API扩展
支持insightface类型的数据+模型并行
-
RDMA网络深度优化
支持混合链路通信(RDMA+VPC)
推荐搭配使用
神龙AI加速推理引擎
AIACC-Inference是阿里云推出的神龙AI加速推理引擎,针对阿里云环境进行了深度优化,能够显著提升GPU利用率,大幅提高推理业务性能。目前,AIACC-Inference已创造两项世界纪录:
斯坦福Dawnbench Imagenet 推理延迟最低
斯坦福Dawnbench Imagenet 推理成本最低
查看详情 >
能够提供
-
支持多个框架
Tensorflow, Pytorch, MXNet及其它可导出ONNX模型的深度学习框架进行GPU推理优化
-
性能提升30%至400%
适用于计算密集的网络模型
-
支持两种精度模型
FP32和FP16两种精度的模型优化
推荐搭配使用
GPU云服务器与自建GPU服务器对比
对比项 | GPU云服务器 | GPU自建服务器 |
---|---|---|
|
・ 能够快速开通一台或多台GPU云服务器实例 ・ 实例规格(vCPU和内存)支持灵活变更,并且支持在线升降配 ・ 带宽升降自由 |
・ 服务器购买周期长 ・ 服务器规格固定,无法灵活变更 ・ 带宽一次性购买,无法自由升降 |
|
・ Web在线管理,简单方便 ・ 内置主流的操作系统,Windows正版激活,且支持在线更换操作系统 ・ GPU驱动可以在购买时一并安装,方便快捷 |
・ 没有在线管理工具,维护困难 ・ 需您自备操作系统,自行安装及更换 ・ GPU驱动需要自行购买安装 |
|
・ 三副本数据设计,单份损坏可在短时间内快速恢复 ・ 硬件故障事故中可快速自动恢复 |
・ 您自行搭建,使用普通存储设备,价格高昂 ・ 数据损坏需您自行修复 |
|
・ 支持包年包月及按量付费两种购买方式,可灵活选择适合您业务场景的付费方式 ・ 按需购买,无需一次性大量投入 |
・ 无法按需购买,必须为业务峰值满配 ・ 一次性投入巨大,闲置浪费严重 |
应用场景
业内领先解决方案,超强性能
适用于工程模拟和分析的业内领先解决方案能够提供高性能、可扩展性及企业级可靠性。借助GPU超大显存容量和超强性能,利用所需计算能力执行复杂模拟并解决极具挑战性的问题。
能够解决
-
优化的解决方案
进行负责CFD建模,极大缩短解决时间
-
加速计算电磁学的电子设计
在设计高性能电子产品和组件时,模拟电磁性能,准确预测电磁辐射、干扰和信号传输
-
工程模拟
在云端,提升工作效率,并让IT部门节省预算开支的应用虚拟化
推荐搭配使用
高清视频处理,最佳展示
在视频处理领域同样存在计算量大,处理时间长的问题,而GPU因其计算任务高并行度,可以用于优化。目前GPU主要被用于大规模高清视频转码,4K/8K高清直播,多人视频会议、片源修复等领域
能够解决
-
高性能
优化程度高,提高计算性能
-
强计算力
快速处理多帧数据,提供处理大量计算任务的算力