GPU云服务器

包含了GPU计算加速器的弹性计算实例,适用于人工智能(深度学习,机器学习等)、高性能计算、
专业图形图像处理等场景

全场景支持异构计算

阿里云GPU云服务器提供软件与硬件结合的完整服务体系,助力您在人工智能业务中实现资源的灵活分配、弹性扩展、算力的提升以及成本的控制,通常适用于深度学习,视频编解码,视频处理,科学计算,图形可视化,云游戏等场景。

阿里云GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。GPU在执行复杂的数学和几何计算方面有着独特的优势,特别是在浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。

多样化计算能力

拥有大量擅长处理大规模并发计算的算术逻辑单元(ALU),持续采用最新GPU加速芯片,提供FPGA, GPU, ASIC等多种加速卡,为AI,图形,转码,加密等不同业务提供服务。

简单易用

全球部署GPU资源充裕,分布广泛,逻辑控制单元相对简单,可以随时应对客户业务弹性扩容。 提供AIACC AI加速引擎,FastGPU套件,cGPU套件等专有的辅助工具。

高网络性能

采用神龙计算架构提升服务器性能降低IO延迟,最大支持2400万pps和64GbpsVPC网络及800G高带宽RDMA网络,能够支持多线程并行的高吞吐量运算。

为您提升计算效率的GPU软件

阿里云为您提供专有的辅助工具

神龙AI加速训练引擎

AIACC-Training是阿里云推出的神龙AI加速训练引擎,针对阿里云环境进行了深度优化,能够显著提升分布式训练效率,大幅提高网络带宽利用率。目前,AIACC-Training已创造两项世界纪录:
斯坦福Dawnbench Imagenet 训练速度最快
斯坦福Dawnbench Imagenet 训练成本最低

查看详情 >

能够提供

  • 支持四种主流框架

    Tensorflow, Pytorch, MXNet和Caffe四种分布式训练框架

  • 性能提升50%至300%

    适用于带宽密度的网络模型

  • 单机多卡/多机多卡间高性能通信

    支持FP16梯度压缩及混合精度压缩

  • MXNet的API扩展

    支持insightface类型的数据+模型并行

  • RDMA网络深度优化

    支持混合链路通信(RDMA+VPC)

推荐搭配使用

神龙AI加速推理引擎

AIACC-Inference是阿里云推出的神龙AI加速推理引擎,针对阿里云环境进行了深度优化,能够显著提升GPU利用率,大幅提高推理业务性能。目前,AIACC-Inference已创造两项世界纪录:
斯坦福Dawnbench Imagenet 推理延迟最低
斯坦福Dawnbench Imagenet 推理成本最低

查看详情 >

能够提供

  • 支持多个框架

    Tensorflow, Pytorch, MXNet及其它可导出ONNX模型的深度学习框架进行GPU推理优化

  • 性能提升30%至400%

    适用于计算密集的网络模型

  • 支持两种精度模型

    FP32和FP16两种精度的模型优化

推荐搭配使用

阿里云GPU实例集群极速部署工具

FastGPU是一套阿里云GPU实例集群极速部署工具,帮助您在阿里云上一键部署GPU计算资源,使其简单适配、一键部署、随处运行,为用户提供了省时、经济、便捷的阿里云GPU实例集群即刻构建方案。

查看详情 >

能够提供

  • 快速部署

    提供便捷的API将线下训练/推理脚本快速部署在阿里云GPU实例集群中

  • 便捷管理

    提供便捷的命令行工具用于管理阿里云GPU实例集群的运行状态和生命周期

  • 高效省时

    您无需进行阿里云IAAS层相关的计算、存储、网络等繁琐的部署操作,获取集群资源时自动获取相应环境

推荐搭配使用

阿里云容器共享GPU软件

一款在GPU上创建运行多个GPU容器,将GPU资源隔离,实现多个容器共享一张GPU的软件。cGPU可以实现在单张显卡上运行多个容器,并在多个容器间隔离GPU应用,提高GPU硬件资源利用率。

查看详情 >

能够提供

  • GPU切分

    划分GPU提升GPU利用率

  • 共享GPU

    多个AI应用共享GPU节约成本

  • 灵活匹配

    算力和显存灵活切分,满足应用需求

GPU云服务器与自建GPU服务器对比

对比项 GPU云服务器 GPU自建服务器
灵活性
・ 能够快速开通一台或多台GPU云服务器实例
・ 实例规格(vCPU和内存)支持灵活变更,并且支持在线升降配
・ 带宽升降自由
・ 服务器购买周期长
・ 服务器规格固定,无法灵活变更
・ 带宽一次性购买,无法自由升降
易用性
・ Web在线管理,简单方便
・ 内置主流的操作系统,Windows正版激活,且支持在线更换操作系统
・ GPU驱动可以在购买时一并安装,方便快捷
・ 没有在线管理工具,维护困难
・ 需您自备操作系统,自行安装及更换
・ GPU驱动需要自行购买安装
容灾备份
・ 三副本数据设计,单份损坏可在短时间内快速恢复
・ 硬件故障事故中可快速自动恢复
・ 您自行搭建,使用普通存储设备,价格高昂
・ 数据损坏需您自行修复
成本
・ 支持包年包月及按量付费两种购买方式,可灵活选择适合您业务场景的付费方式
・ 按需购买,无需一次性大量投入
・ 无法按需购买,必须为业务峰值满配
・ 一次性投入巨大,闲置浪费严重

应用场景

业内领先解决方案,超强性能

适用于工程模拟和分析的业内领先解决方案能够提供高性能、可扩展性及企业级可靠性。借助GPU超大显存容量和超强性能,利用所需计算能力执行复杂模拟并解决极具挑战性的问题。

能够解决

  • 优化的解决方案

    进行负责CFD建模,极大缩短解决时间

  • 加速计算电磁学的电子设计

    在设计高性能电子产品和组件时,模拟电磁性能,准确预测电磁辐射、干扰和信号传输

  • 工程模拟

    在云端,提升工作效率,并让IT部门节省预算开支的应用虚拟化

推荐搭配使用

高清视频处理,最佳展示

在视频处理领域同样存在计算量大,处理时间长的问题,而GPU因其计算任务高并行度,可以用于优化。目前GPU主要被用于大规模高清视频转码,4K/8K高清直播,多人视频会议、片源修复等领域

能够解决

  • 高性能

    优化程度高,提高计算性能

  • 强计算力

    快速处理多帧数据,提供处理大量计算任务的算力

推荐搭配使用

高性能计算

在气象预测、油气勘探、分子动力学等需要大规模并行计算的科学计算领域,GPU已在发挥强大的作用。通过提供大规模浮点运算的算力,与弹性计算完美结合,无论在线或离线均能提供高效的计算性能

能够解决

  • 弹性伸缩

    与ESS和SLB结合实现弹性扩容

  • 超强计算力

    提供最新型号GPU及最便捷的部署方法,满足科学计算的强大计算需求

客户案例

最重要的决定因素是识别准确度 - Vision AI 平台从验证过程的初期就以超过 90% 的准确度识别出要进行马赛克处理的车牌。

经过进一步的精细调整,系统在投入使用时能够自动进行识别和马赛克处理,准确度达到 95% 以上。

- IDOM 公司 Frima 分部 Frima 营销科科长 Chiaki Uchiyama 先生

IDOM Inc.(总部位于东京千代田区)经营一项二手车销售和收购业务,处理着日本最大规模的车辆分销数据,最近开设了超大型门店,提供高级维护、钣金和售后服务。

通过 IDOM 的平台,用户可以自由上传计划出售的车辆的照片,但也面临着自助服务的局限性以及由于人工检查和返工而增加工作时间的问题,阿里云可以帮助提供高度准确的图像识别技术和面对面的支持。

Ms-meta.HK 在解决方案实施中利用了阿里云的各种服务。在这些服务以及阿里云的本地技术专家和专门的支持团队的共同帮助下,Ms-meta.HK能够轻松地向公众推出元宇宙产品。

Ms-meta.HK是一个总部设在香港的分散、社区驱动的Metaverse项目。

Ms-meta.HK 在其元宇宙中积极利用阿里云的云渲染和流量分配技术。通过与阿里云合作,Ms-meta.HK 能够优化其元宇宙中的虚拟场景并缩短加载时间,为客户提供更好的用户体验。此外,该公司还能依靠阿里云强大的安全产品保护其公开的服务器。Ms-meta.HK 希望借助阿里云进一步优化元宇宙基础设施服务。

作为其核心业务的一部分,ADVANCE 利用阿里云提供的各种云原生数据存储和管理解决方案,管理其 AI 和机器学习算法的数据仓库和数据分析流程。例如,集团使用云数据库 Redis 版实现内存缓存和高速访问,使用云数据库 MongoDB 版灵活存储半结构化数据,使用 DataWorks 实现多数据源间的数据汇总、处理和治理,以及使用实时计算 Flink 版处理实时大数据。

Advance是亚太地区一家AI驱动的技术公司,是东南亚市场,尤其是印度尼西亚的顶级参与者之一。

ADVANCE致力于为客户提供增强的人工智能服务,阿里云将继续支持集团通过创新的云基础设施服务取得成功。人工智能和云计算的结合将以更高的效率、生产力和数字安全为客户带来更多价值。

phone 联系我们