全部產品
Search
文件中心

Elastic GPU Service:GPU計算型執行個體規格類型系列(gn/ebm/scc系列)

更新時間:Feb 12, 2026

GPU計算型執行個體具有高效能、高並行計算能力,適用於大規模並行計算情境,可以為您的業務提供更好的計算效能和效率。本文為您介紹Elastic Compute Service GPU計算型執行個體規格類型系列的特點,並列出了具體的執行個體規格。

背景資訊

在閱讀各個執行個體規格類型系列的特點及詳細指標之前,您需要提前學習以下資訊:

  • 瞭解執行個體規格命名及分類:協助您更好地理解執行個體規格類型系列的命名及分類資訊,瞭解各規格類型系列之間差異,詳參見執行個體規格分類與命名

  • 瞭解執行個體規格指標:提前瞭解執行個體規格的各項指標說明,請參見執行個體規格指標說明

  • 根據業務情境選擇執行個體規格類型系列:想擷取更多關於如何在實際業務情境中選擇合適的規格,請參見執行個體規格選型指導

在確定您要選擇的執行個體規格之後,您可能需要進一步瞭解以下資訊:

  • 查看執行個體可購買地區:各個地區下可供售賣的執行個體規格可能存在差異,執行個體的可購情況,您可以前往ECS執行個體可購買地區查看。

  • 預估執行個體費用:想瞭解執行個體在不同付費方式下大概的花費,可使用阿里雲的ECS價格計算機查看。

  • 直接購買執行個體:可直接前往ECS購買頁下單。

您可能還會關註:

  • 查看已停售的規格類型系列:如果在本頁面沒有找到您想要的執行個體規格類型系列,可前往已停售的規格類型系列群,詳情請參見已停售的執行個體規格

  • 執行個體規格的變更配置情況:想擷取某個執行個體規格是否支援變更配置到其他執行個體規格,由於可變更配置的執行個體規格之間有一定的限制,請參見規格變更限制與自檢

類型

相關連結

GPU計算型(gn系列)

ECS Bare Metal Instance

不推薦(如果該規格售罄,建議使用以上規格)

GPU計算型執行個體規格類型系列gn8v/gn8v-tee

該執行個體目前僅支援海外等部分地區,如有需求,請聯絡阿里雲銷售人員。

  • 規格類型系列介紹

    • gn8v:阿里雲針對AI模型訓練和超大參數量模型推理任務推出的第8代加速運算規格類型系列(GPU計算型執行個體規格類型系列),針對不同應用需求,為您提供1卡、2卡、4卡和8卡多種機型。

    • gn8v-tee:為了滿足您使用大模型進行模型訓練和推理的安全性要求,阿里雲基於gn8v推出一款具有機密計算特性的第8代執行個體規格類型系列。該執行個體在GPU計算過程中對資料進行加密,確保使用者資料的安全性。

  • 適用情境

    • 對於70 B以上的LLM模型,進行多卡並行推理計算時性價比較高。

    • 單個GPU提供39.5 TFLOPS FP32算力,在傳統AI模型訓練和自動駕駛訓練業務中效能突出。

    • 8卡之間支援NVLINK互聯,適用於中小模型訓練情境。

  • 產品特色及定位

    • 高速&大容量顯存:每個GPU配備了96 GB容量的HBM3顯存,且顯存頻寬可以達到4 TB/s,大幅加快了模型訓練和推理速度。

    • 高卡間頻寬:多個GPU卡之間通過900 GB/s NVLINK互聯,多卡訓練和推理的效率遠超過曆代GPU產品。

    • 大模型量化技術:支援FP8算力,對大規模參數訓練和推理過程的算力進行最佳化,大幅提升訓練和推理的計算速度,降低顯存佔用。

    • (僅限gn8v-tee系列產品)高安全性:支援CPU機密計算(Intel TDX)和GPU機密計算(NVIDIA CC)功能,閉環全鏈路模型推理的機密計算能力。對於模型推理和訓練的安全性,開啟機密計算能力保障使用者推理資料和企業模型的安全。

  • 計算

    • 採用最新的CIPU 1.0雲處理器。

      • 具有解耦計算和儲存能力,可以靈活選擇所需儲存資源。

      • 提供裸金屬能力,相對於傳統虛擬化執行個體,可以支援GPU執行個體之間的P2P通訊。

    • 採用Intel第4代Xeon可擴充處理器,全核睿頻可達3.1 GHz,基頻可達2.8 GHz。

  • 儲存

  • 網路

  • 安全:支援可信計算(vTPM)特性(僅gn8v支援,gn8v-tee不支援)。更多詳情,請參見可信計算能力概述

gn8v包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

彈性網卡

隊列數量(主)

單網卡私人IPv4地址數

單網卡IPv6地址數

最大支援雲端硬碟數量

雲端硬碟基礎IOPS

雲端硬碟基礎頻寬(GB/s)

ecs.gn8v.4xlarge

16

96

96GB * 1

12

8

16

30

30

17

10萬

0.75

ecs.gn8v.6xlarge

24

128

96GB * 1

15

8

24

30

30

17

12萬

0.937

ecs.gn8v-2x.8xlarge

32

192

96GB * 2

20

8

32

30

30

25

20萬

1.25

ecs.gn8v-4x.8xlarge

32

384

96GB * 4

20

8

32

30

30

25

20萬

1.25

ecs.gn8v-2x.12xlarge

48

256

96GB * 2

25

8

48

30

30

33

30萬

1.50

ecs.gn8v-8x.16xlarge

64

768

96GB * 8

32

8

64

30

30

33

36萬

2.5

ecs.gn8v-4x.24xlarge

96

512

96GB * 4

50

15

64

30

30

49

50萬

3

ecs.gn8v-8x.48xlarge

192

1024

96GB * 8

100

15

64

50

50

65

100萬

6

gn8v-tee包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

彈性網卡

隊列數量(主)

單網卡私人IPv4地址數

單網卡IPv6地址數

最大支援雲端硬碟數量

雲端硬碟基礎IOPS

雲端硬碟基礎頻寬(GB/s)

ecs.gn8v-tee.4xlarge

16

96

96GB * 1

12

8

16

30

30

17

10萬

0.75

ecs.gn8v-tee.6xlarge

24

128

96GB * 1

15

8

24

30

30

17

12萬

0.937

ecs.gn8v-tee-8x.16xlarge

64

768

96GB * 8

32

8

64

30

30

33

36萬

2.5

ecs.gn8v-tee-8x.48xlarge

192

1024

96GB * 8

100

15

64

50

50

65

100萬

6

說明

gn8v-tee規格類型系列當前僅支援Alibaba Cloud Linux 3鏡像。若使用基於Alibaba Cloud Linux 3構建的自訂鏡像建立執行個體,請確保其核心版本不低於5.10.134-18

GPU計算型執行個體規格類型系列gn8is

該執行個體目前僅支援海外等部分地區,如有需求,請聯絡阿里雲銷售人員。

  • 規格類型系列介紹:gn8is是阿里雲針對近期AI產生業務的發展推出的第8代加速運算規格類型系列(GPU計算型執行個體規格類型系列),針對不同應用需求,採用最新NVIDIA L20 GPU,為您提供1卡、2卡、4卡和8卡機型,以及不同CPU和GPU配比的執行個體規格。

  • 產品特色及定位

    • 圖形處理:該產品採用Intel第4代Xeon Scalable高主頻處理器,在3D建模情境中,為您提供足夠的CPU算力支撐,使得圖形的渲染和設計更加順暢。

    • 推理任務:採用全新NVIDIA L20,單卡配置48 GB顯存來加速推理任務,支援FP8浮點數格式,搭配ACK容器可靈活支援各類AIGC模型的推理,尤其適用於70 B以下LLM模型的推理任務。

  • 適用情境

    • 結合雲市場的GRID鏡像使用GRID驅動,啟動OpenGL和Direct3D圖形能力,提供工作站級圖形處理能力,適用於動漫、影視特效製作和渲染。

    • 結合ACK容器化管理能力,更高效、低成本地支撐AIGC圖形產生和LLM大模型推理。

    • 其他通用AI識別情境、Image Recognition、語音辨識等。

  • 計算

    • 採用全新NVIDIA L20企業級GPU。

      • 支援TensorRT等常用加速功能,支援FP8浮點數格式,提升模型推理效能。

      • 顯存容量提升至48 GB,多卡情況下,支援70 B及更大模型的單機推理。

      • 支援圖形處理能力,例如通過雲助手方式或選擇雲市場鏡像方式安裝GRID驅動後,圖形處理效能相對7代平台提升1倍。

    • NVIDIA L20主要參數:

      GPU架構

      GPU顯存

      計算效能

      視頻編解碼能力

      卡間互聯

      NVIDIA Ada Lovelace

      • 容量:48 GB

      • 頻寬:864GB/s

      • FP64: N/A

      • FP32: 59.3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 * Video Encoder(+AV1)

      • 3 * Video Decoder

      • 4 * JPEG Decoder

      • PCIe介面:PCIe Gen4 x16

      • 頻寬:64GB/s

    • 處理器:採用最新的Intel ® Xeon ®高主頻處理器,全核睿頻可達3.9 GHz,以應對更複雜的3D建模需求。

  • 儲存

  • 網路

  • 安全:支援可信計算(vTPM)特性。更多詳情,請參見可信計算能力概述

gn8is包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

彈性網卡

隊列數量(主)

單網卡私人IPv4地址數

單網卡IPv6地址數

最大支援雲端硬碟數量

雲端硬碟基礎IOPS

雲端硬碟基礎頻寬(GB/s)

ecs.gn8is.2xlarge

8

64

L20 * 1

48GB * 1

8

4

8

15

15

17

6萬

0.75

ecs.gn8is.4xlarge

16

128

L20 * 1

48GB * 1

16

8

16

30

30

17

12萬

1.25

ecs.gn8is-2x.8xlarge

32

256

L20 * 2

48GB * 2

32

8

32

30

30

33

25萬

2

ecs.gn8is-4x.16xlarge

64

512

L20 * 4

48GB * 4

64

8

64

30

30

33

45萬

4

ecs.gn8is-8x.32xlarge

128

1024

L20 * 8

48GB * 8

100

15

64

50

50

65

90萬

8

GPU計算型執行個體規格類型系列gn7e

gn7e的特點如下:

  • 規格類型系列介紹

    • 您可以根據需要選擇不同數量的卡和不同CPU資源的規格,靈活適應其不同的AI業務需求。

    • 依託第三代神龍架構,VPC和雲端硬碟網路頻寬相比上一代平均提升一倍。

  • 適用情境

    • 中小規模的AI訓練業務。

    • 使用CUDA進行加速的HPC業務。

    • 對GPU處理能力或顯存容量需求較高的AI推理業務。

    • 深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練應用。

    • 高GPU負載的科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。

    重要

    在使用高通訊負載的AI訓練業務如Transformer等模型時,務必啟用NVLink進行GPU間的資料通訊,否則可能由於PCIe鏈路大規模資料轉送引起非預期的故障,導致資料受損。如不確定您使用的訓練通訊鏈路拓撲,請提交工單由阿里雲技術專家為您提供支援人員。

  • 儲存

  • 網路

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與執行個體規格對應,規格越高網路效能越強。

gn7e包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.gn7e-c16g1.4xlarge

16

125

80GB * 1

8

300萬

8

8

10

1

ecs.gn7e-c16g1.8xlarge

32

250

80GB * 2

16

600萬

16

8

10

1

ecs.gn7e-c16g1.16xlarge

64

500

80GB * 4

32

1200萬

32

8

10

1

ecs.gn7e-c16g1.32xlarge

128

1000

80GB * 8

64

2400萬

32

16

15

1

GPU計算型執行個體規格類型系列gn7i

  • 規格類型系列介紹:依託第三代神龍架構,提供穩定可預期的超高效能。同時通過晶片快速路徑加速手段,完成儲存、網路效能以及計算穩定性的數量級提升。

  • 適用情境

    • 配備高效能CPU、記憶體、GPU,可以處理更多並發AI推理任務,適用於Image Recognition、語音辨識、行為識別業務。

    • 支援RTX功能,搭配高主頻CPU,提供高效能的3D圖形虛擬化能力,適用於遠程圖形設計、雲遊戲等高強度圖形處理業務。

  • 計算

    • 採用NVIDIA A10 GPU卡。

      • 創新的Ampere架構。

      • 支援RTX、TensorRT等常用加速功能。

    • 處理器:2.9 GHz主頻的Intel ® Xeon ® 可擴充處理器(Ice Lake),全核睿頻3.5 GHz。

    • 最大可提供752 GiB記憶體,相比gn6i大幅提升。

  • 儲存

  • 網路

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與執行個體規格對應,規格越高網路效能越強。

gn7i包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.gn7i-c8g1.2xlarge

8

30

NVIDIA A10 * 1

24GB * 1

16

160萬

8

4

15

15

ecs.gn7i-c16g1.4xlarge

16

60

NVIDIA A10 * 1

24GB * 1

16

300萬

8

8

30

30

ecs.gn7i-c32g1.8xlarge

32

188

NVIDIA A10 * 1

24GB * 1

16

600萬

12

8

30

30

ecs.gn7i-c32g1.16xlarge

64

376

NVIDIA A10 * 2

24GB * 2

32

1200萬

16

15

30

30

ecs.gn7i-c32g1.32xlarge

128

752

NVIDIA A10 * 4

24GB * 4

64

2400萬

32

15

30

30

ecs.gn7i-c48g1.12xlarge

48

310

NVIDIA A10 * 1

24GB * 1

16

900萬

16

8

30

30

ecs.gn7i-c56g1.14xlarge

56

346

NVIDIA A10 * 1

24GB * 1

16

1000萬

16

8

30

30

ecs.gn7i-2x.8xlarge

32

128

NVIDIA A10 * 2

24GB * 2

16

600萬

16

8

30

30

ecs.gn7i-4x.8xlarge

32

128

NVIDIA A10 * 4

24GB * 4

32

600萬

16

8

30

30

ecs.gn7i-4x.16xlarge

64

256

NVIDIA A10 * 4

24GB * 4

64

1200萬

32

8

30

30

ecs.gn7i-8x.32xlarge

128

512

NVIDIA A10 * 8

24GB * 8

64

2400萬

32

16

30

30

ecs.gn7i-8x.16xlarge

64

256

NVIDIA A10 * 8

24GB * 8

32

1200萬

32

8

30

30

重要

ecs.gn7i-2x.8xlarge、ecs.gn7i-4x.8xlarge、ecs.gn7i-4x.16xlarge、ecs.gn7i-8x.32xlarge以及ecs.gn7i-8x.16xlarge執行個體規格支援更改為ecs.gn7i-c8g1.2xlarge或ecs.gn7i-c16g1.4xlarge執行個體規格,但不支援更改為ecs.gn7i-c32g1.8xlarge等其他執行個體規格。

GPU計算型執行個體規格類型系列gn7s

如需使用gn7s,請提交工單申請。

  • 規格類型系列介紹

    • 採用全新的Intel IceLake處理器,同時搭載Nvidia Ampere架構的NVIDIA A30 GPU卡,您可以根據需要選擇不同GPU卡數和不同CPU資源的規格,靈活適應不同的AI業務需求。

    • 基於阿里雲全新的第三代神龍架構,VPC和雲端硬碟網路頻寬相比上一代平均提升一倍。

  • 適用情境:配備高效能CPU、記憶體、GPU,可以處理更多並發AI推理業務需求,適用於Image Recognition、語音辨識、行為識別業務。

  • 計算

    • 採用NVIDIA A30 GPU卡。

      • 創新的Nvidia Ampere架構。

      • 支援MIG(Multi-Instance GPU)功能、加速功能(基於第二代Tensor Cores加速),提供多種業務支援。

    • 處理器:2.9 GHz主頻的Intel ® Xeon ® 可擴充處理器(Ice Lake),全核睿頻3.5 GHz。

    • 容量記憶體相比上一代執行個體規格類型系列大幅提升。

  • 儲存

  • 網路

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與執行個體規格對應,規格越高網路效能越強。

gn7s包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

單網卡私人IPv4地址數

單網卡IPv6地址數

多隊列

彈性網卡

ecs.gn7s-c8g1.2xlarge

8

60

NVIDIA A30 * 1

24GB * 1

16

160萬

5

1

8

4

ecs.gn7s-c16g1.4xlarge

16

120

NVIDIA A30 * 1

24GB * 1

16

300萬

5

1

8

8

ecs.gn7s-c32g1.8xlarge

32

250

NVIDIA A30 * 1

24GB * 1

16

600萬

5

1

12

8

ecs.gn7s-c32g1.16xlarge

64

500

NVIDIA A30 * 2

24GB * 2

32

1200萬

5

1

16

15

ecs.gn7s-c32g1.32xlarge

128

1000

NVIDIA A30 * 4

24GB * 4

64

2400萬

10

1

32

15

ecs.gn7s-c48g1.12xlarge

48

380

NVIDIA A30 * 1

24GB * 1

16

900萬

8

1

16

8

ecs.gn7s-c56g1.14xlarge

56

440

NVIDIA A30 * 1

24GB * 1

16

1000萬

8

1

16

8

GPU計算型執行個體規格類型系列gn7

  • 適用情境

    • 深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練應用。

    • 高GPU負載的科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。

gn7包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.gn7-c12g1.3xlarge

12

94

40GB * 1

4

250萬

4

8

10

1

ecs.gn7-c13g1.13xlarge

52

378

40GB * 4

16

900萬

16

8

30

30

ecs.gn7-c13g1.26xlarge

104

756

40GB * 8

30

1800萬

16

15

10

1

GPU計算型執行個體規格類型系列gn6i

  • 適用情境

    • AI(DL和ML)推理,適合電腦視覺、語音辨識、語音合成、NLP、機器翻譯、推薦系統。

    • 雲遊戲雲端即時渲染。

    • AR和VR的雲端即時渲染。

    • 重載圖形計算或圖形工作站。

    • GPU加速資料庫。

    • 高效能運算。

  • 計算

    • GPU加速器:T4。

      • 創新的Turing架構。

      • 單GPU顯存16 GB(GPU顯存頻寬320 GB/s)。

      • 單GPU 2560個CUDA Cores。

      • 單GPU多達320個Turing Tensor Cores。

      • 可變精度Tensor Cores支援65 TFLOPS FP16、130 INT8 TOPS以及260 INT4 TOPS。

    • 處理器與記憶體配比約為1:4。

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。

  • 儲存

  • 網路

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與執行個體規格對應,規格越高網路效能越強。

gn6i包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

雲端硬碟基礎IOPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.gn6i-c4g1.xlarge

4

15

NVIDIA T4 * 1

16GB * 1

4

250萬

2

2

10

1

ecs.gn6i-c8g1.2xlarge

8

31

NVIDIA T4 * 1

16GB * 1

5

250萬

2

2

10

1

ecs.gn6i-c16g1.4xlarge

16

62

NVIDIA T4 * 1

16GB * 1

6

250萬

4

3

10

1

ecs.gn6i-c24g1.6xlarge

24

93

NVIDIA T4 * 1

16GB * 1

7.5

250萬

6

4

10

1

ecs.gn6i-c40g1.10xlarge

40

155

NVIDIA T4 * 1

16GB * 1

10

160萬

16

10

10

1

ecs.gn6i-c24g1.12xlarge

48

186

NVIDIA T4 * 2

16GB * 2

15

450萬

12

6

10

1

ecs.gn6i-c24g1.24xlarge

96

372

NVIDIA T4 * 4

16GB * 4

30

450萬

25萬

24

8

10

1

GPU計算型執行個體規格類型系列gn6e

  • 適用情境

    • 深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練、推理應用。

    • 科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。

  • 計算

    • 採用NVIDIA V100(32 GB NVLink)GPU卡。

    • GPU加速器:V100(SXM2封裝)。

      • 創新的Volta架構。

      • 單GPU顯存32 GB HBM2(GPU顯存頻寬900 GB/s)。

      • 單GPU 5120個CUDA Cores。

      • 單GPU 640個Tensor Cores。

      • 單GPU支援6個NVLink鏈路(NVLink屬於雙向鏈路),單向鏈路的頻寬為25 Gbit/s,總頻寬為6×25×2=300 Gbit/s。

    • 處理器與記憶體配比約為1:8。

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。

  • 儲存

  • 網路

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與執行個體規格對應,規格越高網路效能越強。

gn6e包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.gn6e-c12g1.3xlarge

12

92

NVIDIA V100 * 1

32GB * 1

5

80萬

8

6

10

1

ecs.gn6e-c12g1.6xlarge

24

184

NVIDIA V100 * 2

32GB * 2

8

120萬

8

8

20

1

ecs.gn6e-c12g1.12xlarge

48

368

NVIDIA V100 * 4

32GB * 4

16

240萬

8

8

20

1

ecs.gn6e-c12g1.24xlarge

96

736

NVIDIA V100 * 8

32GB * 8

32

450萬

16

8

20

1

GPU計算型執行個體規格類型系列gn6v

  • 適用情境

    • 深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練、推理應用。

    • 科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。

  • 計算

    • 採用NVIDIA V100 GPU卡。

    • GPU加速器:V100(SXM2封裝) 。

      • 創新的Volta架構。

      • 單GPU顯存16 GB HBM2(GPU顯存頻寬900 GB/s)。

      • 單GPU 5120個CUDA Cores。

      • 單GPU 640個Tensor Cores。

      • 單GPU支援6個NVLink鏈路(NVLink屬於雙向鏈路),單向鏈路的頻寬為25 Git/s,總頻寬為6×25×2=300 Git/s。

    • 處理器與記憶體配比約為1:4。

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。

  • 儲存

  • 網路

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與執行個體規格對應,規格越高網路效能越強。

gn6v包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

雲端硬碟基礎IOPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.gn6v-c8g1.2xlarge

8

32

NVIDIA V100 * 1

16GB * 1

2.5

80萬

4

4

10

1

ecs.gn6v-c8g1.4xlarge

16

64

NVIDIA V100 * 2

16GB * 2

5

100萬

4

8

20

1

ecs.gn6v-c8g1.8xlarge

32

128

NVIDIA V100 * 4

16GB * 4

10

200萬

8

8

20

1

ecs.gn6v-c8g1.16xlarge

64

256

NVIDIA V100 * 8

16GB * 8

20

250萬

16

8

20

1

ecs.gn6v-c10g1.20xlarge

82

336

NVIDIA V100 * 8

16GB * 8

35

450萬

25萬

16

8

20

1

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn9g

重要

ebmgn9g正在邀測中,如需使用,請提交工單申請。

  • 規格類型系列介紹:ebmgn9g是阿里雲推出的第9代全功能高性價比GPU裸金屬執行個體。採用最新一代CIPU2.0提供雲端服務能力,搭配高主頻CPU,大容量記憶體和全新Blackwell架構專業顯卡,為自動駕駛/具身智能訓練,大模型推理,影視動漫渲染,元宇宙/雲遊戲服務等各類GPU加速情境提供高性價比的GPU雲端服務能力。

  • 適用情境及產品特色:

    • 自動駕駛/具身智能:
      提供256vCPU,CPU全核最高工作於4.2GHz以上,搭配2.3T大容量記憶體,支撐自動駕駛/具身智能訓練中的資料處理業務需求。

    • 搜尋推薦:
      搭配的Blackwell GPU提供137T高效能TF32算力,平均每張GPU搭配32vCPU和153GB/s記憶體頻寬,為搜尋,廣告業務提供最佳的配置組合。

    • 大模型推理:
      全新一代GPU提供超越8代的全新算力,顯存頻寬提升至1344GB/s,新支援FP4算力全面提升推理效能和性價比。8張GPU基於PCIe Gen5互聯,頻寬達到128GB/s,多卡並行推理效率大大提升。

    • 雲遊戲/渲染/元宇宙:
      CPU最高可達5GHz高主頻,是3D建模的頂級選擇,GPU原生支援圖形能力,提供通過專業設計認證的工作站級圖形驅動,支援OpenGL全功能加速,是高端影視動漫開發,CAD設計的最優選擇。

  • 採用最新的CIPU 2.0雲處理器:

    第2代CIPU提供更高的雲處理算力,提供更強的eRDMA,VPC,EBS組件算力。裸金屬執行個體可直接存取實體資源,或者需要License綁定硬體等要求的工作負載。支援容器(包括但不限於Docker、Clear Container、Pouch等)。

  • 計算:

    • 採用全新Blackwell架構專業顯卡:

      • 支援OpenGL 專業級圖形處理功能

      • 支援RTX、TensorRT等常用加速功能,全新升級支援FP4和PCIe Gen5互聯。

      • 採用PCIe Switch互聯,相比直連CPU方案,其NCCL效能提升36%,多卡分區大模型推理時,效能最大提升9%。

    • GPU主要參數:

      GPU架構

      GPU顯存

      計算效能

      視頻編解碼能力

      卡間互聯

      加速APIs

      Blackwell

      • 容量:48 GB

      • 頻寬:1344GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 533 TFLOPS

      • FP4: 970 TFLOPS

      • RT core: 196 TFLOPS

      • 3 * Video Encoder

      • 3 * Video Decoder

      • PCIe Gen5 x16: 128GB/s

      • 支援P2P

      支援DX12、

      OpenGL4.6、Vulkan1.3、CUDA12.8、Open CL3.0、DirectCompute

    • 處理器:3.3GHz-5GHz主頻的 AMD Turin-C 處理器(SPR),全核最高可達4.2GHz。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,3000萬PPS網路收發包能力。

    • 支援ERI(Elastic RDMA Interface),可以在VPC網路下實現RDMA直通加速互聯,將頻寬提升至360 Gbit/s,可用於自動駕駛,具身智能,CV和傳統模型的訓練業務。

      說明

      關於ERI的使用說明,請參見在企業級執行個體上啟用eRDMA

ebmgn9g包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

單網卡私人IPv4地址數

單網卡IPv6地址數

多隊列(主網卡/輔助網卡)

彈性網卡

最大掛載資料盤數

雲端硬碟最大頻寬(GB/s)

ecs.ebmgn9g.64xlarge

256

2304

48GB * 8

360(180 * 2)

3000萬

30

30

64/16

38

33

8

說明

ebmgn9g執行個體規格所使用的鏡像啟動模式必須為UEFI模式。如果您需要使用自訂鏡像,請確保該自訂鏡像支援UEFI啟動模式,並且鏡像的啟動模式屬性已設定為UEFI模式。具體操作,請參見執行個體啟動模式

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn9ge

重要

ebmgn9ge正在邀測中,如需使用,請提交工單申請。

  • 規格類型系列介紹:ebmgn9ge是阿里雲推出的第9代全功能高性價比GPU裸金屬執行個體。採用最新一代CIPU2.0提供雲端服務能力,搭配高主頻CPU,大容量記憶體和全新Blackwell架構專業顯卡,為自動駕駛/具身智能訓練,大模型推理,影視動漫渲染,元宇宙/雲遊戲服務等各類GPU加速情境提供高性價比的GPU雲端服務能力。

  • 適用情境及產品特色:

    • 自動駕駛/具身智能:
      提供256vCPU,CPU全核最高工作於4.2GHz以上,搭配2.3T大容量記憶體,支撐自動駕駛/具身智能訓練中的資料處理業務需求。

    • 搜尋推薦:
      搭配的Blackwell GPU提供137T高效能TF32算力,平均每張GPU搭配32vCPU和153GB/s記憶體頻寬,為搜尋,廣告業務提供最佳的配置組合。

    • 大模型推理:

      ebmgn9ge專為大語言模型提供單卡72G大顯存算力,同時顯存頻寬達到1344GB/s,為LLM情境提供高效能推理算力,配合全新FP4計算架構,和128GB/s的第5代PCIe頻寬,可以支援8卡並行671B以上的大模型推理。

    • 雲遊戲/渲染/元宇宙:
      CPU最高可達5GHz高主頻,是3D建模的頂級選擇,GPU原生支援圖形能力,提供通過專業設計認證的工作站級圖形驅動,支援OpenGL全功能加速,是高端影視動漫開發,CAD設計的最優選擇。

  • 採用最新的CIPU 2.0雲處理器:

    第2代CIPU提供更高的雲處理算力,提供更強的eRDMA、VPC、EBS組件算力。裸金屬執行個體可直接存取實體資源,或者需要License綁定硬體等要求的工作負載。支援容器(包括但不限於Docker、Clear Container、Pouch等)。

  • 計算:

    • 採用全新Blackwell架構專業顯卡:

      • 支援OpenGL 專業級圖形處理功能

      • 支援RTX、TensorRT等常用加速功能,全新升級支援FP4和PCIe Gen5互聯。

      • 採用PCIe Switch互聯,相比直連CPU方案,其NCCL效能提升36%,多卡分區大模型推理時,效能最大提升9%。

    • GPU主要參數:

      GPU架構

      GPU顯存

      計算效能

      視頻編解碼能力

      卡間互聯

      加速APIs

      Blackwell

      • 容量:72 GB

      • 頻寬:1344GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 533 TFLOPS

      • FP4: 970 TFLOPS

      • RT core: 196 TFLOPS

      • 3 * Video Encoder

      • 3 * Video Decoder

      • PCIe Gen5 x16: 128GB/s

      • 支援P2P

      支援DX12、

      OpenGL4.6、Vulkan1.3、CUDA12.8、Open CL3.0、DirectCompute

    • 處理器:3.3GHz-5GHz主頻的 AMD Turin-C 處理器(SPR),全核最高可達4.2GHz。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,3000萬PPS網路收發包能力。

    • 支援ERI(Elastic RDMA Interface),可以在VPC網路下實現RDMA直通加速互聯,將頻寬提升至360 Gbit/s,可用於自動駕駛,具身智能,CV和傳統模型的訓練業務。

      說明

      關於ERI的使用說明,請參見在企業級執行個體上啟用eRDMA

ebmgn9ge包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

單網卡私人IPv4地址數

單網卡IPv6地址數

多隊列(主網卡/輔助網卡)

彈性網卡

最大掛載資料盤數

雲端硬碟最大頻寬(GB/s)

ecs.ebmgn9ge.64xlarge

256

2304

72GB * 8

360(180 * 2)

3000萬

30

30

64/16

38

33

8

說明

ebmgn9ge執行個體規格所使用的鏡像啟動模式必須為UEFI模式。如果您需要使用自訂鏡像,請確保該自訂鏡像支援UEFI啟動模式,並且鏡像的啟動模式屬性已設定為UEFI模式。具體操作,請參見執行個體啟動模式

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn9gc

重要

ebmgn9gc正在邀測中,如需使用,請提交工單申請。

  • 規格類型系列介紹:ebmgn9gc是阿里雲推出的第9代全功能高性價比GPU裸金屬執行個體。採用最新一代CIPU2.0提供雲端服務能力,搭配高主頻CPU,大容量記憶體和全新Blackwell架構專業顯卡,為自動駕駛/具身智能訓練,大模型推理,影視動漫渲染,元宇宙/雲遊戲服務等各類GPU加速情境提供高性價比的GPU雲端服務能力。

  • 適用情境及產品特色:

    • 自動駕駛/具身智能:
      提供256vCPU,CPU全核最高工作於4.2GHz以上,搭配2.3T大容量記憶體,支撐自動駕駛/具身智能訓練中的資料處理業務需求。

    • 搜尋推薦:
      搭配的Blackwell GPU提供137T高效能TF32算力,平均每張GPU搭配32vCPU和153GB/s記憶體頻寬,為搜尋,廣告業務提供最佳的配置組合。

    • 大模型推理:

      ebmgn9gc專為大語言模型提供單卡72G大顯存算力,同時顯存頻寬達到1344GB/s,為LLM情境提供高效能推理算力,配合全新FP4計算架構,和128GB/s的第5代PCIe頻寬,可以支援8卡並行671B以上的大模型推理。

    • 雲遊戲/渲染/元宇宙:
      CPU最高可達5GHz高主頻,是3D建模的頂級選擇,GPU原生支援圖形能力,提供通過專業設計認證的工作站級圖形驅動,支援OpenGL全功能加速,是高端影視動漫開發,CAD設計的最優選擇。

  • 採用最新的CIPU 2.0雲處理器:

    第2代CIPU提供更高的雲處理算力,提供更強的eRDMA、VPC、EBS組件算力。裸金屬執行個體可直接存取實體資源,或者需要License綁定硬體等要求的工作負載。支援容器(包括但不限於Docker、Clear Container、Pouch等)。

  • 計算:

    • 採用全新Blackwell架構專業顯卡:

      • 支援OpenGL 專業級圖形處理功能

      • 支援RTX、TensorRT等常用加速功能,全新升級支援FP4和PCIe Gen5互聯。

      • 採用PCIe Switch互聯,相比直連CPU方案,其NCCL效能提升36%,多卡分區大模型推理時,效能最大提升9%。

    • GPU主要參數:

      GPU架構

      GPU顯存

      計算效能

      視頻編解碼能力

      卡間互聯

      加速APIs

      Blackwell

      • 容量:72 GB

      • 頻寬:1344GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 533 TFLOPS

      • FP4: 970 TFLOPS

      • RT core: 196 TFLOPS

      • 3 * Video Encoder

      • 3 * Video Decoder

      • PCIe Gen5 x16: 128GB/s

      • 支援P2P

      支援DX12、

      OpenGL4.6、Vulkan1.3、CUDA12.8、Open CL3.0、DirectCompute

    • 處理器:3.3GHz-5GHz主頻的 AMD Turin-C 處理器(SPR),全核最高可達4.2GHz。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,3000萬PPS網路收發包能力。

    • 支援ERI(Elastic RDMA Interface),可以在VPC網路下實現RDMA直通加速互聯,將頻寬提升至360 Gbit/s,可用於自動駕駛,具身智能,CV和傳統模型的訓練業務。

      說明

      關於ERI的使用說明,請參見在企業級執行個體上啟用eRDMA

ebmgn9gc包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

單網卡私人IPv4地址數

單網卡IPv6地址數

多隊列(主網卡/輔助網卡)

彈性網卡

最大掛載資料盤數

雲端硬碟最大頻寬(GB/s)

ecs.ebmgn9gc.64xlarge

256

1536

72GB * 8

360(180 * 2)

3000萬

30

30

64/16

38

33

8

說明

ebmgn9gc執行個體規格所使用的鏡像啟動模式必須為UEFI模式。如果您需要使用自訂鏡像,請確保該自訂鏡像支援UEFI啟動模式,並且鏡像的啟動模式屬性已設定為UEFI模式。具體操作,請參見執行個體啟動模式

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn9gc

重要

ebmgn9gc正在邀測中,如需使用,請提交工單申請。

  • 規格類型系列介紹:ebmgn9gc是阿里雲推出的第9代全功能高性價比GPU裸金屬執行個體。採用最新一代CIPU2.0提供雲端服務能力,搭配高主頻CPU,大容量記憶體和全新Blackwell架構專業顯卡,為自動駕駛/具身智能訓練,大模型推理,影視動漫渲染,元宇宙/雲遊戲服務等各類GPU加速情境提供高性價比的GPU雲端服務能力。

  • 適用情境及產品特色:

    • 自動駕駛/具身智能:
      提供256vCPU,CPU全核最高工作於4.2GHz以上,搭配2.3T大容量記憶體,支撐自動駕駛/具身智能訓練中的資料處理業務需求。

    • 搜尋推薦:
      搭配的Blackwell GPU提供137T高效能TF32算力,平均每張GPU搭配32vCPU和153GB/s記憶體頻寬,為搜尋,廣告業務提供最佳的配置組合。

    • 大模型推理:

      ebmgn9gc專為大語言模型提供單卡72G大顯存算力,同時顯存頻寬達到1344GB/s,為LLM情境提供高效能推理算力,配合全新FP4計算架構,和128GB/s的第5代PCIe頻寬,可以支援8卡並行671B以上的大模型推理。

    • 雲遊戲/渲染/元宇宙:
      CPU最高可達5GHz高主頻,是3D建模的頂級選擇,GPU原生支援圖形能力,提供通過專業設計認證的工作站級圖形驅動,支援OpenGL全功能加速,是高端影視動漫開發,CAD設計的最優選擇。

  • 採用最新的CIPU 2.0雲處理器:

    第2代CIPU提供更高的雲處理算力,提供更強的eRDMA、VPC、EBS組件算力。裸金屬執行個體可直接存取實體資源,或者需要License綁定硬體等要求的工作負載。支援容器(包括但不限於Docker、Clear Container、Pouch等)。

  • 計算:

    • 採用全新Blackwell架構專業顯卡:

      • 支援OpenGL 專業級圖形處理功能

      • 支援RTX、TensorRT等常用加速功能,全新升級支援FP4和PCIe Gen5互聯。

      • 採用PCIe Switch互聯,相比直連CPU方案,其NCCL效能提升36%,多卡分區大模型推理時,效能最大提升9%。

    • GPU主要參數:

      GPU架構

      GPU顯存

      計算效能

      視頻編解碼能力

      卡間互聯

      加速APIs

      Blackwell

      • 容量:72 GB

      • 頻寬:1344GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 533 TFLOPS

      • FP4: 970 TFLOPS

      • RT core: 196 TFLOPS

      • 3 * Video Encoder

      • 3 * Video Decoder

      • PCIe Gen5 x16: 128GB/s

      • 支援P2P

      支援DX12、

      OpenGL4.6、Vulkan1.3、CUDA12.8、Open CL3.0、DirectCompute

    • 處理器:3.3GHz-5GHz主頻的 AMD Turin-C 處理器(SPR),全核最高可達4.2GHz。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,3000萬PPS網路收發包能力。

    • 支援ERI(Elastic RDMA Interface),可以在VPC網路下實現RDMA直通加速互聯,將頻寬提升至360 Gbit/s,可用於自動駕駛,具身智能,CV和傳統模型的訓練業務。

      說明

      關於ERI的使用說明,請參見在企業級執行個體上啟用eRDMA

ebmgn9gc包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

單網卡私人IPv4地址數

單網卡IPv6地址數

多隊列(主網卡/輔助網卡)

彈性網卡

最大掛載資料盤數

雲端硬碟最大頻寬(GB/s)

ecs.ebmgn9gc.64xlarge

256

1536

72GB * 8

360(180 * 2)

3000萬

30

30

64/16

38

33

8

說明

ebmgn9gc執行個體規格所使用的鏡像啟動模式必須為UEFI模式。如果您需要使用自訂鏡像,請確保該自訂鏡像支援UEFI啟動模式,並且鏡像的啟動模式屬性已設定為UEFI模式。具體操作,請參見執行個體啟動模式

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn8v

該執行個體目前僅支援海外等部分地區,如有需求,請聯絡阿里雲銷售人員。

  • 規格類型系列介紹:ebmgn8v是阿里雲為AI模型訓練和超大參數量模型推出的第8代加速運算規格類型系列(彈性裸金屬執行個體規格類型系列),每個執行個體是1台採用了8個GPU卡裸金屬主機。

  • 適用情境

    • 對於70 B以上的LLM模型,進行多卡並行推理計算時性價比較高。

    • 單個GPU提供39.5 TFLOPS FP32算力,在傳統AI模型訓練和自動駕駛訓練業務中效能突出。

    • 8卡之間支援NVLINK互聯,適用於中小模型訓練情境。

  • 產品特色及定位:

    • 高速&大容量顯存:每個GPU配備了96 GB容量的HBM3顯存,顯存頻寬達到4 TB/s,大幅加快了模型訓練和推理速度。

    • 高卡間頻寬:多GPU卡之間通過900 GB/s NVLINK互聯,多卡訓練和推理的效率遠超過曆代GPU產品。

    • 大模型量化技術:支援FP8算力,對大規模參數訓練和推理過程的算力進行最佳化,大幅提升訓練和推理的計算速度,降低顯存佔用。

  • 計算

    • 採用最新的CIPU 1.0雲處理器:

      • 具有解耦計算和儲存能力,可以靈活選擇所需儲存資源。相對於第七代GPU執行個體,該執行個體規格的機器間頻寬提升至160 Gbit/s,可以更快地完成資料轉送和處理。

      • CIPU提供裸金屬能力,相對於傳統虛擬化執行個體,可以支援GPU執行個體之間的P2P通訊。

    • 採用Intel第4代Xeon可擴充處理,提供192個vCPU,全核睿頻可達3.1 GHz。

  • 儲存

  • 網路

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,3000萬PPS網路收發包能力。

    • 支援ERI(Elastic RDMA Interface),可以在VPC網路下實現RDMA直通加速互聯,將頻寬提升至160 Gbit/s,可用於CV和傳統模型的訓練業務。

      說明

      關於ERI的使用說明,請參見在企業級執行個體上啟用eRDMA

ebmgn8v包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

單網卡私人IPv4地址數

單網卡IPv6地址數

多隊列(主網卡&輔助網卡)

彈性網卡

最大掛載資料盤數

雲端硬碟最大頻寬(GB/s)

ecs.ebmgn8v.48xlarge

192

1024

96GB*8

170(85 * 2)

3000萬

30

30

64

32

31

6

說明

ebmgn8V執行個體規格所使用的鏡像啟動模式必須為UEFI模式。如果您需要使用自訂鏡像,請確保該自訂鏡像支援UEFI啟動模式,並且鏡像的啟動模式屬性已設定為UEFI模式。具體操作,請參見執行個體啟動模式

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn8ia

該執行個體目前僅支援海外等部分地區,如有需求,請聯絡阿里雲銷售人員。

  • 規格類型系列介紹:ebmgn8ia是阿里雲針對搜尋推薦、模擬和其他GPU計算稀疏類(平均每顆GPU需要配備比較多的vCPU資源)業務的發展推出的第8代加速運算規格類型系列(彈性裸金屬執行個體規格類型系列),採用最新NVIDIA L20 GPU,每個執行個體為一台採用了2顆高主頻CPU和4個GPU計算卡的裸金屬主機。

  • 產品特色及適用情境:

    • 高主頻:該產品配置了2顆AMD EPYC™ Genoa 9T34處理器,每顆處理有64個物理核,整機提供256個vCPU,主頻高達3.4-3.75GHz。大幅提高CPU單核效能,適用於CAD建模,並提升CAE模擬的前期預先處理速度。

    • 稀疏資源配比:平均GPU配置了64 vCPU和384 GiB記憶體,平均每個GPU的記憶體頻寬達到230 GB/s, 適合高I/O吞吐的GPU計算情境,如廣告、搜尋、推薦以及傳統CAE模擬,部分採用CPU渲染的影視製作等。

  • 採用最新的CIPU 1.0雲處理器:

    • 具有解耦計算和儲存能力,可以靈活選擇所需儲存資源。相對於上一代,該執行個體規格的機器間頻寬提升至160 Gbit/s,可以更快地完成資料轉送和處理。

    • CIPU提供裸金屬能力,相對於傳統虛擬化執行個體,可以支援GPU執行個體之間的PCIe P2P通訊。

  • 計算:

    • 採用全新NVIDIA L20企業級GPU:

      • 支援vGPU、RTX、TensorRT等常用加速功能。

      • 支援FP8精度,提升計算效率。

    • NVIDIA L20主要參數:

      GPU架構

      GPU顯存

      計算效能

      視頻編解碼能力

      卡間互聯

      NVIDIA Ada Lovelace

      • 容量:48 GB

      • 頻寬:864 GB/s

      • FP64: N/A

      • FP32: 59.3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 * Video Encoder(+AV1)

      • 3 * Video Decoder

      • 4 * JPEG Decoder

      • PCIe介面:PCIe Gen4 x16

      • 頻寬:64 GB/s

    • 處理器:3.4 GHz~3.75 GHz的AMD EPYC™ Genoa 9T34處理器。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,3000萬PPS網路收發包能力。

    • 支援ERI(Elastic RDMA Interface),可以在VPC網路下實現RDMA直通加速互聯,將頻寬提升至160 Gbit/s,可用於CV和傳統模型的訓練業務。

      說明

      關於ERI的使用說明,請參見在企業級執行個體上啟用eRDMA

ebmgn8ia包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

單網卡私人IPv4地址數

單網卡IPv6地址數

多隊列(主網卡/輔助網卡)

彈性網卡

最大掛載資料盤數

雲端硬碟最大頻寬(GB/s)

ecs.ebmgn8ia.64xlarge

256

1536

L20 * 4

48GB*4

160(80 * 2)

3000萬

30

30

64/16

32

31

6

說明

ebmgn8ia執行個體規格所使用的鏡像啟動模式必須為UEFI模式。如果您需要使用自訂鏡像,請確保該自訂鏡像支援UEFI啟動模式,並且鏡像的啟動模式屬性已設定為UEFI模式。具體操作,請參見執行個體啟動模式

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn8is

該執行個體目前僅支援海外等部分地區,如有需求,請聯絡阿里雲銷售人員。

  • 規格類型系列介紹:ebmgn8is是阿里雲針對近期AI產生業務的發展推出的第8代加速運算規格類型系列(彈性裸金屬執行個體規格類型系列),採用最新NVIDIA L20 GPU,每個執行個體為一台採用了8個GPU計算卡的裸金屬主機。

  • 產品特色及定位:

    • 圖形處理:該產品採用Intel第4代Xeon Scalable高主頻處理器,在3D建模情境,為您提供足夠的CPU算力支撐,使得圖形的渲染和設計更加順暢。

    • 推理任務:採用全新NVIDIA L20,單卡配置48 GB顯存來加速推理任務,支援FP8浮點數格式,搭配ACK容器可靈活支援各類AIGC模型的推理,尤其適用於70 B以下LLM模型的推理任務。

    • 訓練任務:該執行個體提供高性價比的計算能力,FP32計算效能相比7代推理執行個體提升1倍,特別適用於基於FP32開發的CV類模型和其他各類中小模型的訓練。

  • 適用情境:

    • 結合雲市場的GRID鏡像使用GRID圖形驅動,啟動OpenGL和Direct3D圖形能力,提供工作站級圖形處理能力,適用於動漫、影視特效製作和渲染

    • 結合ACK容器化管理能力,更高效、低成本地支撐AIGC圖形產生和LLM大模型推理(最大支援130 B)

    • 其他通用AI識別情境、Image Recognition、語音辨識等

  • 採用最新的CIPU 1.0雲處理器:

    • 具有解耦計算和儲存能力,可以靈活選擇所需儲存資源。相對於上一代,該執行個體規格的機器間頻寬提升至160 Gbit/s,可以更快地完成資料轉送和處理。

    • CIPU提供裸金屬能力,相對於傳統虛擬化執行個體,可以支援GPU執行個體之間的PCIE P2P通訊。

  • 計算:

    • 採用全新NVIDIA L20企業級GPU:

      • 支援vGPU、RTX、TensorRT等常用加速功能。

      • 採用PCIe Switch互聯,相比直連CPU方案,其NCCL效能提升36%,多卡分區推理大模型時,推理效能最大提升9%。

    • NVIDIA L20主要參數:

      GPU架構

      GPU顯存

      計算效能

      視頻編解碼能力

      卡間互聯

      NVIDIA Ada Lovelace

      • 容量:48 GB

      • 頻寬:864 GB/s

      • FP64: N/A

      • FP32: 59.3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 * Video Encoder(+AV1)

      • 3 * Video Decoder

      • 4 * JPEG Decoder

      • PCIe介面:PCIe Gen4 x16

      • 頻寬:64 GB/s

    • 處理器:3.4 GHz主頻的Intel ® Xeon ®可擴充處理器(SPR),全核睿頻可達3.9 GHz。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,3000萬PPS網路收發包能力。

    • 支援ERI(Elastic RDMA Interface),可以在VPC網路下實現RDMA直通加速互聯,將頻寬提升至160 Gbit/s,可用於CV和傳統模型的訓練業務。

      說明

      關於ERI的使用說明,請參見在企業級執行個體上啟用eRDMA

ebmgn8is包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

單網卡私人IPv4地址數

單網卡IPv6地址數

多隊列(主網卡/輔助網卡)

彈性網卡

最大掛載資料盤數

雲端硬碟最大頻寬(GB/s)

ecs.ebmgn8is.32xlarge

128

1024

L20 * 8

48GB*8

160(80 * 2)

3000萬

30

30

64/16

32

31

6

說明

ebmgn8is執行個體規格所使用的鏡像啟動模式必須為UEFI模式。如果您需要使用自訂鏡像,請確保該自訂鏡像支援UEFI啟動模式,並且鏡像的啟動模式屬性已設定為UEFI模式。具體操作,請參見執行個體啟動模式

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn7e

  • 規格類型系列介紹:ebmgn7e是基於神龍架構,實現軟體定義程式硬體計算,靈活彈性與強悍效能兼備的執行個體規格類型系列。

  • 適用情境:

    • 各類深度學習訓練開發業務。

    • HPC加速計算和模擬。

    重要

    在使用高通訊負載的AI訓練業務如Transformer等模型時,務必啟用NVLink進行GPU間的資料通訊,否則可能由於PCIe鏈路大規模資料轉送引起非預期的故障,導致資料受損。如不確定您使用的訓練通訊鏈路拓撲,請提交工單由阿里雲技術專家為您提供支援人員。

  • 計算:

    • 處理器:基於Intel ® Xeon ®Scalable計算平台,2.9 GHz主頻,全核睿頻3.5 GHz,支援PCIe 4.0介面。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,2400萬PPS網路收發包能力。

ebmgn7e包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列(主網卡/輔助網卡)

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.ebmgn7e.32xlarge

128

1024

80GB * 8

64

2400萬

32/12

32

10

1

MIG(Multi-Instance GPU)功能需要您在ebmgn7e執行個體啟動後自行檢查並決定是否開啟或關閉,系統無法保證MIG(Multi-Instance GPU)功能是開啟或關閉狀態。關於MIG(Multi-Instance GPU)的更多資訊,請參見NVIDIA Multi-Instance GPU User Guide

ebmgn7e執行個體是否支援開啟MIG功能的說明如下所示:

執行個體規格

是否支援開啟MIG功能

說明

ecs.ebmgn7e.32xlarge

ebmgn7e裸金屬執行個體支援開啟MIG功能。

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn7i

  • 規格類型系列介紹:ebmgn7i是基於神龍架構,實現軟體定義程式硬體計算,靈活彈性與強悍效能兼備的執行個體規格類型系列。

  • 適用情境:

    • 配備高效能CPU、記憶體、GPU,可以處理更多並發AI推理任務,適用於Image Recognition、語音辨識、行為識別業務。

    • 支援RTX功能,搭配高主頻CPU,提供高效能的3D圖形虛擬化能力,適用於遠程圖形設計、雲遊戲等高強度圖形處理業務。

    • 支援RTX功能,搭配高網路頻寬和雲端硬碟頻寬,適用於搭建高效能渲染農場。

    • 配備多個GPU,搭配高網路頻寬,適用於小規模深度學習訓練業務。

  • 計算:

    • 採用NVIDIA A10 GPU計算卡:

      • 創新的Ampere架構。

      • 支援vGPU、RTX、TensorRT等常用加速功能。

    • 處理器:2.9 GHz主頻的Intel ® Xeon ®可擴充處理器(Ice Lake),全核睿頻3.5 GHz。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 超高網路效能,2400萬PPS網路收發包能力。

ebmgn7i包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.ebmgn7i.32xlarge

128

768

NVIDIA A10 * 4

24GB * 4

64

2400萬

32

32

10

1

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn7

  • 規格類型系列介紹:ebmgn7基於神龍架構,實現軟體定義程式硬體計算,靈活彈性與強悍效能兼備的執行個體規格類型系列。

  • 適用情境:

    • 深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練應用。

    • 高GPU負載的科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。

  • 計算:

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8269CY(Cascade Lake)。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與計算規格對應(規格越高網路效能越強)。

ebmgn7包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.ebmgn7.26xlarge

104

768

40GB*8

30

1800萬

16

15

10

1

MIG(Multi-Instance GPU)功能需要您在ebmgn7執行個體啟動後自己檢查並決定是否開啟或關閉,系統無法保證MIG(Multi-Instance GPU)功能是開啟還是關閉狀態。關於MIG(Multi-Instance GPU)的更多資訊,請參見NVIDIA Multi-Instance GPU User Guide

ebmgn7執行個體是否支援開啟MIG功能的說明如下所示:

執行個體規格

是否支援開啟MIG功能

說明

ecs.ebmgn7.26xlarge

ebmgn7裸金屬執行個體支援開啟MIG功能。

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn6e

  • 規格類型系列介紹:

    • ebmgn6e是基於神龍架構,實現軟體定義程式硬體計算,靈活彈性與強悍效能兼備的執行個體規格類型系列。

    • 採用NVIDIA V100(32 GB NVLink) GPU計算卡。

    • GPU加速器為V100(SXM2封裝) ,特點如下:

      • 創新的Volta架構。

      • 單GPU顯存32 GB HBM2(GPU顯存頻寬900 GB/s)。

      • 單GPU 5120個CUDA Cores。

      • 單GPU 640個Tensor Cores。

      • 單GPU支援6個NVLink鏈路(NVLink屬於雙向鏈路),單向鏈路的頻寬為25 GB/s,總頻寬為6×25×2=300 GB/s。

  • 適用情境:

    • 深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練以及推理應用。

    • 科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。

  • 計算:

    • 處理器與記憶體配比為1:8。

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與計算規格對應(規格越高網路效能越強)。

ebmgn6e包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.ebmgn6e.24xlarge

96

768

NVIDIA V100 * 8

32GB * 8

32

480萬

16

15

10

1

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn6v

  • 規格類型系列介紹:

    • ebmgn6v是基於神龍架構,實現軟體定義程式硬體計算,靈活彈性與強悍效能兼備的執行個體規格類型系列。

    • 採用NVIDIA V100 GPU計算卡

    • GPU加速器為V100(SXM2封裝) ,特點如下:

      • 創新的Volta架構

      • 單GPU顯存16 GB HBM2(GPU顯存頻寬900 GB/s)

      • 單GPU 5120個CUDA Cores

      • 單GPU 640個Tensor Cores

      • 單GPU支援6個NVLink鏈路(NVLink屬於雙向鏈路),單向鏈路的頻寬為25 GB/s,總頻寬為6×25×2=300 GB/s

  • 適用情境:

    • 深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練以及推理應用

    • 科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。

  • 計算:

    • 處理器與記憶體配比為1:4。

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與計算規格對應(規格越高網路效能越強)。

ebmgn6v包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.ebmgn6v.24xlarge

96

384

NVIDIA V100 * 8

16GB * 8

30

450萬

8

32

10

1

GPU計算型ECS Bare Metal Instance執行個體規格類型系列ebmgn6i

  • 規格類型系列介紹:

    • ebmgn6i是基於神龍架構,實現軟體定義程式硬體計算,靈活彈性與強悍效能兼備的執行個體規格類型系列。

    • GPU加速器為T4 ,特點如下:

      • 創新的Turing架構

      • 單GPU顯存16 GB(GPU顯存頻寬320 GB/s)

      • 單GPU 2560個CUDA Cores

      • 單GPU多達320個Turing Tensor Cores

      • 可變精度Tensor Cores支援65 TFLOPS FP16、130 INT8 TOPS以及260 INT4 TOPS

  • 適用情境:

    • AI(DL/ML)推理,適合電腦視覺、語音辨識、語音合成、NLP、機器翻譯、推薦系統。

    • 雲遊戲雲端即時渲染。

    • AR/VR的雲端即時渲染。

    • 重載圖形計算或圖形工作站。

    • GPU加速資料庫。

    • 高效能運算。

  • 計算:

    • 處理器與記憶體配比為1:4。

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。

  • 儲存:

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與計算規格對應(規格越高網路效能越強)。

ebmgn6i包括的執行個體規格及指標資料如下表所示。

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.ebmgn6i.24xlarge

96

384

NVIDIA T4 * 4

16GB * 4

30

450萬

8

32

10

1

GPU計算型執行個體規格類型系列gn5i

  • 適用情境: 深度學習推理、多媒體編解碼等伺服器端GPU計算工作負載。

  • 計算:

    • 採用NVIDIA P4 GPU卡。

    • 處理器與記憶體配比為1:4。

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® E5-2682 v4(Broadwell)。

  • 儲存:

    • I/O最佳化執行個體。

    • 支援的雲端硬碟類型:SSD雲端硬碟和高效雲端硬碟。

  • 網路:

    • 支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊

    • 執行個體網路效能與執行個體規格對應,規格越高網路效能越強。

gn5i包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

單網卡IPv6地址數

ecs.gn5i-c2g1.large

2

8

NVIDIA P4 * 1

8GB * 1

1

10萬

2

2

6

1

ecs.gn5i-c4g1.xlarge

4

16

NVIDIA P4 * 1

8GB * 1

1.5

20萬

2

3

10

1

ecs.gn5i-c8g1.2xlarge

8

32

NVIDIA P4 * 1

8GB * 1

2

40萬

4

4

10

1

ecs.gn5i-c16g1.4xlarge

16

64

NVIDIA P4 * 1

8GB * 1

3

80萬

4

8

20

1

ecs.gn5i-c16g1.8xlarge

32

128

NVIDIA P4 * 2

8GB * 2

6

120萬

8

8

20

1

ecs.gn5i-c28g1.14xlarge

56

224

NVIDIA P4 * 2

8GB * 2

10

200萬

14

8

20

1

GPU計算型執行個體規格類型系列gn5

  • 適用情境

    • 深度學習。

    • 科學計算,例如計算流體動力學、計算金融學、基因體學研究、環境分析。

    • 高效能運算、渲染、多媒體編解碼及其他伺服器端GPU計算工作負載。

  • 計算

    • 採用NVIDIA P100 GPU卡。

    • 多種處理器與記憶體配比。

    • 處理器:2.5 GHz主頻的Intel ® Xeon ® E5-2682 v4(Broadwell)。

  • 儲存

    • 配備高效能NVMe SSD本地碟。

    • I/O最佳化執行個體。

    • 支援的雲端硬碟類型:SSD雲端硬碟和高效雲端硬碟。

  • 網路

    • 僅支援IPv4

    • 執行個體網路效能與執行個體規格對應,規格越高網路效能越強。

gn5包括的執行個體規格及指標資料如下表所示:

執行個體規格

vCPU

記憶體(GiB)

GPU

GPU顯存

本機存放區(GiB)

網路基礎頻寬(Gbit/s)

網路收發包PPS

多隊列

彈性網卡

單網卡私人IPv4地址數

ecs.gn5-c4g1.xlarge

4

30

NVIDIA P100 * 1

16GB * 1

440

3

30萬

1

3

10

ecs.gn5-c8g1.2xlarge

8

60

NVIDIA P100 * 1

16GB * 1

440

3

40萬

1

4

10

ecs.gn5-c4g1.2xlarge

8

60

NVIDIA P100 * 2

16GB * 2

880

5

100萬

4

4

10

ecs.gn5-c8g1.4xlarge

16

120

NVIDIA P100 * 2

16GB * 2

880

5

100萬

4

8

20

ecs.gn5-c28g1.7xlarge

28

112

NVIDIA P100 * 1

16GB * 1

440

5

225萬

7

8

10

ecs.gn5-c8g1.8xlarge

32

240

NVIDIA P100 * 4

16GB * 4

1760

10

200萬

8

8

20

ecs.gn5-c28g1.14xlarge

56

224

NVIDIA P100 * 2

16GB * 2

880

10

450萬

14

8

20

ecs.gn5-c8g1.14xlarge

54

480

NVIDIA P100 * 8

16GB * 8

3520

25

400萬

14

8

10