GPU雲端服務器提供GPU加速計算能力,實現GPU計算資源的即開即用和Auto Scaling。作為阿里雲彈性計算家族的一員,GPU雲端服務器結合了GPU計算力與CPU計算力,滿足您在人工智慧、高效能運算、專業圖形影像處理等情境中的需求。
背景資訊
在閱讀各個執行個體規格類型系列的特點及詳細指標之前,您需要提前學習以下資訊:
瞭解執行個體規格命名及分類:協助您更好地理解執行個體規格類型系列的命名及分類資訊,瞭解各規格類型系列之間差異,詳參見執行個體規格分類與命名。
瞭解執行個體規格指標:提前瞭解執行個體規格的各項指標說明,請參見執行個體規格指標說明,您也可以通過調用DescribeInstanceTypeFamilies和DescribeInstanceTypes查詢阿里雲ECS提供的執行個體規格類型系列列表及所有執行個體規格的詳細資料。
根據業務情境選擇執行個體規格類型系列:想擷取更多關於如何在實際業務情境中選擇合適的規格,請參見執行個體規格選型指導。
在確定您要選擇的執行個體規格之後,您可能需要進一步瞭解以下資訊:
查看執行個體可購買地區:各個地區下可供售賣的執行個體規格可能存在差異,執行個體的可購情況,您可以前往ECS執行個體可購買地區查看,也可以調用DescribeRegions和DescribeZones查詢ECS資源支援的地區和可用性區域。
預估執行個體費用:想瞭解執行個體在不同付費方式下大概的花費,可使用阿里雲的ECS價格計算機查看,也可以調用DescribePrice查詢ECS資源的最新價格。
直接購買執行個體:可直接前往ECS購買頁下單。
您可能還會關註:
查看已停售的規格類型系列:如果在本頁面沒有找到您想要的執行個體規格類型系列,可前往已停售的規格類型系列群,詳情請參見已停售的執行個體規格。
執行個體規格的變更配置情況:想擷取某個執行個體規格是否支援變更配置到其他執行個體規格,由於可變更配置的執行個體規格之間有一定的限制,請參見支援變更配置的執行個體規格。
GPU虛擬化型 | GPU計算型 | 不推薦(如果以下規格售罄,建議使用前面的規格) |
GPU虛擬化型執行個體規格類型系列sgn7i-vws(共用CPU)
規格類型系列介紹:
依託第三代神龍架構,提供穩定可預期的超高效能。同時通過晶片快速路徑加速手段,完成儲存、網路效能以及計算穩定性的數量級提升,可以更快地儲存資料和載入模型。
執行個體的CPU和網路資源採用共用模式提供,最大化利用底層資源。記憶體和GPU顯存採用獨享模式提供,為您提供資料隔離和效能保障。
說明如果您需要獨享的CPU資源,請選擇vgn7i-vws。
已包含NVIDIA GRID vWS的軟體License,可以為各類專業CAD軟體提供認證過的圖形加速驅動能力,滿足專業級圖形設計的需求,也可以作為輕量級GPU計算型執行個體使用,降低小規模AI推理過程的使用成本。
適用情境:
配備高效能CPU、記憶體、GPU,可以處理更多並發AI推理任務,適用於Image Recognition、語音辨識、行為識別業務。
支援RTX功能,搭配高主頻CPU,提供高效能的3D圖形虛擬化能力,適用於遠程圖形設計、雲遊戲等高強度圖形處理業務。
使用Ice Lake處理器,在影視動漫製作、雲遊戲、機械設計等領域進行3D建模時,效果更加出色。
計算:
採用NVIDIA A10 GPU卡。
創新的Ampere架構。
支援vGPU、RTX、TensorRT等常用加速功能,提供多種業務支撐。
處理器:2.9 GHz主頻的Intel ® Xeon ® 可擴充處理器(Ice Lake),全核睿頻3.5 GHz。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟和ESSD AutoPL雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
sgn7i-vws包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路頻寬基礎/突發(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.sgn7i-vws-m2.xlarge | 4 | 15.5 | NVIDIA A10 * 1/12 | 24GB * 1/12 | 1.5/5 | 50萬 | 4 | 2 | 2 | 1 |
ecs.sgn7i-vws-m4.2xlarge | 8 | 31 | NVIDIA A10 * 1/6 | 24GB * 1/6 | 2.5/10 | 100萬 | 4 | 4 | 6 | 1 |
ecs.sgn7i-vws-m8.4xlarge | 16 | 62 | NVIDIA A10 * 1/3 | 24GB * 1/3 | 5/20 | 200萬 | 8 | 4 | 10 | 1 |
ecs.sgn7i-vws-m2s.xlarge | 4 | 8 | NVIDIA A10 * 1/12 | 24GB * 1/12 | 1.5/5 | 50萬 | 4 | 2 | 2 | 1 |
ecs.sgn7i-vws-m4s.2xlarge | 8 | 16 | NVIDIA A10 * 1/6 | 24GB * 1/6 | 2.5/10 | 100萬 | 4 | 4 | 6 | 1 |
ecs.sgn7i-vws-m8s.4xlarge | 16 | 32 | NVIDIA A10 * 1/3 | 24GB * 1/3 | 5/20 | 200萬 | 8 | 4 | 10 | 1 |
上表中的GPU列對應的指標包括GPU卡型號和GPU分區資訊。其中,GPU分區表示1塊GPU分成多片,每個執行個體上使用1片。例如:
NVIDIA A10 * 1/12
中的NVIDIA A10
表示GPU卡型號;1/12
表示GPU分區,即1塊GPU分成12片,每個執行個體上使用1片。
GPU虛擬化型執行個體規格類型系列vgn7i-vws
規格類型系列介紹:
依託第三代神龍架構,提供穩定可預期的超高效能。同時通過晶片快速路徑加速手段,完成儲存、網路效能以及計算穩定性的數量級提升,可以更快地儲存資料和載入模型。
已包含NVIDIA GRID vWS的軟體License,可以為各類專業CAD軟體提供認證過的圖形加速驅動能力,滿足專業級圖形設計的需求,也可以作為輕量級GPU計算型執行個體使用,降低小規模AI推理過程的使用成本。
適用情境:
配備高效能CPU、記憶體、GPU,可以處理更多並發AI推理任務,適用於Image Recognition、語音辨識、行為識別業務。
支援RTX功能,搭配高主頻CPU,提供高效能的3D圖形虛擬化能力,適用於遠程圖形設計、雲遊戲等高強度圖形處理業務。
使用Ice Lake處理器,在影視動漫製作、雲遊戲、機械設計等領域進行3D建模時,效果更加出色。
計算:
採用NVIDIA A10 GPU卡。
創新的Ampere架構。
支援vGPU、RTX、TensorRT等常用加速功能,提供多種業務支撐。
處理器:2.9 GHz主頻的Intel ® Xeon ® 可擴充處理器(Ice Lake),全核睿頻3.5 GHz。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟和ESSD AutoPL雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
vgn7i-vws包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.vgn7i-vws-m4.xlarge | 4 | 30 | NVIDIA A10 * 1/6 | 24GB * 1/6 | 3 | 100萬 | 4 | 4 | 10 | 1 |
ecs.vgn7i-vws-m8.2xlarge | 10 | 62 | NVIDIA A10 * 1/3 | 24GB * 1/3 | 5 | 200萬 | 8 | 6 | 10 | 1 |
ecs.vgn7i-vws-m12.3xlarge | 14 | 93 | NVIDIA A10 * 1/2 | 24GB * 1/2 | 8 | 300萬 | 8 | 6 | 15 | 1 |
ecs.vgn7i-vws-m24.7xlarge | 30 | 186 | NVIDIA A10 * 1 | 24GB * 1 | 16 | 600萬 | 12 | 8 | 30 | 1 |
上表中的GPU列對應的指標包括GPU卡型號和GPU分區資訊。其中,GPU分區表示1塊GPU分成多片,每個執行個體上使用1片。例如:
NVIDIA A10 * 1/6
中的NVIDIA A10
表示GPU卡型號;1/6
表示GPU的分區,即1塊GPU分成6片,每個執行個體上使用1片。
GPU虛擬化型執行個體規格類型系列vgn6i-vws
適用情境:
雲遊戲的雲端即時渲染。
AR和VR的雲端即時渲染。
AI(DL和ML)推理,適合彈性部署含有AI推理計算應用的互連網業務。
深度學習的教學練習環境。
深度學習的模型實驗環境。
計算:
採用NVIDIA T4 GPU計算加速器。
執行個體包含分區虛擬化後的虛擬GPU。
計算能力支援NVIDIA Tesla T4的1/4和1/2。
GPU顯存支援4 GB和8 GB。
處理器與記憶體配比約為1:5。
處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:SSD雲端硬碟和高效雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
vgn6i-vws包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.vgn6i-m4-vws.xlarge | 4 | 23 | NVIDIA T4 * 1/4 | 16GB * 1/4 | 2 | 50萬 | 4/2 | 3 | 10 | 1 |
ecs.vgn6i-m8-vws.2xlarge | 10 | 46 | NVIDIA T4 * 1/2 | 16GB * 1/2 | 4 | 80萬 | 8/2 | 4 | 10 | 1 |
ecs.vgn6i-m16-vws.5xlarge | 20 | 92 | NVIDIA T4 * 1 | 16GB * 1 | 7.5 | 120萬 | 6 | 4 | 10 | 1 |
上表中的GPU列對應的指標包括GPU卡型號和GPU分區資訊。其中,GPU分區表示1塊GPU分成多片,每個執行個體上使用1片。例如:
NVIDIA T4 * 1/4
中的NVIDIA T4
表示GPU卡型號;1/4
表示GPU的分區,即1塊GPU分成4片,每個執行個體上使用1片。
GPU計算型執行個體規格類型系列gn8v
該執行個體目前僅支援海外等部分地區,如有需求,請聯絡阿里雲銷售人員。
規格類型系列介紹:gn8v是阿里雲針對AI模型訓練和超大參數量模型推理任務推出的第8代加速運算規格類型系列(GPU計算型執行個體規格類型系列),針對不同應用需求,為您提供1卡、2卡、4卡和8卡多種機型。
適用情境:
對於70 B以上的LLM模型,進行多卡並行推理計算時性價比較高。
單個GPU提供39.5 TFLPS FP32算力,在傳統AI模型訓練和自動駕駛訓練業務中效能突出。
8卡之間支援NVLINK互聯,適用於中小模型訓練情境。
產品特色及定位:
高速&大容量顯存:每個GPU配備了96 GB容量的HBM3e顯存,且顯存頻寬可以達到4 TB/s,大幅加快了模型訓練和推理速度。
高卡間頻寬:多個GPU卡之間通過900 GB/s NVLINK互聯,多卡訓練和推理的效率遠超過曆代GPU產品。
大模型量化技術:支援FP8算力,對大規模參數訓練和推理過程的算力進行最佳化,大幅提升訓練和推理的計算速度,降低顯存佔用。
高安全性:支援CPU機密計算(Intel TDX)和GPU機密計算(NVIDIA CC)功能,閉環全鏈路模型推理的機密計算能力。對於模型推理和訓練的安全性,開啟機密計算能力保障使用者推理資料和企業模型的安全。
計算:
採用最新的CIPU 1.0雲處理器。
具有解耦計算和儲存能力,可以靈活選擇所需儲存資源。
提供裸金屬能力,相對於傳統虛擬化執行個體,可以支援GPU執行個體之間的P2P通訊。
採用Intel第4代Xeon可擴充處理器,全核睿頻可達3.1 GHz,基頻可達2.8 GHz。
儲存:
I/O最佳化執行個體。
僅支援ESSD雲端硬碟和ESSD AutoPL雲端硬碟,支援彈性臨時盤EED(Elastic Ephemeral Disk)。
網路:
支援IPv4、IPv6。關於IPv6通訊,請參見IPv6通訊。
支援巨型幀(Jumbo frames)。更多資訊,請參見巨型幀(Jumbo Frames)。
超高網路效能,最大3000萬PPS網路收發包能力(8卡執行個體)。
支援ERI(Elastic RDMA Interface)。
說明關於ERI的使用說明,請參見在企業級執行個體上使用eRDMA。
gn8v包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU顯存 | 網路基礎頻寬(Gbit/s) | 彈性網卡 | 隊列數量(主) | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 | 最大支援雲端硬碟數量 | 雲端硬碟基礎IOPS | 雲端硬碟基礎頻寬(Gbit/s) |
ecs.gn8v.4xlarge | 16 | 96 | 96GB * 1 | 12 | 8 | 16 | 30 | 30 | 17 | 10萬 | 0.75 |
ecs.gn8v.6xlarge | 24 | 128 | 96GB * 1 | 15 | 8 | 24 | 30 | 30 | 17 | 12萬 | 0.937 |
ecs.gn8v-2x.8xlarge | 32 | 192 | 96GB * 2 | 20 | 8 | 32 | 30 | 30 | 25 | 20萬 | 1.25 |
ecs.gn8v-4x.8xlarge | 32 | 384 | 96GB * 4 | 20 | 8 | 32 | 30 | 30 | 25 | 20萬 | 1.25 |
ecs.gn8v-2x.12xlarge | 48 | 256 | 96GB * 2 | 25 | 8 | 48 | 30 | 30 | 33 | 30萬 | 1.50 |
ecs.gn8v-8x.16xlarge | 64 | 768 | 96GB * 8 | 32 | 8 | 64 | 30 | 30 | 33 | 36萬 | 2.5 |
ecs.gn8v-4x.24xlarge | 96 | 512 | 96GB * 4 | 50 | 15 | 64 | 30 | 30 | 49 | 50萬 | 3 |
ecs.gn8v-8x.48xlarge | 192 | 1024 | 96GB * 8 | 100 | 15 | 64 | 50 | 50 | 65 | 100萬 | 6 |
GPU計算型執行個體規格類型系列gn8is
該執行個體目前僅支援海外等部分地區,如有需求,請聯絡阿里雲銷售人員。
規格類型系列介紹:gn8is是阿里雲針對近期AI產生業務的發展推出的第8代加速運算規格類型系列(GPU計算型執行個體規格類型系列),針對不同應用需求,為您提供1卡、2卡、4卡和8卡機型,以及不同CPU和GPU配比的執行個體規格。
產品特色及定位:
圖形處理:該產品採用Intel第5代Xeon Scaleable高主頻處理器,在3D建模情境中,為您提供足夠的CPU算力支撐,使得圖形的渲染和設計更加順暢。
推理任務:採用全新48 GB顯存的圖形處理器(GPU)來加速推理任務,支援FP8浮點數格式,搭配ACK容器可靈活支援各類AIGC模型的推理,尤其適用於70 B以下LLM模型的推理任務。
適用情境:
結合雲市場的GRID鏡像使用GRID驅動,啟動OpenGL和Direct3D圖形能力,提供工作站級圖形處理能力,適用於動漫、影視特效製作和渲染。
結合ACK容器化管理能力,更高效、低成本地支撐AIGC圖形產生和LLM大模型推理。
其他通用AI識別情境、Image Recognition、語音辨識等。
計算:
採用全新GPU計算卡。
支援TensorRT等常用加速功能,支援FP8浮點數格式,提升模型推理效能。
顯存容量提升至48 GB,多卡情況下,支援70 B及更大模型的單機推理。
支援圖形處理能力,例如通過雲助手方式或選擇雲市場鏡像方式安裝GRID驅動後,圖形處理效能相對7代平台提升1倍。
處理器:採用最新的Intel ® Xeon ®高主頻處理器,全核睿頻可達3.9 GHz,以應對更複雜的3D建模需求。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟、ESSD AutoPL雲端硬碟和彈性臨時盤EED(Elastic Ephemeral Disk)。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
支援ERI(Elastic RDMA Interface)。
說明關於ERI的使用說明,請參見在企業級執行個體上使用eRDMA。
gn8is包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU顯存 | 網路基礎頻寬(Gbit/s) | 彈性網卡 | 隊列數量(主) | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 | 最大支援雲端硬碟數量 | 雲端硬碟基礎IOPS | 雲端硬碟基礎頻寬(Gbit/s) |
ecs.gn8is.2xlarge | 8 | 64 | 48GB * 1 | 8 | 4 | 8 | 15 | 15 | 17 | 6萬 | 0.75 |
ecs.gn8is.4xlarge | 16 | 128 | 48GB * 1 | 16 | 8 | 16 | 30 | 30 | 17 | 12萬 | 1.25 |
ecs.gn8is-2x.8xlarge | 32 | 256 | 48GB * 2 | 32 | 8 | 32 | 30 | 30 | 33 | 25萬 | 2 |
ecs.gn8is-4x.16xlarge | 64 | 512 | 48GB * 4 | 64 | 8 | 64 | 30 | 30 | 33 | 45萬 | 4 |
ecs.gn8is-8x.32xlarge | 128 | 1024 | 48GB * 8 | 100 | 15 | 64 | 50 | 50 | 65 | 90萬 | 8 |
GPU計算型執行個體規格類型系列gn7e
gn7e的特點如下:
規格類型系列介紹:
您可以根據需要選擇不同數量的卡和不同CPU資源的規格,靈活適應其不同的AI業務需求。
依託第三代神龍架構,VPC和雲端硬碟網路頻寬相比上一代平均提升一倍。
適用情境:
中小規模的AI訓練業務。
使用CUDA進行加速的HPC業務。
對GPU處理能力或顯存容量需求較高的AI推理業務。
深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練應用。
高GPU負載的科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。
重要在使用高通訊負載的AI訓練業務如Transformer等模型時,務必啟用NVLink進行GPU間的資料通訊,否則可能由於PCIe鏈路大規模資料轉送引起非預期的故障,導致資料受損。如不確定您使用的訓練通訊鏈路拓撲,請提交工單由阿里雲技術專家為您提供支援人員。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟和ESSD AutoPL雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn7e包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.gn7e-c16g1.4xlarge | 16 | 125 | 80GB * 1 | 8 | 300萬 | 8 | 8 | 10 | 1 |
ecs.gn7e-c16g1.8xlarge | 32 | 250 | 80GB * 2 | 16 | 600萬 | 16 | 8 | 10 | 1 |
ecs.gn7e-c16g1.16xlarge | 64 | 500 | 80GB * 4 | 32 | 1200萬 | 32 | 8 | 10 | 1 |
ecs.gn7e-c16g1.32xlarge | 128 | 1000 | 80GB * 8 | 64 | 2400萬 | 32 | 16 | 15 | 1 |
GPU計算型執行個體規格類型系列gn7i
規格類型系列介紹:依託第三代神龍架構,提供穩定可預期的超高效能。同時通過晶片快速路徑加速手段,完成儲存、網路效能以及計算穩定性的數量級提升。
適用情境:
配備高效能CPU、記憶體、GPU,可以處理更多並發AI推理任務,適用於Image Recognition、語音辨識、行為識別業務。
支援RTX功能,搭配高主頻CPU,提供高效能的3D圖形虛擬化能力,適用於遠程圖形設計、雲遊戲等高強度圖形處理業務。
計算:
採用NVIDIA A10 GPU卡。
創新的Ampere架構。
支援RTX、TensorRT等常用加速功能。
處理器:2.9 GHz主頻的Intel ® Xeon ® 可擴充處理器(Ice Lake),全核睿頻3.5 GHz。
最大可提供752 GiB記憶體,相比gn6i大幅提升。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟和ESSD AutoPL雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn7i包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.gn7i-c8g1.2xlarge | 8 | 30 | NVIDIA A10 * 1 | 24GB * 1 | 16 | 160萬 | 8 | 4 | 15 | 15 |
ecs.gn7i-c16g1.4xlarge | 16 | 60 | NVIDIA A10 * 1 | 24GB * 1 | 16 | 300萬 | 8 | 8 | 30 | 30 |
ecs.gn7i-c32g1.8xlarge | 32 | 188 | NVIDIA A10 * 1 | 24GB * 1 | 16 | 600萬 | 12 | 8 | 30 | 30 |
ecs.gn7i-c32g1.16xlarge | 64 | 376 | NVIDIA A10 * 2 | 24GB * 2 | 32 | 1200萬 | 16 | 15 | 30 | 30 |
ecs.gn7i-c32g1.32xlarge | 128 | 752 | NVIDIA A10 * 4 | 24GB * 4 | 64 | 2400萬 | 32 | 15 | 30 | 30 |
ecs.gn7i-c48g1.12xlarge | 48 | 310 | NVIDIA A10 * 1 | 24GB * 1 | 16 | 900萬 | 16 | 8 | 30 | 30 |
ecs.gn7i-c56g1.14xlarge | 56 | 346 | NVIDIA A10 * 1 | 24GB * 1 | 16 | 1200萬 | 16 | 12 | 30 | 30 |
ecs.gn7i-2x.8xlarge | 32 | 128 | NVIDIA A10 * 2 | 24GB * 2 | 16 | 600萬 | 16 | 8 | 30 | 30 |
ecs.gn7i-4x.8xlarge | 32 | 128 | NVIDIA A10 * 4 | 24GB * 4 | 16 | 600萬 | 16 | 8 | 30 | 30 |
ecs.gn7i-4x.16xlarge | 64 | 256 | NVIDIA A10 * 4 | 24GB * 4 | 32 | 1200萬 | 32 | 8 | 30 | 30 |
ecs.gn7i-8x.32xlarge | 128 | 512 | NVIDIA A10 * 8 | 24GB * 8 | 64 | 2400萬 | 32 | 16 | 30 | 30 |
ecs.gn7i-8x.16xlarge | 64 | 256 | NVIDIA A10 * 8 | 24GB * 8 | 32 | 1200萬 | 32 | 8 | 30 | 30 |
ecs.gn7i-2x.8xlarge、ecs.gn7i-4x.8xlarge、ecs.gn7i-4x.16xlarge、ecs.gn7i-8x.32xlarge以及ecs.gn7i-8x.16xlarge執行個體規格支援更改為ecs.gn7i-c8g1.2xlarge或ecs.gn7i-c16g1.4xlarge執行個體規格,但不支援更改為ecs.gn7i-c32g1.8xlarge等其他執行個體規格。
GPU計算型執行個體規格類型系列gn7s
如需使用gn7s,請提交工單申請。
規格類型系列介紹:
採用全新的Intel IceLake處理器,同時搭載Nvidia Ampere架構的NVIDIA A30 GPU卡,您可以根據需要選擇不同卡數和不同CPU資源的規格,靈活適應不同的AI業務需求。
基於阿里雲全新的第三代神龍架構,VPC和雲端硬碟網路頻寬相比上一代平均提升一倍。
適用情境:配備高效能CPU、記憶體、GPU,可以處理更多並發AI推理業務需求,適用於Image Recognition、語音辨識、行為識別業務。
計算:
採用NVIDIA A30 GPU卡。
創新的Nvidia Ampere架構。
支援MIG(Multi-Instance GPU)功能、加速功能(基於第二代Tensor Cores加速),提供多種業務支援。
處理器:2.9 GHz主頻的Intel ® Xeon ® 可擴充處理器(Ice Lake),全核睿頻3.5 GHz。
容量記憶體相比上一代執行個體規格類型系列大幅提升。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟和ESSD AutoPL雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn7s包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 | 多隊列 | 彈性網卡 |
ecs.gn7s-c8g1.2xlarge | 8 | 60 | NVIDIA A30 * 1 | 24GB * 1 | 16 | 600萬 | 5 | 1 | 12 | 8 |
ecs.gn7s-c16g1.4xlarge | 16 | 120 | NVIDIA A30 * 1 | 24GB * 1 | 16 | 600萬 | 5 | 1 | 12 | 8 |
ecs.gn7s-c32g1.8xlarge | 32 | 250 | NVIDIA A30 * 1 | 24GB * 1 | 16 | 600萬 | 5 | 1 | 12 | 8 |
ecs.gn7s-c32g1.16xlarge | 64 | 500 | NVIDIA A30 * 2 | 24GB * 2 | 32 | 1200萬 | 5 | 1 | 16 | 15 |
ecs.gn7s-c32g1.32xlarge | 128 | 1000 | NVIDIA A30 * 4 | 24GB * 4 | 64 | 2400萬 | 10 | 1 | 32 | 15 |
ecs.gn7s-c48g1.12xlarge | 48 | 380 | NVIDIA A30 * 1 | 24GB * 1 | 16 | 600萬 | 8 | 1 | 12 | 8 |
ecs.gn7s-c56g1.14xlarge | 56 | 440 | NVIDIA A30 * 1 | 24GB * 1 | 16 | 600萬 | 8 | 1 | 12 | 8 |
GPU計算型執行個體規格類型系列gn7
適用情境:
深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練應用。
高GPU負載的科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟和ESSD AutoPL雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn7包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.gn7-c12g1.3xlarge | 12 | 94 | 40GB * 1 | 4 | 250萬 | 4 | 8 | 10 | 1 |
ecs.gn7-c13g1.13xlarge | 52 | 378 | 40GB * 4 | 16 | 900萬 | 16 | 8 | 30 | 30 |
ecs.gn7-c13g1.26xlarge | 104 | 756 | 40GB * 8 | 30 | 1800萬 | 16 | 15 | 10 | 1 |
GPU計算型執行個體規格類型系列gn6i
適用情境:
AI(DL和ML)推理,適合電腦視覺、語音辨識、語音合成、NLP、機器翻譯、推薦系統。
雲遊戲雲端即時渲染。
AR和VR的雲端即時渲染。
重載圖形計算或圖形工作站。
GPU加速資料庫。
高效能運算。
計算:
GPU加速器:T4 。
創新的Turing架構。
單GPU顯存16 GB(GPU顯存頻寬320 GB/s)。
單GPU 2560個CUDA Cores。
單GPU多達320個Turing Tensor Cores。
可變精度Tensor Cores支援65 TFlops FP16、130 INT8 TOPS、260 INT4 TOPS。
處理器與記憶體配比約為1:4。
處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟、ESSD AutoPL雲端硬碟、SSD雲端硬碟和高效雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn6i包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 雲端硬碟基礎IOPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.gn6i-c4g1.xlarge | 4 | 15 | NVIDIA T4 * 1 | 16GB * 1 | 4 | 50萬 | 無 | 2 | 2 | 10 | 1 |
ecs.gn6i-c8g1.2xlarge | 8 | 31 | NVIDIA T4 * 1 | 16GB * 1 | 5 | 80萬 | 無 | 2 | 2 | 10 | 1 |
ecs.gn6i-c16g1.4xlarge | 16 | 62 | NVIDIA T4 * 1 | 16GB * 1 | 6 | 100萬 | 無 | 4 | 3 | 10 | 1 |
ecs.gn6i-c24g1.6xlarge | 24 | 93 | NVIDIA T4 * 1 | 16GB * 1 | 7.5 | 120萬 | 無 | 6 | 4 | 10 | 1 |
ecs.gn6i-c40g1.10xlarge | 40 | 155 | NVIDIA T4 * 1 | 16GB * 1 | 10 | 160萬 | 無 | 16 | 10 | 10 | 1 |
ecs.gn6i-c24g1.12xlarge | 48 | 186 | NVIDIA T4 * 2 | 16GB * 2 | 15 | 240萬 | 無 | 12 | 6 | 10 | 1 |
ecs.gn6i-c24g1.24xlarge | 96 | 372 | NVIDIA T4 * 4 | 16GB * 4 | 30 | 480萬 | 25萬 | 24 | 8 | 10 | 1 |
GPU計算型執行個體規格類型系列gn6e
適用情境:
深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練、推理應用。
科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。
計算:
採用NVIDIA V100(32 GB NVLink)GPU卡。
GPU加速器:V100(SXM2封裝)。
創新的Volta架構。
單GPU顯存32 GB HBM2(GPU顯存頻寬900 GB/s)。
單GPU 5120個CUDA Cores。
單GPU 640個Tensor Cores。
單GPU支援6個NVLink鏈路(NVLink屬於雙向鏈路),單向鏈路的頻寬為25 Gbit/s,總頻寬為6×25×2=300 Gbit/s。
處理器與記憶體配比約為1:8。
處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟、ESSD AutoPL雲端硬碟、SSD雲端硬碟和高效雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn6e包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.gn6e-c12g1.3xlarge | 12 | 92 | NVIDIA V100 * 1 | 32GB * 1 | 5 | 80萬 | 8 | 6 | 10 | 1 |
ecs.gn6e-c12g1.6xlarge | 24 | 182 | NVIDIA V100 * 2 | 32GB * 2 | 8 | 120萬 | 8 | 8 | 20 | 1 |
ecs.gn6e-c12g1.12xlarge | 48 | 368 | NVIDIA V100 * 4 | 32GB * 4 | 16 | 240萬 | 8 | 8 | 20 | 1 |
ecs.gn6e-c12g1.24xlarge | 96 | 736 | NVIDIA V100 * 8 | 32GB * 8 | 32 | 480萬 | 16 | 8 | 20 | 1 |
GPU計算型執行個體規格類型系列gn6v
適用情境:
深度學習,例如映像分類、無人駕駛、語音辨識等人工智慧演算法的訓練、推理應用。
科學計算,例如計算流體動力學、計算金融學、分子動力學、環境分析等。
計算:
採用NVIDIA V100 GPU卡。
GPU加速器:V100(SXM2封裝) 。
創新的Volta架構。
單GPU顯存16 GB HBM2(GPU顯存頻寬900 GB/s)。
單GPU 5120個CUDA Cores。
單GPU 640個Tensor Cores。
單GPU支援6個NVLink鏈路(NVLink屬於雙向鏈路),單向鏈路的頻寬為25 Git/s,總頻寬為6×25×2=300 Git/s。
處理器與記憶體配比約為1:4。
處理器:2.5 GHz主頻的Intel ® Xeon ® Platinum 8163(Skylake)。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:ESSD雲端硬碟、ESSD AutoPL雲端硬碟、SSD雲端硬碟和高效雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn6v包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 雲端硬碟基礎IOPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.gn6v-c8g1.2xlarge | 8 | 32 | NVIDIA V100 * 1 | 16GB * 1 | 2.5 | 80萬 | 無 | 4 | 4 | 10 | 1 |
ecs.gn6v-c8g1.4xlarge | 16 | 64 | NVIDIA V100 * 2 | 16GB * 2 | 5 | 100萬 | 無 | 4 | 8 | 20 | 1 |
ecs.gn6v-c8g1.8xlarge | 32 | 128 | NVIDIA V100 * 4 | 16GB * 4 | 10 | 200萬 | 無 | 8 | 8 | 20 | 1 |
ecs.gn6v-c8g1.16xlarge | 64 | 256 | NVIDIA V100 * 8 | 16GB * 8 | 20 | 250萬 | 無 | 16 | 8 | 20 | 1 |
ecs.gn6v-c10g1.20xlarge | 82 | 336 | NVIDIA V100 * 8 | 16GB * 8 | 32 | 450萬 | 25萬 | 16 | 8 | 20 | 1 |
GPU計算型執行個體規格類型系列gn5
適用情境:
深度學習。
科學計算,例如計算流體動力學、計算金融學、基因體學研究、環境分析。
高效能運算、渲染、多媒體編解碼及其他伺服器端GPU計算工作負載。
計算:
採用NVIDIA P100 GPU卡。
多種處理器與記憶體配比。
處理器:2.5 GHz主頻的Intel ® Xeon ® E5-2682 v4(Broadwell)。
儲存:
配備高效能NVMe SSD本地碟。
I/O最佳化執行個體。
支援的雲端硬碟類型:SSD雲端硬碟和高效雲端硬碟。
網路:
僅支援IPv4
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn5包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | 本機存放區(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 |
ecs.gn5-c4g1.xlarge | 4 | 30 | 440 | NVIDIA P100 * 1 | 16GB * 1 | 3 | 30萬 | 1 | 3 | 10 |
ecs.gn5-c8g1.2xlarge | 8 | 60 | 440 | NVIDIA P100 * 1 | 16GB * 1 | 3 | 40萬 | 1 | 4 | 10 |
ecs.gn5-c4g1.2xlarge | 8 | 60 | 880 | NVIDIA P100 * 2 | 16GB * 2 | 5 | 100萬 | 2 | 4 | 10 |
ecs.gn5-c8g1.4xlarge | 16 | 120 | 880 | NVIDIA P100 * 2 | 16GB * 2 | 5 | 100萬 | 4 | 8 | 20 |
ecs.gn5-c28g1.7xlarge | 28 | 112 | 440 | NVIDIA P100 * 1 | 16GB * 1 | 5 | 100萬 | 8 | 8 | 20 |
ecs.gn5-c8g1.8xlarge | 32 | 240 | 1760 | NVIDIA P100 * 4 | 16GB * 4 | 10 | 200萬 | 8 | 8 | 20 |
ecs.gn5-c28g1.14xlarge | 56 | 224 | 880 | NVIDIA P100 * 2 | 16GB * 2 | 10 | 200萬 | 14 | 8 | 20 |
ecs.gn5-c8g1.14xlarge | 54 | 480 | 3520 | NVIDIA P100 * 8 | 16GB * 8 | 25 | 400萬 | 14 | 8 | 20 |
GPU計算型執行個體規格類型系列gn5i
適用情境: 深度學習推理、多媒體編解碼等伺服器端GPU計算工作負載。
計算:
採用NVIDIA P4 GPU卡。
處理器與記憶體配比為1:4。
處理器:2.5 GHz主頻的Intel ® Xeon ® E5-2682 v4(Broadwell)。
儲存:
I/O最佳化執行個體。
支援的雲端硬碟類型:SSD雲端硬碟和高效雲端硬碟。
網路:
支援IPv4、IPv6。關於IPv6通訊,參見IPv6通訊。
執行個體網路效能與執行個體規格對應,規格越高網路效能越強。
gn5i包括的執行個體規格及指標資料如下表所示:
執行個體規格 | vCPU | 記憶體(GiB) | GPU | GPU顯存 | 網路基礎頻寬(Gbit/s) | 網路收發包PPS | 多隊列 | 彈性網卡 | 單網卡私人IPv4地址數 | 單網卡IPv6地址數 |
ecs.gn5i-c2g1.large | 2 | 8 | NVIDIA P4 * 1 | 8GB * 1 | 1 | 10萬 | 2 | 2 | 6 | 1 |
ecs.gn5i-c4g1.xlarge | 4 | 16 | NVIDIA P4 * 1 | 8GB * 1 | 1.5 | 20萬 | 2 | 3 | 10 | 1 |
ecs.gn5i-c8g1.2xlarge | 8 | 32 | NVIDIA P4 * 1 | 8GB * 1 | 2 | 40萬 | 4 | 4 | 10 | 1 |
ecs.gn5i-c16g1.4xlarge | 16 | 64 | NVIDIA P4 * 1 | 8GB * 1 | 3 | 80萬 | 4 | 8 | 20 | 1 |
ecs.gn5i-c16g1.8xlarge | 32 | 128 | NVIDIA P4 * 2 | 8GB * 2 | 6 | 120萬 | 8 | 8 | 20 | 1 |
ecs.gn5i-c28g1.14xlarge | 56 | 224 | NVIDIA P4 * 2 | 8GB * 2 | 10 | 200萬 | 14 | 8 | 20 | 1 |