GPU伺服器 - Elastic GPU Service

GPU雲端服務器提供了GPU加速計算能力，實現GPU計算資源的即開即用和Auto Scaling。作為阿里雲彈性計算家族的一員，其結合了GPU計算力與CPU計算力，滿足您在人工智慧、高效能運算、專業圖形影像處理等情境中的需求，例如，在並行運算方面，使用GPU雲端服務器可顯著提高計算效率。

為什麼選擇GPU雲端服務器

阿里雲GPU雲端服務器是基於GPU與CPU應用的計算服務器。GPU在執行複雜的數學和幾何計算方面有著獨特的優勢，特別是在浮點運算、並行運算等方面，GPU可以提供比CPU高百倍的計算能力。GPU的功能特性如下：

擁有大量擅長處理大規模並發計算的算數邏輯單位（Arithmetic and Logic Unit，即ALU）。
能夠支援多線程並行的高輸送量運算。
邏輯控制單元相對簡單。

下表為您介紹GPU雲端服務器與自建GPU伺服器的區別。

對比項	GPU雲端服務器	GPU自建伺服器
靈活性	能夠快速開通一台或多台GPU雲端服務器執行個體。執行個體規格（vCPU、記憶體及GPU）支援靈活變更，並且支援線上升降配。頻寬升降自由。	伺服器購買周期長。伺服器規格固定，無法靈活變更。頻寬一次性購買，無法自由升降。
易用性	Web線上管理，簡單方便。內建主流的作業系統，Windows正版啟用，且支援線上更換作業系統。 GPU驅動可以在購買時一併安裝，方便快捷。	沒有線上管理工具，維護困難。需使用者自備作業系統，自行安裝及更換。 GPU驅動需要自行購買安裝。
容災備份	三副本資料設計，單份損壞可在短時間內快速恢複。硬體故障事故中可快速自動回復。	使用者自行搭建，使用普通存放裝置，價格高昂。資料損毀需使用者修複。
安全性	能夠有效阻止MAC欺騙和ARP攻擊。並防護DDoS攻擊，可進行流量清洗和黑洞。享有連接埠入侵掃描、掛馬掃描、漏洞掃描等附加服務。	很難阻止MAC欺騙和ARP攻擊。清洗和黑洞裝置需要另外購買，價格昂貴。普遍存在漏洞掛馬和連接埠掃描等問題。
成本	支援訂用帳戶及隨用隨付兩種購買方式，可靈活選擇適合您業務情境的付費方式。按需購買，無需一次性大量投入。	無法按需購買，必須為業務峰值滿配。一次性投入巨大，閑置浪費嚴重。

GPU執行個體規格類型系列

執行個體是能夠為您的業務提供計算服務的最小單位，不同的執行個體規格可以提供的計算能力也不同。根據業務情境和使用情境，ECS執行個體可以分為多種執行個體規格類型系列。GPU執行個體屬於ECS執行個體中的一類執行個體規格，GPU執行個體在提供GPU加速能力的同時，保留了與普通ECS執行個體一致的使用體驗。在建立ECS執行個體時，請選擇企業級異構運算規格類型系列、ECS Bare Metal Instance和Super Computing Cluster（SCC）執行個體規格類型系列下的GPU執行個體規格即可。

關於GPU執行個體規格的更多資訊，請參見執行個體規格類型系列。

產品優勢

覆蓋範圍廣闊
阿里雲GPU雲端服務器在全球多個地區實現規模部署，覆蓋範圍廣，結合彈性供應、Auto Scaling等交付方式，能夠很好地滿足您業務的突發需求。
計算能力超強
阿里雲GPU雲端服務器配備業界超強算力的GPU計算卡，結合高效能CPU平台，單一實例可提供高達1000 TFLOPS的混合精度計算效能。
網路效能出色
阿里雲GPU雲端服務器執行個體的VPC網路最大支援450萬的PPS及32 Gbit/s的內網頻寬。在此基礎上，Super Computing Cluster產品中，節點間額外提供高達50 Gbit/s的RDMA網路，滿足節點間資料轉送的低延時高頻寬要求。
購買方式靈活
支援靈活的資源付費模式，包括訂用帳戶、隨用隨付、搶佔式執行個體、預留執行個體券、儲存容量單位包。您可以按需要購買，避免資源浪費。

同時，阿里雲也提供了神行工具包搭配GPU雲端服務器一起使用，神行工具包具有GPU計算服務增強能力，可以協助您更方便、更高效地使用阿里雲的雲上GPU資源。更多資訊，請參見神行工具包優勢。

產品計費

GPU雲端服務器的計費相關功能和Elastic Compute Service一致，其中，計算資源（vCPU、記憶體以及GPU）、鏡像、Block Storage、公網頻寬以及快照等資源涉及計費。

常見的計費方式如下所示：

訂用帳戶：按一定時間長度購買資源，先付費後使用。
隨用隨付：按需開通和釋放資源，先使用後付費。
搶佔式執行個體：通過競價模式搶佔庫存充足的計算資源，相對隨用隨付執行個體有一定的折扣，但是存在回收機制。
預留執行個體券：搭配隨用隨付執行個體使用的抵扣券，承諾使用指定配置的執行個體（包括執行個體規格、地區和可用性區域等），以折扣價抵扣計算資源的賬單。
節省計劃：搭配隨用隨付執行個體使用的折扣權益計劃，承諾使用穩定數量的資源（以元/小時為單位衡量），以折扣價抵扣計算資源、系統硬碟等資源的賬單。
儲存容量單位包：搭配隨用隨付儲存產品使用的資源套件，承諾使用指定容量的儲存資源，以折扣價抵扣Block Storage、NAS、OSS等資源的賬單。

關於GPU雲端服務器計費的更多介紹，請參見GPU雲端服務器計費。

關聯工具包

阿里雲提供神行工具包供您更高效地使用GPU資源，神行工具包中的組件主要包括以下工具：

說明

關於神行工具包的更多資訊，請參見什麼是神行工具包（DeepGPU）。

工具名稱	說明
GPU容器共用技術cGPU	阿里雲基於核心虛擬GPU隔離的容器共用技術，隔離GPU資源，實現多個容器共用一張顯卡。
叢集極速部署工具FastGPU	阿里雲推出的人工智慧計算任務構建工具，提供便捷的介面和命令列，供您在阿里雲IaaS資源上構建人工智慧計算任務。

對比項	GPU雲端服務器	GPU自建伺服器
靈活性	能夠快速開通一台或多台GPU雲端服務器執行個體。執行個體規格（vCPU、記憶體及GPU）支援靈活變更，並且支援線上升降配。頻寬升降自由。	伺服器購買周期長。伺服器規格固定，無法靈活變更。頻寬一次性購買，無法自由升降。
易用性	Web線上管理，簡單方便。內建主流的作業系統，Windows正版啟用，且支援線上更換作業系統。 GPU驅動可以在購買時一併安裝，方便快捷。	沒有線上管理工具，維護困難。需使用者自備作業系統，自行安裝及更換。 GPU驅動需要自行購買安裝。
容災備份	三副本資料設計，單份損壞可在短時間內快速恢複。硬體故障事故中可快速自動回復。	使用者自行搭建，使用普通存放裝置，價格高昂。資料損毀需使用者修複。
安全性	能夠有效阻止MAC欺騙和ARP攻擊。並防護DDoS攻擊，可進行流量清洗和黑洞。享有連接埠入侵掃描、掛馬掃描、漏洞掃描等附加服務。	很難阻止MAC欺騙和ARP攻擊。清洗和黑洞裝置需要另外購買，價格昂貴。普遍存在漏洞掛馬和連接埠掃描等問題。
成本	支援訂用帳戶及隨用隨付兩種購買方式，可靈活選擇適合您業務情境的付費方式。按需購買，無需一次性大量投入。	無法按需購買，必須為業務峰值滿配。一次性投入巨大，閑置浪費嚴重。