GPU執行個體在大規模並行計算或者圖形渲染情境下,具有較強的計算能力和圖形處理能力。使用GPU執行個體可以為您的業務提供更好的計算效能或者滿足專業級圖形設計需求,本文為您介紹如何建立GPU執行個體。
操作步驟
配置項說明
付費類型
付費類型影響執行個體的計費和收費規則,不同付費類型的執行個體遵循的資源狀態變化規則也存在差異。
付費類型 | 說明 | 相關文檔 |
訂用帳戶 | 先付費後使用。 | |
隨用隨付 | 先使用後付費,計費周期精確到秒,方便您按需購買和釋放資源。 說明 推薦搭配使用節省計劃、預留執行個體券最佳化成本。 | |
搶佔式執行個體 | 先使用後付費,相對於隨用隨付執行個體價格有一定的折扣,但可能因市場價格變化或執行個體規格庫存不足而自動釋放執行個體。 |
地區
地區指資料中心所在的地理地區,選擇距離近的地區可以降低網路時延,執行個體建立完成後不支援更改地區。更多資訊,請參見地區和可用性區域。
網路及可用性區域
推薦您使用專用網路,專用網路之間邏輯上徹底隔離,安全性更高,且支援Elastic IP Address(EIP)、彈性網卡、IPv6等功能。
可用性區域是指在同一地區內,電源和網路互相獨立的物理地區。同一可用性區域內執行個體之間的網路延時更小,其使用者訪問速度更快。
網路類型 | 說明 | 相關文檔 |
專用網絡 | 專用網路是您在阿里雲自己定義的一個隔離網路環境,您可以完全掌控自己的專用網路,例如選擇IP位址範圍、配置路由表和網關等。 如果在建立執行個體時不需要自訂專用網路配置,您可以跳過本步驟,系統會自動建立預設專用網路和交換器。 選擇已有的專用網路和交換器,或者單擊建立專有網路、建立交換器前往專用網路控制台即時建立專用網路和交換器。建立完成後,返回ECS執行個體建立嚮導並單擊表徵圖,查看專用網路和交換器列表。 說明 如果您需要為執行個體分配IPv6地址,請選擇已開通IPv6網段的專用網路和交換器。 | |
經典網絡 | 傳統網路類型的執行個體統一部署在阿里雲公用基礎設施內,規劃和管理由阿里雲負責。 說明 如果您是在2016年6月16日12:00(UTC+8)以後第一次購買ECS執行個體,不能再選擇傳統網路。 |
執行個體和鏡像
執行個體規格和鏡像定義了一台執行個體的基本屬性:vCPU、記憶體和作業系統等基礎資源。
執行個體規格
可選的執行個體規格和地區等因素有關,您可以前往ECS執行個體可購買地區查看執行個體的可購情況。
如果您有特定的配置需求,例如需要掛載多張彈性網卡、使用ESSD雲端硬碟、使用本地碟等,請確認執行個體規格是否支援。關於執行個體規格的特點、適用情境、指標資料等資訊,請參見執行個體規格類型系列。
如果選擇付費類型為搶佔式實例,配置使用時間長度和上限價格。
執行個體使用時間長度:使用時間長度指搶佔式執行個體的保護期,超出保護期後可能因市場價格變化或執行個體規格庫存不足而自動釋放執行個體。
執行個體使用時間長度
說明
設定執行個體使用1小時
搶佔式執行個體建立後有1小時保護期,在保護期內不會被自動釋放。
無確定使用時間長度
搶佔式執行個體建立後沒有保護期,但比有保護期的搶佔式執行個體更優惠。
單台執行個體上限價格:
單台執行個體上限價格
說明
使用自動出價
始終使用執行個體規格的即時市場價格,該市場價格不會超過對應隨用隨付執行個體的價格。使用自動出價可以避免搶佔式執行個體因即時市場價格超過上限被自動釋放,但不能避免因執行個體規格的庫存不足被自動釋放。
設定單台上限價
自行輸入明確的價格上限,執行個體規格的即時市場價格超出該上限或者庫存不足時,搶佔式執行個體都會被自動釋放。
完成執行個體配置後,您可以在當前選擇後確認所選執行個體規格資訊。
鏡像
鏡像提供了運行執行個體所需的資訊,阿里雲提供多種鏡像來源供您方便地擷取鏡像,如下表所示。
鏡像來源 | 說明 |
阿里雲官方提供的基礎鏡像,均已獲得正版授權,涵蓋Windows Server系統鏡像和主流的Linux系統鏡像。 | |
您自行建立或匯入的鏡像,包含了初始系統內容、應用環境、軟體配置等資訊,可以節省重複配置的時間。 | |
其他阿里雲帳號共用的自訂鏡像,方便跨帳號使用同一鏡像建立執行個體。 | |
雲市場鏡像中的鏡像均經過嚴格審核,種類豐富,方便您一鍵部署用於建站、應用開發等情境的雲端服務器。 | |
社區鏡像是一種完全公開的鏡像。您可以將製作好的自訂鏡像發布為社區鏡像供他人使用,也可以擷取並使用他人發布的社區鏡像。 |
選擇鏡像時,您可以根據實際需要選擇是否自動安裝NVIDIA Tesla驅動,或者是否選擇已預裝NVIDIA GRID驅動的免費鏡像來同步載入相應驅動。更多資訊,請參見建立GPU執行個體時自動安裝或載入Tesla驅動和通過預裝驅動的雲市場鏡像社區鏡像載入GRID驅動。
儲存
執行個體通過添加系統硬碟、資料盤和共用盤NAS獲得儲存能力,Elastic Compute Service提供了雲端硬碟和本地碟滿足不同情境的需求。
系統硬碟
系統硬碟用於安裝作業系統,預設容量為40 GiB,但實際可設定的最低容量和鏡像類型有關,如下表所示。
鏡像 | 系統硬碟容量範圍(GiB) |
Linux(不包括FreeBSD和Red Hat) | [max{20, 鏡像檔案大小}, 2048] |
FreeBSD | [max{30, 鏡像檔案大小}, 2048] |
Red Hat | [max{40, 鏡像檔案大小}, 2048] |
Windows | [max{40, 鏡像檔案大小}, 2048] |
(可選)資料盤
資料盤用於儲存應用資料,選擇資料盤時,您還可以加密雲端硬碟滿足資料安全或法規合規等情境的要求。關於資料加密的介紹,請參見加密雲端硬碟。
單台執行個體支援掛載的資料盤存在數量限制。更多資訊,請參見Block Storage使用限制。
(可選)快照服務
快照是雲端硬碟在某一時間點資料狀態的備份檔案,用快照建立雲端硬碟便於快速匯入資料。建立執行個體時即可為雲端硬碟開啟自動備份,有效應對資料誤刪等風險。
選擇已有的自動快照策略,或者單擊建立自動快照策略前往快照頁面即時建立自動快照策略。具體操作,請參見建立自動快照策略。建立完成後,返回ECS執行個體建立嚮導並單擊表徵圖,查看自動快照策略列表。
使用快照會產生費用,更多詳情,請參見快照計費。
(可選)共用盤NAS
如果您有較多資料需要供多台執行個體共用訪問,推薦使用NAS檔案系統,可以節約大量拷貝與同步成本。
選擇已有的NAS檔案系統,或者單擊建立新NAS檔案系統前往NAS檔案系統控制台即時建立NAS檔案系統。具體操作,請參見通過控制台建立通用型NAS檔案系統。建立完成後,返回ECS執行個體建立嚮導並單擊表徵圖,查看NAS檔案系統列表。關於掛載NAS檔案系統時的注意事項,請參見新購ECS時掛載NAS檔案系統。
頻寬和安全性群組
網路和安全性群組配置提供了公網以及與其他阿里雲資源通訊的能力,並保障了執行個體在網路中的安全。
(條件必選)公網IP
如果執行個體需要進行公網通訊,必須分配公網IP。您可以在建立執行個體時選擇自動分配一個固定公網IP,或者在建立執行個體後自行配置,通過EIP、NAT Gateway等方式進行公網通訊。EIP、NAT Gateway需要自行購買,更多資訊,請參見什麼是彈性公網 IP和什麼是NAT Gateway。
選中分配公網 IPv4 地址,設定頻寬計費模式和頻寬值或頻寬峰值。
關於公網頻寬計費的詳細規則,請參見公網頻寬計費。
頻寬計費模式 | 說明 |
按固定寬頻 | 按指定的頻寬值收費,實際的出網頻寬不會高於指定的頻寬值。
|
按使用流量 | 按實際產生的網路頻寬流量收費。為避免產生高額的頻寬流量費,可先設定出網頻寬峰值。
(可選):選中升級至CDT計費。CDT以靈活計費、提供免費流量、階梯價格優惠及多產品統一計費等優勢,為公網頻寬費用管理提供高效經濟的解決方案。相對於隨用隨付,有一定的折扣優惠。更多資訊,請參見什麼是雲資料轉送CDT。 重要
|
安全性群組
安全性群組是一種虛擬防火牆,用於控制安全性群組內執行個體的入流量和出流量。更多資訊,請參見安全性群組概述。
當選擇的VPC下沒有安全性群組時,系統會自動建立預設安全性群組。預設安全性群組入方向允許存取22連接埠、3389連接埠及ICMP協議,在建立完成後您可以修改安全性群組配置。
您也可以根據業務需要,選擇已有安全性群組或新建安全性群組,建立安全性群組時,需配置安全性群組名稱、安全性群組類型、開通IPv4連接埠/協議。
關於安全性群組各項配置的詳細說明,請參見建立安全性群組。
(可選)彈性網卡
彈性網卡分為主網卡和輔助網卡。主網卡不支援從執行個體解除綁定,只能隨執行個體一起建立和釋放。輔助網卡支援自由綁定至執行個體和從執行個體解除綁定,方便您在執行個體之間切換網路流量。如需隨執行個體一起建立輔助網卡,請單擊表徵圖,然後選擇輔助網卡所屬的交換器。
建立執行個體時只能添加1塊輔助網卡,您也可以在執行個體建立完成後單獨建立輔助網卡並綁定至執行個體。關於各執行個體規格支援綁定的彈性網卡的數量,請參見執行個體規格類型系列。
(可選)配置IPv6
開通了IPv6後,IPv6的地址數量不僅能解決網路地址資源數量的問題,而且也解決了多種接入裝置連入互連網的障礙。
選中免費分配 IPv6 地址。分配IPv6地址後,您需要登入執行個體並在作業系統內部進行IPv6地址相關的配置,才能正常使用IPv6地址。具體操作,請參見管理IPv6地址。
管理設定
管理設定包括登入憑證和標籤,用於遠端連線執行個體和方便地檢索和管理資源。
登入憑證
登入憑證用於安全地登入執行個體,關於執行個體串連方式的介紹,請參見ECS遠端連線方式概述。
登入憑證 | 說明 |
金鑰組 說明 僅Linux執行個體支援使用金鑰組登入認證。 | 選擇登入執行個體的使用者名稱和已有的金鑰組,或者單擊建立金鑰組即時建立金鑰組。建立完成後,返回ECS執行個體建立嚮導並單擊表徵圖,查看金鑰組列表。具體操作,請參見建立SSH金鑰組。 使用者名稱支援設定為root或ecs-user。 警告 root具有作業系統的最高許可權,使用root作為使用者名稱可能會導致安全風險,建議您使用普通使用者ecs-user作為使用者名稱。 |
使用鏡像預設密碼 說明 僅自訂鏡像和共用鏡像支援此認證方式。 | 可以直接使用所選鏡像的預設密碼進行登入認證。為了保證您的正常使用,請確保所選鏡像中已經設定了密碼。 |
自訂密碼 | 輸入並確認密碼。使用登入名稱和密碼登入執行個體時,使用者名稱資訊如下:
|
在建立後設定 | 在執行個體建立完成後,自行綁定金鑰組或者重設執行個體密碼。具體操作,請參見綁定SSH金鑰組和重設執行個體登入密碼。 |
標籤
標籤由一對索引值(Key-Value)組成。使用標籤標識具有相同特徵的資源後,例如所屬組織或用途相同的資源,您可以基於標籤方便地檢索和管理資源。更多資訊,請參見標籤。
選擇已有的標籤,或者填寫標籤鍵和標籤值即時建立標籤。
(可選)進階選項
進階選項包括主機名稱、執行個體中繼資料、執行個體自訂資料等,用於定製執行個體在控制台和作業系統內顯示的資訊或使用方式。
參數 | 說明 |
實例名稱、說明、主機名稱、有序尾碼 | 建立多台執行個體時,設定有序的執行個體名稱和主機名稱便於從名稱瞭解執行個體的批次等資訊。關於設定有序名稱的規則,請參見大量設定有序的執行個體名稱或主機名稱。 |
實例 RAM 角色 | 執行個體通過執行個體RAM角色獲得該角色擁有的許可權,可以基於臨時安全性權杖STS(Security Token Service)訪問指定雲端服務的API和操作指定的雲資源,安全性更高。 選擇已有的執行個體RAM角色,或者單擊建立執行個體RAM角色前往RAM控制台即時建立執行個體RAM角色。建立完成後,返回ECS執行個體建立嚮導並單擊按鈕,查看執行個體RAM角色列表。具體操作,請參見建立執行個體RAM角色並為角色授予許可權。 |
中繼資料訪問模式 | 執行個體中繼資料(metadata)包含了執行個體在阿里雲系統中的資訊,您可以在運行中的執行個體內方便地查看執行個體中繼資料,並基於執行個體中繼資料配置或管理執行個體。關於如何查看執行個體中繼資料,請參見執行個體中繼資料。 |
自訂資料 | 執行個體自訂資料可以作為執行個體自訂指令碼在啟動執行個體時執行,實現自動化配置執行個體,或者僅作為普通資料傳入執行個體。更多資訊,請參見執行個體自訂資料。 如果在鏡像地區未選中安裝GPU驅動選項,且您對驅動安裝自動安裝指令碼比較熟悉,您可以在自訂資料地區輸入自動安裝指令碼來安裝NVIDIA Tesla驅動。具體操作,請參見通過自動安裝指令碼方式安裝驅動。 說明 在輸入框中輸入您準備的執行個體自訂資料,如果執行個體自訂資料已進行Base64編碼,請選中輸入已採用 Base64 編碼。 |
資源組 | 資源群組供您從業務角度管理跨地區、跨產品的資源,並支援針對資源群組系統管理權限。更多資訊,請參見資源群組。 選擇已有的資源群組,或者單擊建立資源群組前往資源管理主控台即時建立資源群組。建立完成後,返回ECS執行個體建立嚮導並單擊按鈕,查看資源群組列表。具體操作,請參見建立資源群組。 |
部署集 | 部署集支援高可用策略,部署集內執行個體會嚴格分散在不同的物理伺服器上,保證業務的高可用性和底層容災能力。 選擇已有的部署集,或者單擊管理部署集即時建立部署集。建立完成後,返回ECS執行個體建立嚮導並單擊按鈕,查看部署集列表。具體操作,請參見建立部署集。 |
專用宿主機 | Dedicated Host是一台由單租戶獨享實體資源的雲主機,具有滿足嚴格的安全合規要求、允許自備授權證(BYOL)上雲等優勢。 選擇已有的Dedicated Host,或者單擊建立Dedicated Host即時建立Dedicated Host。建立完成後,返回ECS執行個體建立嚮導並單擊按鈕,查看Dedicated Host列表。具體操作,請參見建立DDH。 |
私人池類型 | 建立彈性保障或容量預定後,系統會自動產生私人池,預留特定屬性特定數量的執行個體。從關聯的私人池中建立這一類執行個體,可以提供資源確定性保障。更多資訊,請參見資源管家概述。 說明 彈性保障和容量預定僅支援為隨用隨付執行個體保障資源供應確定性。
|
後續步驟
串連執行個體
支援通過多種方式串連執行個體,包括Workbench、VNC和第三方用戶端工具。更多資訊,請參見ECS遠端連線方式概述。
安裝驅動
如果建立GPU執行個體時未同時自動安裝Tesla或GRID驅動,您還需要根據實際業務情境安裝與該GPU執行個體匹配的Tesla或GRID驅動,才能正常使用GPU執行個體的高效能特性。更多資訊,請參見Tesla或GRID驅動安裝指引。
相關文檔
如果您需要通過API方式建立GPU執行個體,請參見RunInstances或CreateInstance。
如果您需要對已建立執行個體進行啟用、休眠、重啟、釋放或者停止等操作,請參見管理GPU執行個體。
在GPU執行個體上部署NGC環境後,開發人員可即時訪問最佳化後的深度學習架構,極大程度縮減產品開發以及業務部署時間。更多資訊,請參見在GPU執行個體上部署NGC環境。
如果在使用GPU時遇到的一些功能類或操作類問題,如何排查或解決,請參見GPU雲端服務器常見問題。