本文介紹Elastic Compute Service的成本構成和優勢,並提供成本管理的推薦方案,協助您通過成本管理節約成本,在保障業務快速發展的同時按照預算支出費用,獲得最大成本收益。
成本構成
傳統企業IT基礎設施的成本構成情況,即總擁有成本TCO(Total Cost of Ownership),包括從產品採購到後期使用、維護的成本。您在評估IT基礎設施的時,實際評估的指標就是每單位IT基礎設施的TCO。對於TCO的核算需要基於您真實的業務部署環境變數,例如機櫃租金、機櫃使用電費、伺服器品牌及價格、是否考慮規避單點失效可能性(雙裝置、雙上蓮)等一系列前提條件下,得出TCO=伺服器+網路+IDC支出+其他開銷(人力、公網、額外稅費等)。
在這四大類IDC成本構成中,伺服器採購和網路建設部分都屬於資本性支出(CAPEX),需要您的企業採購後按照一定的周期進行折舊分攤,剩餘的IDC支出(租金和電費等)及其他開銷大多數屬於營運成本(OPEX),根據資源使用的時間而持續地產生投入。從企業經營的角度來看,CAPEX一次性投入較大,業務不確定性較強,一次性投入後可再次進行調整的空間有限,如果發生需求變動,可能會導致已經支出的成本浪費。而OPEX支出穩定,比較適合應對業務調整而隨機應變,如果能將企業的CAPEX全部轉換為OPEX,則是企業面對不確定需求的更優解決方案。
Elastic Compute Service作為阿里雲為您提供的雲端運算服務,為您提供雲上計算資源,使用Elastic Compute Service替代掉您的傳統IT基礎設施,可以協助您降低CAPEX,提高OPEX佔比。一方面可以改善您企業的現金流狀況,另一方面可以提升企業抗風險能力。使用Elastic Compute Service時,成本主要包括以下兩個方面:
擁有成本:這部分成本涉及使用各類資源和資源套件的費用。具體來說,包括但不限於:
執行個體規格費用
雲端硬碟容量費用
鏡像費用
公網頻寬費用
快照費用
營運成本:這部分成本指您在使用Elastic Compute Service過程中產生的人力成本。可能包括:
系統管理與維護
安全監控與防護
故障排查與修複
軟體更新與配置
上雲的成本優勢
自建資料中心時,除硬體、網路、電源、機房、人力營運成本等直接成本外,還需要考慮升級、擴容等帶來的規模成本,以及備份資料、實現高可用等帶來的風險成本。隨著業務發展擴巨量資料中心規模時,單位資源成本和資料中心複雜度會不斷增長,而且容錯率低。如果在業務變化時選型失誤,更會增加額外的支出。
相比自建資料中心,使用雲上資源時無須投入硬體、實體環境、人力等成本,單位資源成本相對線性,所有資源按需取用,交付便利。除資源成本的優勢外,雲上資源還支援多種付費模式,方便進一步最佳化成本。
成本最佳化建議
最佳化資源
發現成本偏高的資源後,您可以從多個角度監控資源的情況,確定成本偏高的原因,然後採取針對性的最佳化措施。
監控資源的使用方式。
監控資源使用率,評估當前配置是否過高。例如CPU、記憶體、雲端硬碟、頻寬等資源的利用率。
監控閑置的資源,避免浪費。例如升配但未重啟的執行個體、未匹配執行個體的預留執行個體券、未掛載的雲端硬碟、未關聯的EIP等。
監控資源使用周期。如果長期使用隨用隨付執行個體、雲端硬碟等資源,考慮以更實惠的方式購買,例如訂用帳戶、資源套件等。
監控資源生命週期,瞭解訂用帳戶資源的到期日,及時續約。例如訂用帳戶執行個體、預留執行個體券、儲存容量單位包等。
選擇合適的執行個體規格。
執行個體規格對Elastic Compute Service成本有較大影響,根據業務情境選擇性價比最佳的執行個體規格,並調整合適的數量。在滿足業務需求的同時追求高資源使用率,降低成本。
例如針對短視頻情境,目前使用d1ne.14xlarge(10台),監控ECS執行個體發現記憶體使用量率合理,但CPU相對空閑。因此可以採取以下方案:
適當降低CPU和記憶體比,滿足業務需求的同時提高CPU使用率。d1ne.14xlarge執行個體為1:4,d2s執行個體為1:4.4。使用d2s.10xlarge(13台)替換d1ne.14xlarge(10台),規格從14xlarge降為10xlarge,約節省18%的成本。
更多執行個體配置選型的介紹,請參見選型最佳實務。
組合多種付費模式。
不同類型的業務對資源使用周期有不同要求。為每一類業務確定合適的付費模式,靈活組合達到最優效果。
針對穩定業務負載,使用訂用帳戶、預留執行個體券。
針對有狀態且動態變化的業務負載,使用隨用隨付。
針對無狀態且可容錯的業務負載,使用搶佔式執行個體。
利用Dedicated HostDDH複用ECS執行個體資源。
針對CPU絕對穩定性要求不嚴苛的情境,例如開發測試環境,使用超分型DDH部署更多同等規格的ECS執行個體,降低單位部署成本。
部署在DDH上的ECS執行個體停機時不佔用資源,您也可以在生產環境業務流量的低峰期停止部分ECS執行個體,使用生產環境的空閑資源運行可預期周期的測試工作,例如離線計算、自動化測試等。
升級換代
Elastic Compute Service的持續升級,加上處理器等硬體的更新換代,提高產品效能的同時,也降低了產品成本。通常情況,新執行個體規格性價比優於老執行個體規格。
例如,從g5.2xlarge升級到g6.2xlarge的效能和價格對比如下:
效能 | 價格 |
|
|
為保證您可以及時使用新一代執行個體規格,建議您:
設計的應用具備魯棒性,在不同執行個體規格上可以正常運行。
關注阿里雲官網中執行個體規格的發布情況,及時評估是否需要更換。
升級換代樣本
按照以下參考替換方案,保證CPU、記憶體配置相同的前提下,可以提升效能並至少節約15%的執行個體成本:
當前執行個體規格類型系列 | 首選推薦 | 備選推薦 |
sn1、sn2 |
|
|
c4 | hfc6、c6 | hfc5、c5 |
ce4 | r6 | r5、se1ne |
cm4 | hfc6 | hfc5、g5 |
n1、n2、e3 |
|
|
|
|
|
具備節約意識
雲上資源的一個特點是按需取用,避免了自建資料中心所需的高昂一次性投入。針對按需取用的特點,您需要將成本最佳化融入到日常工作中,持續推進才能獲得理想的最佳化成果。下面列舉幾個典型操作,您可以以此為模板進一步細化,形成貼合自身情況的方案。
定期召開成本會議。定期和成本相關方(例如財務、研發等團隊)評審預算執行情況,評估最佳化成果,改進最佳化策略。
強制使用標籤。利用標籤按業務、環境、責任人等維度標記資源,便於日常成本追蹤。
分類資源並定製合適的使用方式。例如針對短期專案的開發測試環境,優先選用隨用隨付執行個體部署,專案結束後及時釋放執行個體。
避免資源閑置。定期盤點資源使用方式,明確閑置資源的通知和處置流程。
及時續約。對訂用帳戶資源,提前申請預算,避免到期釋放後重新購買部署增加額外成本。
實現自動化營運
阿里雲也提供了豐富的營運類產品,協助您提高營運效率,降低營運的人力成本。例如:
Auto Scaling:持續維護跨付費模式、跨可用性區域、跨執行個體規格的執行個體叢集。適合業務負載存在峰穀波動的情境。
彈性供應:一鍵部署跨付費模式、跨可用性區域和跨執行個體規格的執行個體叢集。適合需要快速交付穩定算力,同時使用搶佔式執行個體降低成本的情境。
CloudOps Orchestration Service:以模板的方式定義一組營運操作,高效執行營運任務。適合事件驅動營運、定時營運、批量營運、跨地區營運等情境。
Resource Orchestration Service:一鍵部署並維護包含多種雲資源和依賴關係的資源棧。適合交付整體系統、複製環境等情境。