計算巢為使用者提供了全面而綜合的系統監控解決方案,覆蓋了基礎設施的資源級監控——CloudMonitor以及應用程式的Prometheus監控。這一方案確保使用者的雲資源無論在軟體邏輯層面還是硬體物理層面均能獲得細緻、全方位的效能監控和健康管理。通過構建這樣一個監控生態,使用者可以從多角度擷取所購買的服務執行個體的使用方式,及時響應潛在的問題,最佳化資源配置,提升服務穩定性與業務效率。
概述
監控:為您提供跨雲端服務、跨地區的資源分組管理功能。支援您從業務角度集中管理伺服器、資料庫、負載平衡、儲存等資源,從而按實際業務需求來管理警示規則,查看監控資料,提升營運效率。
警示:監控項滿足警示條件時發送警示通知。功能範圍包括閾值警示、事件警示、組進程警示、可用性監控警示。警示規則的詳細配置,請參見建立警示規則。
CloudMonitor支援的資源或雲產品,請參見支援的雲產品及其系統事件。
資源級監控 - CloudMonitor
計算巢通過整合阿里雲-CloudMonitor為雲上使用者提供開箱即用的資源級監控解決方案,該方案可涵蓋IT設施基礎監控和外網網路品質撥測監控,是基於事件、自訂指標和日誌的業務監控,同時提供完善的警示系統,使問題得到高效響應和解決,特點如下:
開箱即用:對於阿里雲-CloudMonitor支援的資源,無需額外配置,開箱即用地查看計算巢服務執行個體內的資源監控。
緊急警示:對於計算巢的私人化和全託管服務中,均可設定雲上資源的警示模板和警示連絡人,使雲上資源的緊急事件得到響應和處理。
靈活分組:計算巢通過應用分組支援對資源提供跨雲端服務和跨地區的應用分組管理模型和警示模板,用於建設高效的監控警示管理體系。
其產品架構如下圖所示:
軟體級監控 - Prometheus
計算巢通過整合阿里雲Prometheus探針為使用者的應用平台提供深入到軟體層面的監控能力,基於Grafana大盤提供可視化能力並用於識別效能瓶頸,並通過AlertManager實現警示功能。
基於Prometheus的軟體監控特點如下:
應用範圍廣:計算巢整合Prometheus可為ACK叢集和ECS叢集等多樣化的雲端運算環境提供精準的應用級監控。
資料隔離與安全:通過在監控資料上打上租戶Tag,計算巢保障了在多租戶環境下監控資料的安全性和隔離性。這意味著每個租戶的監控資料都是獨立和私人的,避免了資料泄露和濫用的風險。
直觀展示:內嵌的Grafana大盤賦予了使用者從宏觀視角全面審視軟體監控資料的能力。各類圖表、儀錶盤和指標的直觀可視化,讓即使是非技術使用者也能輕鬆把握系統的健全狀態。
簡單配置:通過自動化佈建服務和介面化配置,計算巢消除了設定複雜的監控參數的難題。使用者可以通過簡單的點擊和輸入,迅速完成對Prometheus監控的配置,無需深入瞭解背後複雜的設定細節。