本文介紹如何使用Prometheus監控Nebula。
前提條件
已將VPC執行個體接入可觀測監控 Prometheus 版。具體操作,請參見Prometheus執行個體 for ECS。
自建Prometheus觀測Nebula的痛點
使用自建Prometheus監控VPC內ECS上自建Nebula時,可能面臨的典型問題有以下幾點:
由於安全、組織管理等因素,您的業務通常部署在多個相互隔離的VPC,因此這需要您在多個VPC內都重複、獨立部署Prometheus,導致部署和營運成本較高。
每套完整的自建監控系統都需要安裝並配置Prometheus、Grafana、AlertManager等,其過程複雜、實施周期長。
缺少與阿里雲ECS快速整合的服務發現(ServiceDiscovery)機制,因此無法根據ECS標籤來靈活定義抓取Targets。如果自行實作類別似功能,則需要您使用Golang語言開發代碼調用阿里雲ECS POP介面,以整合開源Prometheus代碼,然後通過編譯打包後部署,這種方式實現門檻高、過程複雜、且版本升級困難。
常用開源Grafana大盤無法結合觀測組件的原理與最佳實務進行深入定製。
缺少Nebula警示項目範本,需要您自行配置警示規則,導致消耗的工作量較大,且技術實現困難。
自建Prometheus與阿里雲Prometheus的對比
Nebula監控情境下,自建Prometheus與可觀測監控 Prometheus 版的詳細對比如下:
對比項 | 自建Prometheus | 可觀測監控 Prometheus 版 |
部署、維護成本 | 多個VPC內,需要您自購ECS部署Prometheus、Grafana、AlertManager,營運成本高。 | 可觀測監控 Prometheus 版、Grafana及警示中心的一體化、全託管、免營運、開箱即用。 |
可用性、效能、資料容量 | 高可用能力不足、效能低、資料容量規模小。 | 高可用、高效能、巨量資料容量。 |
服務發現 | ECS環境下,通過開源Static_Configs、三方註冊中心等方式採集服務發現,使用不便,且維護成本高 | 內建了aliyun_sd_configs,方便您使用ECS標籤進行目標ECS匹配,達到與Kubernetes情境的LabelSelector一致體驗,極大簡化服務發現的配置和維護複雜度。 |
Grafana大盤 | 開源Grafana Nebula大盤通常較單一,大多隻是直接展示採集的Metric,缺少結合Nebula原理和最佳實務進行深入最佳化。 | 提供專業Nebula大盤模板,方便您快速、精準掌握Nebula全鏈路運行情況,並定位排查問題。 |
警示規則 | 缺少Nebula警示指標模板,需要使用者自行研究、配置警示規則。 | 根據Nebula監控實踐,提供專業、靈活的警示指標模板,您可以白屏化配置各警示規則。 |
通過上述對比可以看出,使用可觀測監控 Prometheus 版觀測Nebula可以極大的簡化您的營運流程並降低營運成本,使用可觀測監控 Prometheus 版觀測Nebula具體操作,請參見下文使用Prometheus監控Nebula。
使用Prometheus監控Nebula
功能入口
功能入口一:整合中心
登入ARMS控制台。
在左側導覽列選擇 ,進入可觀測監控 Prometheus 版的執行個體列表頁面。
- 單擊目標Prometheus執行個體名稱,進入整合中心頁面。
功能入口二:接入中心
登入ARMS控制台。
在左側導覽列單擊接入中心,然後在組件應用地區單擊Nebula卡片的添加,然後在彈出的頁面根據控制台指引完成組件接入。
步驟一:接入Nebula
這裡以從整合中心入口為例,介紹接入Nebula組件的操作,具體步驟如下。
接入Nebula組件。
若您初次安裝Nebula類型的組件:
在整合中心頁面單擊未安裝地區Nebula組件卡片的安裝。
若您已安裝Nebula類型的組件,需要再次添加該組件:
在整合中心頁面單擊已安裝地區Nebula組件卡片的添加。
在STEP2地區的配置頁簽配置相關參數,並單擊確定,完成組件接入。
參數
說明
Exporter名稱
當前Nebula執行個體監控的名稱,建議可使用Nebula自身的名稱。
MetaD Metrics監聽連接埠
Nebula各組件Metric的監聽連接埠,以便可觀測監控 Prometheus 版訪問這些連接埠擷取監控資料。
GraphD Metrics監聽連接埠
StorageD Metrics監聽連接埠
MetaD ECS標籤(服務發現)
Nebula各組件在VPC內ECS的標籤,以便可觀測監控 Prometheus 版根據標籤尋找出目標ECS列表。
GraphD ECS標籤(服務發現)
StorageD ECS標籤(服務發現)
MetaD的ECS標籤值
Nebula各組件在VPC內ECS的標籤值。
GraphD的ECS標籤值
StorageD的ECS標籤值
metrics採集間隔(秒)
可觀測監控 Prometheus 版採集Nebula監控資料的時間間隔,預設30秒。
說明在STEP2地區的指標頁簽可查看監控指標。
已接入的組件會顯示在整合中心頁面的已安裝地區。單擊該組件卡片,在彈出的面板中可以查看Targets、指標、大盤、警示、服務發現配置、Exporter等資訊。整合中心的更多資訊,請參見整合中心。
步驟二:查看Nebula大盤資料
可觀測監控 Prometheus 版預設整合了Nebula的Grafana大盤,您無需單獨安裝Grafana,即可查看Nebula各個組件的觀測大盤。
在整合中心頁面單擊已安裝地區的Nebula組件卡片,然後在彈出的對話方塊中單擊大盤頁簽可以查看該組件的大盤縮圖和超連結,單擊超連結進入阿里雲Grafana頁面,查看對應觀測大盤。
步驟三:配置Nebula監控警示
在整合中心頁面單擊已安裝地區的Nebula組件卡片,然後在彈出的面板中單擊警示頁簽(表徵圖①),並選擇警示分組為Nebula(表徵圖②),查看Nebula的Prometheus警示。
可觀測監控 Prometheus 版會自動建立Nebula各組件的推薦警示規則,然後需要您手動修改警示規則閾值後啟動即可。您還可以根據業務需求新增警示規則。建立Prometheus警示規則的具體操作,請參見Prometheus警示規則。