ACK叢集已經相容阿里雲Prometheus和Grafana,無需您自建監控系統和可視化大盤。在Knative中部署業務應用後,您可以將Knative服務的監控資料接入Prometheus,通過Grafana大盤即時查看Knative的響應延遲、請求並發數、CPU和記憶體資源用量等資料。
前提條件
已在叢集中部署Knative,請參見部署Knative。
費用說明
將Knative服務的監控資料接入阿里雲Prometheus監控功能後,相關組件會自動將監控指標發送至阿里雲Prometheus服務,這些指標將被視為自訂指標。使用自訂指標會引起額外的費用。
為避免產生額外的費用,建議在啟用此功能前,仔細閱讀阿里雲Prometheus的計費概述,瞭解自訂指標的收費策略。費用將根據您的叢集規模和應用數量等因素產生變動。您可以通過資源消耗統計功能,監控和管理您的資源使用方式。
開啟阿里雲Prometheus監控
登入Container Service管理主控台,在左側導覽列選擇叢集。
在叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇 。
在Knative頁面,單擊監控大盤頁面,然後單擊開啟Prometheus監控。
查看Knative監控大盤
開啟阿里雲Prometheus監控後,即可在監控大盤頁簽下查看具體的監控資料。
分類 | 說明 |
請求資料 | 在Overview (average over the selected time range)地區,查看Knative的請求量(Request Volume)、請求成功率(Success Rate)、4xx(用戶端錯誤)、5xx(伺服器端錯誤)和Pod擴縮容趨勢的監控資料。 說明 Request Volume、4xx和5xx的大盤表徵圖縱軸ops/sec表示每秒處理請求數。 |
響應延遲資料 | 在Response Time地區,查看Knative的響應延遲資料,包括P50、P90、P95和P99。 |
請求並發數 | 在Autoscaler地區,查看Knative的請求並發數的詳細資料。 |
資源使用量情況 | 在Resource Usages地區,查看Knative的資源使用量情況,包括CPU和記憶體。 |
查看Knative服務發現關鍵計量
在ARMS控制台左側導覽列,單擊接入管理,在右側頁面的已接入環境的容器環境頁簽下,單擊對應Prometheus服務執行個體的名稱。在容器環境頁面,單擊指標採集,查看Knative服務發現指標。以下介紹Knative服務發現關鍵計量。
當Knative應用縮容到0且沒有Pod執行個體時,Prometheus無法採集Pod的並發請求數、每秒請求數等指標。只有訪問Knative應用Pod後,控制台才會展示這些指標。
當Knative應用沒有縮容到0時,無需訪問Knative應用Pod,控制台便會展示Pod的並發請求數、Pod每秒請求數等指標。
指標名稱 | 說明 |
queue_average_concurrent_requests | Pod的並發請求數。 |
queue_requests_per_second | Pod每秒請求數。 |
revision_request_latencies | 響應延遲。 |
revision_request_count | Revision請求數。 |
相關文檔
您可以基於SLS實現日誌採集和監控警示,請參見在Knative上實現日誌採集、為Knative服務開啟監控警示。