ACK叢集已經相容阿里雲Prometheus和Grafana,無需您自建監控系統和可視化大盤。在Knative中部署業務應用後,您可以將Knative服務的監控資料接入Prometheus,通過Grafana大盤即時查看Kantive的響應延遲、請求並發數、CPU和記憶體資源用量等資料。
前提條件
已在叢集中部署Knative,請參見部署Knative。
已為叢集開啟阿里雲Prometheus監控,且Prometheus Agent(探針)版本大於3.0.0。具體操作,請參見開啟阿里雲Prometheus監控。
說明關於查看Prometheus探針的控制台入口,請參見探針管理。
費用說明
將Knative服務的監控資料接入阿里雲Prometheus監控功能後,相關組件會自動將監控指標發送至阿里雲Prometheus服務,這些指標將被視為自訂指標。使用自訂指標會引起額外的費用。
為避免產生額外的費用,建議在啟用此功能前,仔細閱讀阿里雲Prometheus的計費概述,瞭解自訂指標的收費策略。費用將根據您的叢集規模和應用數量等因素產生變動。您可以通過資源消耗統計功能,監控和管理您的資源使用方式。
將Knative接入阿里雲Prometheus監控
登入ARMS控制台。
在左側的導覽列,單擊接入中心,然後在頁面的搜尋欄輸入Knative。
單擊Knative資源卡片,根據頁面資訊提示,選擇待接入的Container Service叢集和配置資訊。
配置項
描述
接入名稱
Knative監控的名稱。
metrics採集間隔(秒)
監控資料擷取時間間隔。
配置完成後,單擊確定。
查看Knative監控大盤
登入ARMS控制台。
在左側的導覽列,單擊接入管理,然後單擊已接入組件。
單擊Knative資源卡片,然後單擊大盤列表頁簽,單擊具體大盤名稱,在Grafana查看Knative監控大盤的詳情資料。
分類 | 說明 |
請求資料 | 在Overview地區,查看Knative的請求量(Request Volume)、請求成功率(Success Rate)、4xx(用戶端錯誤)、5xx(伺服器端錯誤)和Pod擴縮容趨勢的監控資料。 說明 Request Volume、4xx和5xx的大盤表徵圖縱軸ops/sec表示每秒處理請求數。 |
響應延遲資料 | 在Response Time地區,查看Knative的響應延遲資料,包括P50、P90、P95和P99。 |
請求並發數 | 在Autoscaler地區,查看Knative的請求並發數的詳細資料。 |
資源使用量情況 | 在Resource Usages地區,查看Knative的資源使用量情況,包括CPU和記憶體。 |
查看Knative服務發現關鍵計量
在ARMS控制台左側導覽列,單擊接入管理,在右側頁面的已接入環境的容器環境頁簽下,單擊對應Prometheus服務執行個體的名稱。在容器環境頁面,單擊指標採集,查看Knative服務發現指標。以下介紹Knative服務發現關鍵計量。
當Knative應用縮容到0且沒有Pod執行個體時,Prometheus無法採集Pod的並發請求數、Pod每秒請求數等指標。只有訪問Knative應用Pod後,控制台才會展示這些指標。
當Knative應用沒有縮容到0時,無需訪問Knative應用Pod,控制台便會展示Pod的並發請求數、Pod每秒請求數等指標。
指標名稱 | 說明 |
queue_average_concurrent_requests | Pod的並發請求數。 |
queue_requests_per_second | Pod每秒請求數。 |
revision_request_latencies | 響應延遲。 |
revision_request_count | Revision請求數。 |
相關文檔
您可以基於SLS實現日誌採集和監控警示,請參見在Knative上實現日誌採集、為Knative服務開啟監控警示。