通过阿里云Prometheus监控监测Knative数据并在阿里云Grafana查看监控大盘 - 容器服务 Kubernetes 版 ACK

ACK集群已兼容阿里云Prometheus和Grafana，无需您自建监控系统和可视化大盘。在Knative中部署业务应用后，您可将监控数据接入Prometheus，通过Grafana查看Knative的性能指标。

前提条件

已在集群中部署Knative，请参见部署Knative。

将Knative服务的监控数据接入阿里云Prometheus监控功能后，相关组件会自动将监控指标发送至阿里云Prometheus服务，这些指标将被视为自定义指标。使用自定义指标会引起额外的费用。

为避免产生额外的费用，建议在启用此功能前，仔细阅读阿里云Prometheus的计费概述，了解自定义指标的收费策略。费用将根据您的集群规模和应用数量等因素产生变动。您可以通过资源消耗统计功能，监控和管理您的资源使用情况。

开启阿里云Prometheus监控后，即可在监控大盘页签下查看具体的监控数据。

分类	说明
请求数据	在Overview (average over the selected time range)区域，查看Knative的以下数据：请求量（Request Volume）请求成功率（Success Rate） 4xx（客户端错误） 5xx（服务器端错误）按Revision统计的请求量（Request Volume by Revision）按响应码类别统计的请求量（Request Volume by Response Code Class）。 Request Volume、4xx和5xx的大盘图标纵轴ops/sec表示每秒处理请求数。
响应延迟数据	在Response Time区域，查看Knative的响应延迟数据，包括P50、P90、P95和P99。
请求并发数	在Autoscaler区域，查看Knative的请求并发数的详细数据。
Activator	在Activator区域，查看Knative Activator的以下数据：请求量（Request Volume）请求成功率（Success Rate） 4xx（客户端错误） 5xx（服务器端错误）按Revision统计的请求量（Request Volume by Revision）按响应码类别统计的请求量（Request Volume by Response Code Class）。按Revision统计的响应时间（ Response Time by Revision）按响应码类别统计的响应时间（Response Time by Response Code Class）。
资源使用量情况	在Resource Usages区域，查看Knative的资源使用量情况，包括CPU和内存。

您可以通过选择指标或者编写PromQL查看、验证Knative服务的监控数据。

单击指标探索页签，查看Knative的以下关键指标。

页面操作流程，请参见指标探索。

说明

当Knative应用缩容到0且没有Pod实例时，Prometheus无法采集Pod的并发请求数、每秒请求数等指标。只有访问Knative应用Pod后，控制台才会展示这些指标。
当Knative应用没有缩容到0时，无需访问Knative应用Pod，控制台便会展示Pod的并发请求数、Pod每秒请求数等指标。

指标名称	说明
queue_average_concurrent_requests	Pod的并发请求数。
queue_requests_per_second	Pod每秒请求数。
revision_request_latencies	响应延迟。
revision_request_count	Revision请求数。