您不仅可以通过日志服务SLS采集日志,还可以基于SLS的告警功能监控Knative服务的异常状态。您可以自定义告警监控规则,例如检查频率、触发条件等,并配置对应的告警通知策略,在服务异常时及时以钉钉、短信、邮件等形式通知运维、开发人员进行处理,保证服务的持续运行。
前提条件
已部署一个Knative服务。本文示例快速部署一个Knative服务中创建的服务。
已将Knative服务接入日志采集,请参见在Knative上实现日志采集。
步骤一:查询和分析日志
下文介绍在SLS控制台查询和分析日志的控制台入口。详细信息,请参见查询和分析日志。
登录日志服务控制台。
在Project列表区域,单击目标Project。
在控制台左侧,单击日志存储,在日志库列表中单击目标Logstore。
输入命令并单击查询/分析。
例如,如果您想根据ERROR出现的次数进行监控,可以使用以下的SQL语句来统计ERROR的数量:
* | select 'ERROR' , count(1) as total group by 'ERROR'
这条SQL语句会筛选出所有包含ERROR字段的记录,并统计其数量,然后按照ERROR进行分组。
步骤二:配置监控告警
登录日志服务控制台。
在Project列表区域,单击目标Project。
在控制台左侧,单击日志存储,在日志库列表中单击目标Logstore。
在查询和分析页面,单击图标。
在告警监控规则面板,配置告警规则。
关于如何配置告警规则,请参见创建日志告警监控规则。
设置告警通知策略。
关于如何设置告警通知策略,请参见快速设置日志告警。
执行如下命令,访问helloworld-go服务。
此时会触发告警通知。
curl -H "Host: helloworld-go.default.example.com" http://<网关IP> # 网关IP和域名请以您的实际数据为准。
预期输出:
Hello Knative!
例如,如果您配置了邮件通知,告警信息可能如下:
相关文档
您可以将Knative服务的监控数据接入Prometheus并实时查看Grafana大盘,请参见查看Knative服务监控大盘。