当您的物联网平台资源使用达到报警规则中设置的值后,将触发报警。阿里云将发送报警信息到您设置的联系人通知组。
阈值报警信息
当阈值报警规则被触发后,通知联系人将收到类似如下报警信息邮件:
报警信息内容说明
字段 | 说明 |
物联网平台实例 | 报警触发对象信息。包含触发报警规则的产品的ProductKey(productKey)、实例ID(instanceId)和所在地域ID(regionId)。 |
报警类目 | 显示为报警类目名称代码,指阈值报警规则描述中选择的报警类目。 如示例中,“MessageCountForwardedThroughRuleEngine_MNS”对应类目为“规则引擎消息流转次数(MNS)”,表示在一定时间内,规则引擎流转数据到轻量消息队列(原 MNS) SMQ(Simple Message Queue (formerly MNS))的次数超过了报警规则中设置的阈值。 具体类目名称代码说明,请参见阈值报警类目说明表。 |
告警时间 | 发生告警的时间。 |
计数值 | 规则所监控类目的消息量、消息流转次数或在线设备数量。 |
持续时间 | 数量超过阈值的持续时长。 |
规则详情 | 您在云监控控制台设置的阈值报警规则详情。 |
阈值报警类目说明表
物联网平台:基础指标
类目代码 | 说明 |
MessageCountForwardedThroughRuleEngine_DATAHUB | 规则引擎消息流转次数(DATAHUB),即规则引擎流转数据到DataHub的次数。 |
MessageCountForwardedThroughRuleEngine_FC | 规则引擎消息流转次数(FC),即规则引擎流转数据到函数计算(Function Compute)的次数。 |
MessageCountForwardedThroughRuleEngine_KAFKA | 规则引擎消息流转次数(KAFKA),即规则引擎流转数据到消息队列(Kafka)的次数。 |
MessageCountForwardedThroughRuleEngine_LINDORM | 规则引擎消息流转次数(LINDORM),即规则引擎流转数据到时序数据库(Lindorm)的次数。 |
MessageCountForwardedThroughRuleEngine_MNS | 规则引擎消息流转次数(MNS),即规则引擎流转数据到消息服务(Message Notification Service)的次数。 |
MessageCountForwardedThroughRuleEngine_MQ | 规则引擎消息流转次数(MQ),即规则引擎流转数据到消息队列(RocketMQ)的次数。 |
MessageCountForwardedThroughRuleEngine_OTS | 规则引擎消息流转次数(OTS),即规则引擎流转数据到表格存储(Tablestore)的次数。 |
MessageCountForwardedThroughRuleEngine_RDS | 规则引擎消息流转次数(RDS),即规则引擎流转数据到云数据库RDS版的次数。 |
MessageCountForwardedThroughRuleEngine_REPUBLISH | 规则引擎消息流转次数(REPUBLISH),即规则引擎流转数据到物联网平台其他Topic的次数。 |
MessageCountForwardedThroughRuleEngine_TSDB | 规则引擎消息流转次数(TSDB),即规则引擎流转数据到时序数据库(TSDB)的次数。 |
MessageCountSentFromIoT_HTTP_2 | 平台发出的消息量(HTTP/2),即云端通过HTTP/2协议发出的消息数量。 |
MessageCountSentFromIoT_MQTT | 平台发出的消息量(MQTT),即云端通过MQTT协议发出的消息数量。 |
MessageCountSentToIoT_CoAP | 发送到平台的消息量(CoAP),即云端通过CoAP协议发出的消息数量。 |
MessageCountSentToIoT_HTTP | 发送到平台的消息量(HTTP),即设备通过HTTP协议发送到物联网平台的消息数量。 |
MessageCountSentToIoT_HTTP/2 | 发送到平台的消息量(HTTP/2),即设备通过HTTP/2协议发送到物联网平台的消息数量。 |
MessageCountSentToIoT_MQTT | 发送到平台的消息量(MQTT),即设备通过MQTT协议发送到物联网平台的消息数量。 |
OnlineDevicesCount_MQTT | 实时在线设备数(MQTT),即使用MQTT协议接入物联网平台的在线设备数量。 |
OnlineDevicesCount_HTTP/2 | 实时在线设备数(HTTP/2),即使用HTTP/2协议接入物联网平台的在线设备数量。 |
OnlineDeviceInstanceWatermark | 在线设备数的水位报警,即 重要 该指标仅对企业版实例生效,即使创建公共实例的在线设备数的水位报警,也不会触发报警规则。 |
DeviceEventReportError | 设备事件上报失败数。 |
DevicePropertyReportError | 设备属性上报失败数。 |
DevicePropertySettingError | 设备属性设置失败数。 |
DeviceServiceCallError | 设备服务调用失败数。 |
DeviceCount_Product | 产品下已创建的设备数。 |
MessageCountPerMinute | 当前实例每分钟消息上下行次数。 |
RuleEngineTransmitCountPerMinute | 当前实例每分钟规则引擎流转次数。 |
物联网平台:企业版实例
类目代码 | 说明 |
DeviceNum_instance | 同时在线设备数。设备数水位报警,即 |
LinkAnalyticsCU | 数据处理单元。 |
LinkAnalyticsStorage | 离线存储空间。 |
MessageWatermarkTps_instance | 消息上下行TPS。消息上下行TPS水位报警,即 |
OtaCommercialUpgradeCount | 设备升级有效次数报警。 |
RuleEngineWatermarkTps_instance | 消息转发TPS。消息转发TPS水位报警,即 |
HotStorageReadIops | 时序存储读IOPS。 |
HotStorageWriteIops | 时序存储写IOPS。 |
HotStorageCapacity | 时序存储空间。 |
message_elastic_tps_instance | 消息上下行弹性消息条数报警。 |
message_elastic_transmit_instance | 消息转发弹性消息条数报警。 |
物联网平台:AMQP消费组
类目代码 | 说明 |
AMQP_Msg_Accumulate | 消费组消息堆积数。 |
AMQP_Msg_Consume_rate | 消费组消息消费速率。 |
事件报警信息
当事件报警规则被触发后,通知联系人将收到类似如下报警信息邮件:
报警信息内容说明
字段 | 说明 |
事件名称 | 显示为报警事件名称代码。如示例中“Device_Connect_QPM_Limit”表示“任一设备每分钟最大连接请求数达到上限”。 具体事件名称代码对应的事件名称,请参见事件类目说明表。 |
报警对象 | 报警触发的资源:
|
事件等级 | 目前均为WARN(告警)。 |
发生事件 | 事件报警的发生时间。 |
事件状态 | 目前均为Fail,表示连接请求数或消息发送QPS达到上限后,后续请求失败。 |
详情 | 触发报警的资源信息,JSON格式。包含地域ID(regionId)、实例ID(instanceId)、 产品的ProductKey(productKey)和设备名称(deviceName)。其中,productKey和deviceName仅出现在设备每分钟最大连接请求数达到上限和设备上、下行消息QPS达到上限的报警信息中。 |
事件类目说明表
事件名称 | 说明 |
Device_Connect_QPM_Limit | 任一设备每分钟最大连接请求数达到上限。 |
Device_Uplink_QPS_Limit | 任一设备上行消息QPS达到上限。 |
Device_Downlink_QPS_Limit | 任一设备下行消息QPS达到上限。 |
Account_Connect_QPS_Limit | 当前账号每秒最大连接请求数达到上限。 |
Account_Uplink_QPS_Limit | 当前账号每秒发布请求数达到上限。 |
Account_Downlink_QPS_Limit | 当前账号每秒发给设备的请求数达到上限。 |
Account_RuleEngine_DataForward_QPS_Limit | 当前账号每秒到达规则引擎的请求数达到上限。 |