華為云云監控是一個針對彈性雲端服務器、頻寬等資源的立體化監控平台。您只需要在華為雲訊息通知服務中配置Log Service開放警示介面的URL,即可將華為云云監控警示訊息發送給Log Service,由Log Service警示系統完成警示降噪、通知等處理。
前提條件
已建立協議為華為云云監控的開放警示應用。具體操作,請參見配置開放警示對外介面。華為云云監控配置
- 登入華為雲訊息通知服務控制台。
- 建立主題。您需在建立主題對話方塊中設定主題名稱。具體操作,請參見建立主題。
- 訂閱主題。您需在添加訂閱對話方塊中設定如下必填參數。具體操作,請參見訂閱主題。
參數 說明 協議 協議,選擇HTTP。 訂閱終端 配置為您在Log Service中建立開放警示服務和應用後產生的介面資訊(完整URL)。如何擷取,請參見擷取介面資訊。 配置完成後,訂閱處於未訂閱狀態。此時華為雲訊息通知服務將給Log Service發送一條訂閱確認訊息,Log Service收到該訊息後會自動訪問訊息中的訂閱確認連結。訪問成功後,訂閱處於已確認狀態,表示訂閱成功。說明 如果未訂閱成功,您可以選中目標訂閱,單擊提取訂閱,華為雲訊息通知服務將重新發送一條訂閱確認訊息。如果仍未成功,您可以在Log Service的警示排障中心查看錯誤記錄檔。
- 登入華為云云監控服務控制台。
- 建立警示規則和通知。
華為云云監控警示訊息
華為云云監控不支援自訂警示訊息,典型的警示訊息樣本如下所示。
{
"signature": "NR9taTRU****qH0D8htN",
"subject": "[重要警示]CloudMonitor通知:主機監控-雲端服務器 “hecs****6789” 的(Agent)CPU使用率已觸發警示。",
"topic_urn": "urn:smn:cn-east-3:1a2b3c4d5e6f7g:tosls",
"message_id": "1a2b3c4d5e6f7g8h9i",
"signature_version": "v1",
"type": "Notification",
"message":
{
"message_type": "alarm",
"alarm_id": "al1234567890",
"alarm_name": "alarm-abc",
"alarm_status": "alarm",
"time": 1640704721540,
"namespace": "AGT.ECS",
"metric_name": "cpu_usage",
"dimension": "instance_id:eee12****3b4c",
"period": 1,
"filter": "Raw data",
"comparison_operator": ">=",
"value": 5,
"unit": "%",
"count": 1,
"alarmValue":
[
{
"time": 1640704680000,
"value": 5.7
}
],
"sms_content": "[華東-上海一][重要警示]尊敬的hid_1a2b3c:主機監控-雲端服務器 “hecs****6789” (私網IP:192.168.0.11,公網IP:192.0.2.1,ID:eee12****3b4c)的(Agent)CPU使用率連續1次原始值 >= 5.00%,當前資料:5.70%,於2021/12/28 23:18:41 GMT+08:00觸發警示,詳情請訪問CloudMonitor服務。",
"template_variable":
{
"AccountName": "hid_1a2b3c",
"Namespace": "主機監控",
"DimensionName": "雲端服務器",
"ResourceName": "hecs****6789",
"MetricName": "(Agent)CPU使用率",
"IsAlarm": true,
"IsCycleTrigger": false,
"AlarmLevel": "重要",
"Region": "華東-上海一",
"ResourceId": "eee****3b4c",
"PrivateIp": "192.168.0.11",
"PublicIp": "192.0.2.1",
"AlarmRule": "",
"CurrentData": "5.70%",
"AlarmTime": "2021/12/28 23:18:41 GMT+08:00",
"DataPoint":
{
"2021/12/28 23:18:00 GMT+08:00": "5.70%"
},
"DataPointTime":
[
"2021/12/28 23:18:00 GMT+08:00"
],
"AlarmRuleName": "alarm-abc",
"AlarmId": "al1234567890",
"AlarmDesc": "test alarm",
"MonitoringRange": "資源分組",
"IsOriginalValue": true,
"Period": "",
"Filter": "原始值",
"ComparisonOperator": ">=",
"Value": "5.00%",
"Unit": "%",
"Count": 1,
"EventContent": "",
"Link": "https://console.huaweicloud.com/ces/?region=cn-east-3#/alarms/detail?alarmId=al1234567890",
"IsIEC": false,
"IsAgentEvent": false,
"IngressMaxBandwidthPerSec": "",
"EgressMaxBandwidthPerSec": ""
}
},
"unsubscribe_url": "https://console.huaweicloud.com/smn/subscription/unsubscribe?region=cn-east-3®ion_id=cn-east-3&subscription_urn=urn:smn:cn-east-3:1a2b3c4d5e6f:tosls:1a2b3c4d5e6f",
"signing_cert_url": "https://smn.cn-east-3.myhuaweicloud.com/smn/SMN_cn-east-3_1a2b3c4d5e6f7h.pem",
"timestamp": "2021-12-28T15:20:06Z"
}警示訊息映射
華為云云監控警示被接入到Log Service開放警示系統後,映射為Log Service警示訊息。樣本如下:
{
"aliuid": "aliuid1",
"alert_instance_id": "1a2b3c4d5e6f7g8h9i",
"alert_id": "al1234567890",
"alert_type": "sls_pub",
"alert_name": "alarm-abc",
"region": "{警示中心Project所在地區}",
"project": "{警示中心所屬的Project}",
"project_id": 0,
"next_eval_interval": 1,
"alert_time": 1640704721,
"fire_time": 1640704721,
"fire_results":
[
{
"time": "1640704680000",
"value": "5.7"
}
],
"fire_results_count": 1,
"resolve_time": 0,
"status": "firing",
"results": null,
"labels":
{
"dimension": "instance_id:eee****3b4c",
"dimension_name": "雲端服務器",
"metric_name": "cpu_usage",
"namespace": "AGT.ECS",
"region": "華東-上海一"
},
"annotations":
{
"__config_app__": "sls_pub_alert",
"__pub_alert_app__": "{開放警示應用ID}",
"__pub_alert_protocol__": "huawei_ces",
"__pub_alert_region__": "{接收警示訊息的網路介面對應的地區}",
"__pub_alert_service__": "{開放警示服務ID}",
"account_name": "hid_1a2b3c",
"comparison_operator": ">=",
"desc": "test alarm",
"title": "[重要警示]CloudMonitor通知:主機監控-雲端服務器 “hecs****6789” 的(Agent)CPU使用率已觸發警示。",
"unit": "%"
},
"severity": 8,
"policy":
{
"alert_policy_id": "{開放警示應用中配置的警示策略ID}",
"action_policy_id": "{開放警示應用中配置的行動策略ID}",
"use_default": false,
"repeat_interval": "{開放警示應用中配置的重複等待時間}"
},
"template": null,
"drill_down_query": "https://console.huaweicloud.com/ces/?region=cn-east-3#/alarms/detail?alarmId=al1234567890"
}Log Service警示訊息中的欄位與華為云云監控警示訊息中的欄位的映射關係如下表所示。
| Log Service | 華為云云監控 | 說明 |
| aliuid | 無 | 用於接入警示的開放警示應用所屬的阿里雲帳號ID。 |
| alert_id | message.alarm_id | 警示監控規則ID。 |
| alert_instance_id | message_id | 警示訊息ID。 |
| alert_type | 無 | 警示類型,固定為sls_pub。 |
| alert_name | message.alarm_name | 警示監控規則名稱。 |
| status | message.alarm_status | 警示狀態,包括firing和resolved。
|
| next_eval_interval | message.period、message.count | 警示評估間隔時間。 其值為message.period欄位值和message.count欄位值的乘積。 |
| alert_time | message.time | 警示觸發時間。 |
| fire_time | message.time | 警示首次觸發時間。 |
| resolve_time | message.time | 警示恢復。
|
| labels | 無 | 警示標籤資訊,Log Service的labels欄位中將加入以下欄位。
|
| annotations | 無 | 標註資訊,Log Service的annotations欄位中將加入以下欄位。
|
| severity | message.template_variable.AlarmLevel | 警示嚴重度。華為云云監控警示嚴重度與Log Service警示嚴重度的映射關係如下:
|
| policy | 無 | 您在開放警示應用中配置的警示策略。更多資訊,請參見Policy結構。 |
| project | 無 | 警示中心所屬的Project。更多資訊,請參見專案(Project)。 |
| drill_down_query | message.template_variable.Link | 對應華為云云監控中觸發警示的警示規則詳情頁面URL地址。 |
