全部產品
Search
文件中心

Managed Service for Prometheus:雲端服務可觀測

更新時間:Nov 16, 2024

Managed Service for Prometheus支援接入多款阿里雲雲產品監控資料,並提供預設Grafana大盤和警示規則。本文以阿里雲RDS MySQL為例示範如何將雲產品接入Managed Service for Prometheus,其他雲產品的接入類似。

前提條件

步驟一:接入雲端服務監控資料

  1. 登入ARMS控制台

  2. 在左側導覽列單擊接入中心

  3. 接入中心頁面,單擊左側資料庫頁簽,然後單擊阿里雲 RDS 資料庫

    image

    說明
    • 由於Prometheus依賴阿里雲企業CloudMonitor服務擷取雲產品監控資料,如果當前帳號沒有開通企業CloudMonitor服務,頁面會提示您先開通企業CloudMonitor服務,單擊立即開通,進入企業CloudMonitor開通頁面,具體步驟,請參見開通企業CloudMonitor。開通完成後,單擊重新檢測,即可繼續進行RDS MySQL監控資料的接入。

    • 開通企業CloudMonitor是非同步作業,重新檢測後如果仍然是未開通狀態,可以等待10~20秒左右再單擊重新檢測

  4. 在彈出的頁面中,在接入開始頁簽下,選擇資料存放區的地區,然後單擊確定,大概需要等待1~2分鐘,即可完成RDS MySQL監控資料的接入。

    說明
    • Prometheus不僅收集其所在地區的RDS MySQL資料,而且匯總目前使用者所有地區內的RDS MySQL資料至單個Prometheus執行個體。建議將Prometheus執行個體部署在您常用的阿里雲地區中。

    • Managed Service for Prometheus在通過企業CloudMonitor接入雲端服務監控指標時,支援在CloudMonitor本身標籤的基礎上,將執行個體的中繼資料(例如執行個體ID或執行個體標籤)作為指標的標籤富化到該執行個體相關的監控指標上。有以下兩種情境:一種是預設寫入通用標籤,另一種是您可以自訂將執行個體上的Tag作為標籤寫入指標。

      • 預設寫入通用標籤

        具體的標籤會依據云產品的類型而有所不同,因此Prometheus在收集指標過程中,會把執行個體相關的其他中繼資料資訊以標籤形式附加至相應指標上。

        標籤名

        說明

        id

        執行個體ID。

        instanceName

        執行個體名稱。

        resourceGroupId

        資源群組ID。

        resourceGroupName

        資源群組名。

        regionId

        執行個體地區。

        zoneId

        可用性區域。

        userId

        主帳號ID。

        namespace

        接入環境ID。

        product

        所屬雲產品。

        measure

        CloudMonitor對應的指標名。

        measure_desc

        CloudMonitor對應的指標描述。

      • 自訂標籤

        雲產品執行個體上帶有o11y.aliyun.dev/首碼的標籤也將被包含在指標資料中。例如,若執行個體標籤是o11y.aliyun.dev/project=abc,則在監控指標裡會增加一個新的標籤project=abc

步驟二:查看監控大盤

  1. 登入ARMS控制台

  2. 在左側導覽列單擊接入管理

  3. 接入管理頁面的已接入環境頁簽中,選擇雲端服務地區環境

  4. 雲端服務地區環境列表中,單擊目標環境名稱進入雲端服務環境詳情頁面。

  5. 組件管理頁簽的組件類型地區單擊大盤,即可查看內建的Grafana大盤。

    image

步驟三:配置警示

  1. 登入Prometheus控制台

  2. 在左側導覽列單擊接入管理

  3. 接入管理頁面的已接入環境頁簽中,選擇雲端服務地區環境

  4. 雲端服務地區環境列表中,單擊目標環境名稱進入雲端服務環境詳情頁面。

  5. 組件管理組件類型地區單擊警示規則,即可查看內建的警示規則。

    image

說明

內建的警示規則會產生警示事件,但是不會進行警示通知,如果您希望將警示通知發送到郵件或其他平台,可以單擊編輯配置通知方式。在警示配置頁面,您也可以自訂警示閾值、期間、警示內容等。有關警示詳細配置的資訊,請參見建立Prometheus警示規則

image

說明

在極簡模式下,您可以設定警示的通知對象、通知時段和重複策略。

步驟四:自訂雲產品全域儀錶盤

若您想根據個人化需求定製Grafana儀錶盤,您可以建立Grafana工作空間並在其中自行設計儀錶盤。具體操作步驟如下:

建立自訂工作區

  1. 登入ARMS控制台

  2. 在左側導覽列單擊接入管理

  3. 接入管理頁面的已接入環境頁簽中,選擇雲端服務地區環境

  4. 雲端服務地區環境列表中,單擊目標環境名稱進入雲端服務環境詳情頁面。

  5. 組件管理頁簽下,單擊基本資料下的預設指標儲存對應的名稱。

    image

  6. 進入Prometheus執行個體後,在設定頁簽下,單擊基礎資訊區塊下的建立工作區

    image

  7. 建立工作區頁面,按照頁面提示完成參數配置,然後單擊立即建立

修改Grafana工作區

建立完成之後,返回到Prometheus執行個體設定頁面,單擊image,在彈出的下拉式功能表中選擇您剛建立的工作區,單擊確認,然後再次單擊確認

image

登入Grafana

  1. 登入Prometheus控制台

  2. 在左側導覽列單擊執行個體列表,進入可觀測監控 Prometheus 版的執行個體列表頁面。

  3. 單擊目標執行個體grafana 工作區列的名稱,登入Grafana。

    image

建立雲資源監控大盤

說明
  • 本文以建立ECS和RDS監控資料的雲資源監控大盤為例,添加其他雲產品的步驟類似。

  • 本文以Grafana 10.0.x版本為例進行說明。

建立ECS監控表徵圖

  1. Dashboards頁簽下,單擊+ Create Dashboard,然後單擊+ 添加可視化,進入Select data source頁面,選擇預設的資料來源。

    image

  2. 單擊頁面右上方下拉框,選擇Table

  3. 在頁面左下角單擊+ Query添加BC,在ABC地區的右側分別單擊Code

    1. ABC地區的Metrics browser對應的代碼塊中分別寫入以下代碼。

      區塊

      代碼

      A

      avg(AliyunEcs_cpu_total{})by(regionId,instanceId,instanceName)

      B

      avg(AliyunEcs_memory_usedutilization{})by(regionId,instanceId,instanceName)

      C

      avg(AliyunEcs_net_tcpconnection{state="ESTABLISHED"})by(regionId,instanceId,instanceName)

    2. 分別單擊ABC地區的Options,選擇Format的類型為Table,選擇Type的類型為Instant

    image

  1. 單擊頁面右下角Transform

    1. 單擊+ Add transformation,在彈出的搜尋方塊中搜尋Merge,然後單擊Merge進行添加。

    2. 再次單擊+ Add transformation,在彈出的搜尋方塊中搜尋Organize fields,然後單擊Organize fields進行添加。

    3. 單擊Time前面的image,然後按照下表填寫表格。

      標籤

      instanceId

      執行個體ID

      instanceName

      執行個體名稱

      regionId

      地區

      Value #A

      CPU使用率(%)

      Value #B

      記憶體利用率(%)

      Value #C

      串連數

      image

  1. 在頁面右側單擊Overrides,設定相應參數。

    1. 單擊+ Add field override,選擇Fields with name,然後在下拉框中分別選擇CPU使用率(%)記憶體利用率(%)

    2. 單擊Override 1地區和Override 2中的+ Add override property,在下拉框中選擇Cell options > Cell type,然後在下拉框中選擇GaugeGauge display modeValue display按照下表所示進行選擇。

      標籤

      Gauge display mode

      Retor LCD

      Value display

      Text color

    image

  1. 單擊右上方Save進行儲存。

建立RDS監控圖表

  1. 在建立完成ECS監控表徵圖後,單擊頁面右上方image,在下拉框中選擇可視化

  2. 單擊頁面左側Date source對應的下拉框,選擇預設的資料來源。

    image

  3. 在頁面右上方搜尋方塊搜尋選擇Table

  4. 在頁面左下角單擊+ Query添加BC,在ABC地區的右側分別單擊Code

    1. ABC地區的Metrics browser對應的代碼塊中分別寫入以下代碼。

      區塊

      代碼

      A

      avg(AliyunRds_CpuUsage{engine="MySQL"})by(regionId,instanceId,instanceName)

      B

      avg(AliyunRds_MemoryUsage{engine="MySQL"})by(regionId,instanceId,instanceName)

      C

      avg(AliyunRds_DiskUsage{engine="MySQL"})by(regionId,instanceId,instanceName)

    2. 分別單擊ABC地區的Options,選擇Format的類型為Table,選擇Type的類型為Instant

  5. 單擊頁面右下角Transform

    1. 單擊+ Add transformation,在彈出的搜尋方塊中搜尋Merge,然後單擊Merge進行添加。

    2. 再次單擊+ Add transformation,在彈出的搜尋方塊中搜尋Organize fields,然後單擊Organize fields進行添加。

    3. 單擊Time前面的image,然後按照下表填寫表格。

      標籤

      Value #A

      CPU使用率(%)

      Value #B

      記憶體利用率(%)

      Value #C

      磁碟利用率(%)

  6. 在頁面右側單擊All,在Panel options標籤下,設定TitleRDS執行個體

  7. 在頁面右側單擊Overrides,設定相應參數。

    1. 單擊+ Add field override,選擇Fields with name,然後在下拉框中分別選擇CPU使用率(%)記憶體利用率(%)磁碟利用率(%)

    2. 單擊Override 1地區、Override 2Override 3中的+ Add override property,在下拉框中選擇Cell options > Cell type,然後在下拉框中選擇GaugeGauge display modeValue display按照下表所示進行選擇。

      標籤

      Gauge display mode

      Retor LCD

      Value display

      Text color

  8. 單擊右上方Save進行儲存。