全部產品
Search
文件中心

NAT Gateway:公網NAT Gateway監控與營運

更新時間:Oct 25, 2024

如果您想即時監控網關效能、出入方向流量統計,您可以使用CloudMonitor服務來監控公網NAT Gateway。CloudMonitor可以從公網NAT Gateway中監控並收集即時指標,並在公網NAT Gateway控制台產生可視化的時序曲線圖,協助您排查問題

增強型NAT Gateway

查看監控

公網NAT Gateway監控

  1. 登入NAT Gateway管理主控台
  2. 在頂部功能表列,選擇公網NAT Gateway的地區。
  3. 公網NAT Gateway頁面,找到目標公網NAT Gateway,然後在監控列單擊表徵圖查看監控。

    image

    具體監控指標如下表所示。

    監控指標分類

    監控項

    說明

    Session統計

    並發串連數/連接埠分配失敗丟失數(count)

    NAT Gateway可同時容納的TCP和UDP串連數量。

    並發丟棄串連速率(countS)

    NAT Gateway串連數超過並發串連數限制,而導致串連被丟棄的速率。

    建立串連速率/建立丟棄串連速率(countS)

    • 建立串連速率:NAT Gateway每秒可建立的TCP和UDP串連數。

    • 建立丟棄串連速率:NAT Gateway每秒建立串連數超過每秒最大建立數串連限制,而導致建立串連數被丟棄。

    並發串連水位/建立串連水位(%)

    • 並發串連水位:已消耗串連數佔總串連數的百分比。

    • 建立串連水位:已消耗的建立串連數佔總建立串連數的百分比。

    說明

    單個NAT Gateway執行個體預設支援每秒10萬建立串連數以及每分鐘200萬並發串連數。當業務需求觸發NAT Gateway的彈效能力變化時,相關的調整將在大約10分鐘內生效。

    連接埠分配失敗丟失數(count)

    NAT Gateway訪問目的地址並發串連數過高時分配TCP或UDP連接埠失敗的次數。

    說明
    • 單個Elastic IP Address(Elastic IP Address,簡稱EIP)可提供SNAT分配的連接埠數量有限。當使用者訪問同一個目的地址的會話數量過多而配置的SNAT規則使用的EIP數量過少時,會造成連接埠分配失敗。

    • 當連接埠分配失敗丟棄計數持續增長時,建議您增加SNAT規則中配置的EIP數量。更多資訊,請參考建立SNAT IP位址集區

    入方向流量統計

    入方向流量速率(bps)

    入方向每秒接受的流量,包括:

    • 從公網來流量速率:公網每秒發送到NAT Gateway的流量。

    • 入VPC流量速率:NAT Gateway每秒到VPC的流量。

    入方向流量(bytes)

    入方向所消耗的流量,包括:

    • 從公網來流量:公網發送到NAT Gateway的流量。

    • 入VPC流量:NAT Gateway發送到VPC的流量。

    入方向包速率(countS)

    入方向每秒接受的資料包數量,包括:

    • 從公網來包速率:公網每秒發送到NAT Gateway的包數量。

    • 入VPC包速率:NAT Gateway每秒發送到VPC的包數量。

    入方向包量(count)

    入方向所消耗的資料包數量,包括:

    • 從公網來包量:公網發送到NAT Gateway的包數量。

    • 入VPC包量:NAT Gateway發送到VPC的包數量。

    出方向流量統計

    出方向流量速率(bps)

    出方向每秒接受的流量,包括:

    • 入公網流量速率:NAT Gateway每秒發送到公網的流量。

    • 從VPC來流量速率:VPC每秒發送到NAT Gateway的流量。

    出方向流量(bytes)

    出方向所消耗的流量,包括:

    • 入公網流量:NAT Gateway發送到公網的流量。

    • 從VPC來流量:VPC發送到NAT Gateway的流量。

    出方向包速率(countS)

    出方向每秒接受的資料包數量,包括:

    • 入公網包速率:NAT Gateway每秒發送到公網的包數量。

    • 從VPC來包速率:VPC每秒發送到NAT Gateway的包數量。

    出方向包量(count)

    出方向所消耗的資料包數量,包括:

    • 入公網包量:NAT Gateway發送到公網的包數量。

    • 從VPC來包量:VPC發送到NAT Gateway的包數量。

公網NAT Gateway流量監控

異常的ECS執行個體流量會影響其他ECS執行個體的SNAT公網訪問。開啟網關流量監控功能,您可以查看SNAT轉寄流量監控資料,快速定位流量消耗最大的ECS執行個體,然後您可以對該ECS執行個體進行流量管控,實現快速定位並解決故障,提高業務的穩定性。查看網關流量監控前,請確保滿足以下條件:

  1. 登入NAT Gateway管理主控台
  2. 在頂部功能表列,選擇公網NAT Gateway的地區。
  3. 公網NAT Gateway頁面,找到目標公網NAT Gateway執行個體,然後在操作列單擊管理
  4. 基本資料頁簽,單擊右側監控頁簽。

  5. 單擊網關流量情況頁簽,查看網關流量監控資料。

    image

    • 在時間欄中設定要查看流量監控資料的時間,時間為分鐘級。例如,您設定要查看的時間2024年07月18日18:30,則您可以查看2024年07月18日18:30:00~2024年07月18日18:31:00的流量監控資料。

      說明
      • 開啟網關流量監控後,您需要等待15分鐘,才能查看網關流量監控資料。

      • 網關流量監控功能展示的監控資料可能存在3~5分鐘的延遲。例如,您只能在2024年07月18日18:30查看2024年07月18日18:25時間點之前的流量監控資料,而不能查看2024年07月18日18:25時間點之後的流量監控資料。

      • 網關流量監控功能可以展示流量消耗最大的前100個ECS執行個體的流量資訊。

    • 網關流量監控的具體監控資料和說明如下表所示。

      監控資料

      單位

      說明

      入方向頻寬

      bps

      說明

      以控制台顯示為準。

      從公網進入ECS執行個體的頻寬。

      出方向頻寬

      bps

      說明

      以控制台顯示為準。

      從ECS執行個體發往公網的頻寬。

      入方向包速率

      個/秒

      從公網每秒進入ECS執行個體的包數量。

      出方向包速率

      個/秒

      從ECS執行個體每秒發往公網的包數量。

      並發串連數

      ECS執行個體通過NAT Gateway訪問公網的活躍串連數量。

      建立串連數

      個/秒

      ECS執行個體通過NAT Gateway每秒發起的建立串連數量。

公網NAT Gateway綁定的Elastic IP Address監控

  1. 登入NAT Gateway管理主控台
  2. 在頂部功能表列,選擇公網NAT Gateway的地區。
  3. 公網NAT Gateway頁面,找到目標公網NAT Gateway執行個體,然後在操作列單擊管理
  4. 單擊監控和日誌頁簽,然後單擊NAT綁定的Elastic IP Address監控頁簽,查看監控指標。

    image

    具體監控指標如下表所示。

    監控項

    說明

    流入頻寬

    從公網進入ECS執行個體的頻寬,單位:bps。

    流出頻寬

    從ECS執行個體發往公網的頻寬,單位:bps。

    流入包速率

    每秒從公網進入ECS執行個體的包數量,單位:pps。

    流出包速率

    每秒從ECS執行個體發往公網的包數量,單位:pps。

    出方向限速丟包速率

    限制每秒丟包的數量,單位:pps。

    入方向限速丟包速率

    限制每秒丟包的數量,單位:pps。

    網路流入頻寬利用率

    從公網進入ECS執行個體的頻寬的利用率。

    網路流出頻寬利用率

    從ECS執行個體發往公網的頻寬的利用率。

建立閾值警示規則

如果您需要監控公網NAT Gateway執行個體的使用和運行情況,您可以通過建立閾值警示規則,即時監控公網NAT Gateway執行個體運行情況,保證業務的穩定。

  1. 登入CloudMonitor控制台

  2. 在左側導覽列,選擇警示服務 > 警示規則

  3. 警示規則頁面,單擊建立警示規則

  4. 建立警示規則面板,設定警示規則相關資訊,然後單擊確認

    本文僅列舉與NAT Gateway強相關的配置項。關於其餘配置項,請參見建立警示規則

    參數

    說明

    產品

    CloudMonitor可管理的產品名稱。例如:增強型NAT Gateway。

    資源範圍

    警示規則的作用範圍。取值:

    • 全部資源:表示該規則作用在使用者名稱下對應產品的全部執行個體上。例如:您設定了全部資源粒度的MongoDB CPU使用率大於80%警示,則只要使用者名稱下有MongoDB CPU使用率大於80%,就會發送警示通知。資源範圍選擇全部資源時,警示的資源最多1000個,超過1000個可能會導致達到閾值不警示的問題,建議您使用應用分組按業務劃分資源後再設定警示。

    • 執行個體:表示該規則只作用在某個具體執行個體上。例如:您如果設定了執行個體粒度的主機CPU使用率大於80%警示,則當該執行個體CPU使用率大於80%時,會發送警示通知。

    規則名稱

    警示規則的名稱。

    規則描述

    警示規則的主體,定義在監控資料滿足指定條件時,觸發警示規則。例如:CPU使用率5分鐘平均值>=90%,持續3個周期,則警示服務5分鐘檢查一次資料是否滿足平均值>=90%,只檢測3次。

    通道沉默周期

    指警示發生後如果未恢複正常,間隔多久重複發送一次警示通知。

    生效時間

    警示規則的生效時間,警示規則只在生效時間內才會檢查監控資料是否需要警示。

    警示連絡人群組

    發送警示的連絡人群組。

    進階設定

    警示回調

    填寫公網可訪問的URL,CloudMonitor會將警示資訊通過POST請求推送到該地址,目前僅支援HTTP協議。

    無資料處理方法

    無監控資料時警示的處理方式。取值:

    • 不做任何處理(預設值)

    • 發送無資料警示

    • 視為恢複

    標籤

    警示規則的標籤。包括標籤名稱和標籤值。

相關文檔