すべてのプロダクト
Search
ドキュメントセンター

Cloud Monitor:リリースノート

最終更新日:Dec 19, 2025

このトピックでは、CloudMonitor エージェントのリリースノートについて説明します。

4.0.0.1

カテゴリ

説明

リリース日

2025-10-17

新機能

  1. GPU:

    • NVIDIA ドライバーバージョン 580 以降に対応しました。`power_draw` パラメーターが `instant_power_draw` に変更されたことにより、以前はメトリックがデータを報告しなかった問題を修正しました。

  2. プラグイン可能な機能を導入しました。この機能により、タスクを個別のプロセスで実行できるようになり、エージェント全体の安定性が向上し、詳細なリソース割り当てが可能になります。

  3. エージェントバージョン 3.5.11 以降で、HTTPS アクセス時のサーバ名表示 (SNI) のサポートを追加しました。

最適化

  1. Windows での起動時のメモリ使用量を 150 MB 超から 10 MB 未満に削減しました。これは、以前はアプリケーションのメモリ使用量を 1 MB 増加させていたスタックトレースライブラリを最適化することで実現しました。

  2. PowerShell インストールスクリプトを最適化しました。Alibaba Cloud 以外の ECS インスタンスへのインストール時に `agent.properties` ファイルを復元する際に発生していた警告を修正しました。

修正された問題

  1. `PdhOpenQuery` (win32) 関数の失敗時にエージェントが起動できない問題を修正しました。

  2. Alibaba Cloud Linux 4 で `/var/run` ディレクトリが存在しないためにエージェントが失敗する問題を修正しました。パスは `/var` に置き換えられました。

4.0.0

カテゴリ

説明

リリース日

2025-09-23

新機能

  1. GPU:

    • AMD GPU のサポートを追加しました。メトリックは `amd-smi` を使用して収集されます。このツールは AMD ドライバーパッケージに含まれていないため、手動でインストールする必要があります。

    • Iluvatar CoreX GPU のサポートを追加しました。

    • ドライバーバージョン 535 以降の NVIDIA GPU では、`-pm 1` パラメーターは呼び出されなくなりました。このパラメーターを呼び出すと、予期しない GPU の動作を引き起こす可能性がありました。

  2. NVMe ディスクのシリアル番号の取得をサポートしました。

  3. 構造化プロセス言語 (SPL) の構造化ログをサポートしました。

  4. 新しいメトリックを追加しました:

    • `acs/host` 名前空間にある `sys_fs` (Linux のみ)。

  5. 4 つの新しいリージョンをサポートしました:

    • メキシコ (na-south-1)

    • 米国 (アトランタ) (us-southeast-1)

    • 中国 (ウランチャブ) Apsara Stack Enterprise (cn-wulanchabu-acdr-1)

    • 中国 (ウランチャブ) General Industry Cloud (cn-wulanchabu-gic-1)

  6. インストールスクリプトをバージョン 1.16 にアップグレードしました:

    • インストール中に以前の構成 (`agent.properties`、`agent.json`、`accesskey.properties`) を保持します。これにより、再インストールまたはアップグレード後の構成の損失を防ぎます。

    • バージョンが同じでアップグレードが不要な場合、終了する前にダウンロードしたインストールパッケージを削除します。

    • Argus エージェントは、デフォルトでは Cloud Phone にインストールされなくなりました。インストールするには、`ENABLE_WUYING=True` 変数を含める必要があります。

    • ソブリンクラウドのサポートを追加しました。

    • セキュリティ強化専用モードのサポートを追加しました。

最適化

  1. `argusagent_service` にメーカー情報を追加しました。これは、ホワイトリストの管理に役立ちます。

  2. Linux のファイルシステム監視では、`/etc/mtab` が存在しない場合、エージェントは `/proc/mounts` の読み取りを試みるようになりました。

  3. セキュリティ強化を向上させました。ECS MetaServer のセキュリティ強化専用モードのサポートを追加しました。

  4. ping 操作の安定性を向上させました。

  5. ping のターゲットがドメイン名の場合、ping タスクが開始されるたびに IP アドレスが再解決されます。これにより、期限切れの IP アドレスによる不正確な ping 結果を防ぎます。

  6. Windows での自己監視では、開いているファイル数のデフォルトのしきい値は 999,999 に設定されています。このメトリックは Windows 上で大きく変動するため、適切な しきい値を設定することが困難でした。

  7. MetaServer へのアクセス時に NoProxy モードを有効にしました。

  8. `acs_host/system.process.agent` データに `main_ip` と `host_name` フィールドを追加しました。これらのフィールドは、MetaServer のエラーによって引き起こされる `instanceId` の競合が発生した場合にインスタンスを区別するのに役立ちます。これにより、異常なマシンを迅速に特定できます。

修正された問題

  1. NVIDIA GPU ドライバーバージョン 535 以降の `-pm 1` 呼び出しを削除しました。

  2. エージェントが `docker ps` コマンドによってブロックされ、starting... でスタックする問題を修正しました。解決策は、遅延読み込みモードを使用することです。このモードは、起動時の Pouch および Docker 環境の検出をバイパスし、必要な場合にのみ検出します。これにより、ログ収集などの機能でブロックが発生する可能性はありますが、基本メトリックの収集には影響しません。

  3. グループプロセスの監視からのすべてのキーワードは小文字に変換されます。

  4. Windows でのメモリアクセス違反の問題を修正しました。

  5. Ascend GPU の新しい出力フォーマットをサポートしました。

  6. Telnet の送信元ポートと双方向プローブをサポートしました。

  7. `std::ifstream` を使用して一部の Linux ディストリビューションで存在しないファイルを読み取ると SIGABRT シグナルが発生し、エージェントが異常終了する問題を修正しました。

重要

バージョン 4.0.0 以降、32 ビット Linux はサポートされなくなりました。

3.5.12

カテゴリ

説明

リリース日

2024-10-09

新機能

  • 新しいリージョンをサポートしました:

    • 杭州 Apsara Stack Enterprise KS01。

    • 中国 (成都) Ant Financial Cloud (cn-chengdu-ant)。

  • インド (ムンバイ) (ap-south-1) リージョンを削除しました。

  • タスクスケジューリングクロックをシステムクロックから単調クロックに変更しました。これにより、システム時刻の調整によって引き起こされるタイミングの問題を防ぎます。

  • tool curl コマンドを追加しました。このコマンドは、ターゲットアドレスをプローブし、対話プロセスを出力して、オンサイトでのトラブルシューティングを支援します。

    /usr/local/cloudmonitor/bin/argusagent tool curl --help
    
    Usage: argusagent tool curl [options] url
    Allowed options:
      -h [ --help ]               Print this help message
      -X [ --request ] arg (=GET) Specifies a custom request method to use.
      --url arg                   Target url.
      -d [ --data ] arg           Only for POST, http bod.y
      -H [ --header ] arg         Extra header to use.
      -m [ --max-time ] arg (=30) Maximum time in seconds that you allow the whole operation to take.
      -x [ --proxy ] arg          Use the specified proxy, format: [protocol://]host[:port].
      --proxy-user arg            Specify the user name to use for proxy authentication.
      --proxy-pass arg            Specify the password to use for proxy authentication.
      --proxy-http2               Negotiate HTTP version 2 with an HTTPS proxy. The proxy might still only offer HTTP/1 and
                                  then curl sticks to using that version. This has no effect for any other kinds of
                                  proxies.
      --json arg                  Json object config, this will ignore all other options.
      --json-file arg             Json object config file, this will ignore all other options.
      --task-id arg               Detect once of http task with taskId
  • `-e GetTopTasks` パラメーターを追加しました。これにより、実行時に上位 20 タスクの時間消費を動的に表示できます。

    Linux

    # CoreOS でのパスは /opt/cloudmonitor/bin/argusagent です。
    /usr/local/cloudmonitor/bin/argusagent -e GetTopTasks

    Windows

    "C:\Program Files\Alibaba\cloudmonitor\bin\argusagent.exe -e GetTopTasks
  • ハートビートとメトリックレポートのログにプロキシ情報を追加しました。これにより、エージェントが必ずしもパブリックネットワークを使用しているわけではないことが明確になります。

  • プロセス監視のタグ付けをサポートしました。

  • 自己監視メトリックを追加しました:基本メトリックが 2 分間連続して収集されない場合、エージェントは自動的に再起動します。

  • GPU:Linux での Ascend および Hygon GPU のサポートを追加しました。

  • インストールスクリプトをバージョン 1.13 にアップグレードしました。

    • スクリプトの依存関係を bash から sh に引き下げました。これにより互換性が向上し、Android などのより広範なシステムにエージェントをインストールできるようになります。

    • 手動インストール時のカスタムプロキシのサポートを追加しました。以前は、カスタムプロキシはインストールスクリプトのダウンロードにのみ使用できました。

    • ダウンロード後の自己チェックを追加しました。新しいインストールパッケージが有効な場合にのみ、古いバージョンがアンインストールされます。これにより、wget などのツールによる不完全なダウンロード (空のパッケージ) に起因する障害を防ぎます。

    • インストールログを最適化し、読みやすく、トラブルシューティングに使いやすくしました。

    • Windows でローカルパッケージファイル (`-packageFile`) からのインストールをサポートしました。これにより、ダウンロードプロセスがスキップされます。

    • プロキシを使用してサードパーティホストにエージェントをインストールする際に発生したバグを修正しました。このバグは、最初のダウンロードが成功した後、プロキシなしでインストールパッケージが再度ダウンロードされる原因となっていました。

    • Cloud Phone のサポートを追加しました。この機能は、エンドユーザー向けではなく、Cloud Phone プロダクト向けです。

修正された問題

  • インストール中に `argusagent` サービスがサービスとして正しく開始されない問題を修正しました。

  • 可用性監視は複数のヘッダーをサポートしていません。

  • Linux で `hostname -i` コマンドが複数の IP アドレスを返す問題を修正しました。

  • API を介して Telnet タスクを作成する際に、ホストと URI の両方の使用を妨げていた互換性の問題を修正しました。

  • 非 ECS モードで、`bin` ディレクトリ内の `accesskey.properties` ファイルが認識されない問題を修正しました。

  • Linux で、ディスクにシリアル番号がない場合に `udevadm` が繰り返し呼び出される問題を修正しました。

  • HTTPS/2 プロキシ設定が有効にならない問題を修正しました。

  • パケット損失率が高い場合の ping タスクの不均一なタスクスケジューリングを修正しました。この問題は、3 タイマーアルゴリズムにおける不正確なタイミングの想定が原因でした。ロジックは現在、パケットの受信とタイムアウトの両方によってトリガーされるイベント駆動型になりました。

  • 可用性監視タスクが更新されたときに、古いタスクが時々クリアされない問題を修正しました。

  • 可用性監視タスクの更新時に時々発生する SIGSEGV エラーを修正しました。

  • Windows で、パフォーマンスカウンターのデータが異常または欠落している場合にメモリメトリックが取得できない問題を修正しました。

  • Windows でのメモリリークを修正しました。`CommandLineToArgvW` によって返される値は、`GlobalFree` 関数ではなく `LocalFree` 関数を使用して正しく解放されるようになりました。

3.5.11

カテゴリ

説明

リリース日

2024-03-25

新機能

  • Windows x64 の公式サポートを追加しました。

  • IPv6 のサポートを追加しました。

  • HTTP/2 のサポートを追加しました。

  • Sigar ライブラリに基づいて、macOS と FreeBSD のサポートを追加しました。

  • プロキシサポートを HTTP、HTTPS、HTTPS/2、SOCKS4、SOCKS4A、SOCKS5、SOCKS5h の 7 つのプロトコルに拡張しました。

  • 以下の GPU 拡張機能を追加しました:

    • C:\Windows\System32\nvidia-smi.exe のサポートを追加しました。

    • エージェントの実行中に GPU をインストールできるようになりました。つまり、エージェントの後に GPU をインストールできます。

    • ダイナミックリンクライブラリ (libnvml) に基づく GPU データ収集のサポートを追加しました。これにより、データ収集がより安全かつ高速になります。

      説明

      ダイナミックリンクライブラリは、nvidia.nvml.enabled=true を設定して手動で有効にする必要があります。これにより、一部のシステムでコマンドで有効にすると発生する可能性のあるフリーズを回避できます。

  • 可用性プローブの有効時間は cron 式をサポートするようになりました。

  • Prometheus データ収集は、HTTP ヘッダーを使用した認証をサポートするようになりました。

  • 以下のリージョンをサポートしました:

    • cn-wuhan-lr:武漢ローカルリージョン。

    • cn-qingdao-acdr-ut-1 は青島 Haier 専用クラウドです。

  • 以下の 4 つのメトリックを削除しました:

    • system.udp

    • system.task:システムプロセスまたはスレッドの数

    • memory.swap:Linux のスワップ領域

    • system.cpuCore:各 CPU コアのメトリック

修正された問題

  • Windows で、プロセスのメモリ使用量が 4 GB を超えても 4 GB のメモリ使用量しか報告されない問題を修正しました。

  • 一部のシステムで名前解決が 20 秒以上ハングする問題を修正しました。

  • 一部の Prometheus メトリックの解析に失敗する問題を修正しました。

  • ログ収集が CPU リソースを大量に消費する問題を修正しました。

  • 可用性監視で、ping が失敗すると後続のプローブが停止する問題を修正しました。

  • ホストのシリアル番号に改行文字が含まれる可能性がある問題を修正しました。

  • 同じ Telnet タスクに対して複数のプローブを実行すると ArgusAgent がクラッシュする可能性がある問題を修正しました。

  • 非標準の SOCKS5 サポートに関する問題を修正しました。

  • Windows で WMIC ツールが見つからない問題を修正しました。

  • std::locale("") がサポートされていないためにエージェントが起動に失敗する問題を修正しました。

  • 複数の潜在的なメモリリークを修正しました。

  • メイン関数が終了するときに `localTimeCache` が無効になることによって引き起こされる SIGSEGV エラーを修正しました。

    説明

    通常の終了時にコアダンプファイルが生成されます。

パフォーマンスの最適化

  • 安定性を向上させました。システムプロセスの数が設定可能な しきい値 (デフォルトは 5,000) を超えると、エージェントはプロセスの監視を停止します。これにより、過剰なリソース消費を防ぎます。

  • プラグインをアップグレードすると、インストールパッケージが自動的にダウンロードされ、インストールが成功した後に削除されます。

  • JSON 設定ファイルの互換性を向上させました。エージェントは、C スタイルのコメント、末尾のカンマ、および非標準の UTF-8 エンコーディングをサポートするようになりました。

  • パブリッククラウドのログ収集では、JSON パーサーが非 JSON のプレフィックスとサフィックスをサポートするようになりました。

  • ディスクデータ収集タイマーをシステムクロックからハードウェアクロックに変更しました。これにより、システムクロックの調整によるタイミングエラーを防ぎます。

  • ディスクデータ収集では、マウントされたすべてのディスクディレクトリを連結した文字列である mount_point/dir_name は、最大長 2,048 バイトに制限されます。

    説明

    この制限は `agent.resource.dirName.limit` パラメーターを使用して調整できます。デフォルト値は 2,048 バイトです。1,024 バイト未満の値を設定した場合、デフォルトで 1,024 バイトになります。

3.5.10

カテゴリ

説明

リリース日

2023-09-08

新機能

  • moduleTask.json ファイルで機能を無効にできるようになりました。機能を無効にするために削除する必要はなくなりました。

  • argusagent tool top ツールを追加しました。これにより、開いているファイル数 (-by fd)、メモリ使用量 (-by mem)、または CPU 使用率 (-by cpu) に基づいて上位 N 個 (-n N) のプロセスをソートして表示できます。

  • GPU データ収集を無効にするサポートを追加しました。

  • エージェントの実行中に動的な GPU データ収集をサポートしました。

  • エージェントの実行中に CPU コア数を動的に変更するサポートを追加しました。

  • クラウドアシスタントによって管理される Alibaba Cloud 以外のホストをサポートしました。

説明

エージェントが異常終了すると、ミニダンプファイルが生成されます。プロセスが再度起動すると、ミニダンプファイルが CloudMonitor に報告されます。このファイルは、エージェントの安定性を向上させるためのバックエンド分析とバグ修正に使用されます。

修正された問題

  • 特定のタイムゾーンでデータが報告されない問題を修正しました。

  • 上位 5 つのプロセスの開いているファイル数が異常である問題を修正しました。

  • プロセス ID が 1,000,000 を超えた場合に報告されるデータで精度が失われる問題を修正しました。

  • 一部の既存ユーザーのホストにエージェントをインストールした後、Windows で argusagent を起動できない、または必要なダイナミックリンクライブラリが見つからない問題を修正しました。

  • Windows の設定ファイルで CRLF 文字を読み取る際の問題を修正しました。

  • プロセス数の最初の収集がスキップされ、値が 0 になる問題を修正しました。

パフォーマンスの最適化

  • プロセス監視のパフォーマンスを最適化し、エージェントの予期しない終了の頻度を減らしました。

  • Windows オペレーティングシステムでのエージェントのインストール成功率を向上させました。

  • リソース制限を超えた場合、エージェントはリソース (CPU など) の上位 10 のコンシューマーを収集し、すべてのスレッドの呼び出しスタックを列挙するようになりました。これは、エージェントのリソース使用量を分析するのに役立ちます。

3.5.8

カテゴリ

説明

リリース日

2022-06-30

新機能

  • ファイルの配布と保存機能を追加しました。

  • ネットワークパケット損失、エラー率、およびゾンビプロセスの数のメトリックを追加しました。

  • デバイス使用率とスワップ使用率のメトリックを追加しました。

修正された問題

  • dir_name の連結長を 512 バイトに削減しました。

  • Windows で、`GetUptime` 関数がシステムモジュールによって冗長に呼び出される問題を修正しました。

  • IphlpapiGetTcpTable 関数によって引き起こされるメモリリークの問題を修正しました。

  • cpu.total メトリックが 1-cpu.idle ではなく cpuPercent.combined として誤って計算される問題を修正しました。

  • ping プローブが、データ送信先の宛先 IP アドレスとデータ受信元の送信元 IP アドレスが一致するかどうかを正しくチェックしない問題を修正しました。また、ICMP シリアル番号の衝突問題も修正しました。

  • Windows で、レジストリ内のパス (`imagePath`) にスペースが含まれている場合に `argusagent` サービスが起動に失敗する問題を修正しました。

3.5.7

カテゴリ

説明

リリース日

2022-04-30

新機能

TCP メトリックのサポートを追加しました。

修正された問題

  • ディスクディレクトリの連結により、過度に大きなデータが報告される問題を修正しました。

  • Alibaba Cloud 国際サイトのプロキシはポーリングしません。

  • Win32 で .py ファイルのファイルの関連付けが変更される問題を修正しました。

3.5.5

カテゴリ

説明

リリース日

2021-12-30

新機能

ログ収集のサポートを追加しました。

修正された問題

なし

3.5.4

カテゴリ

説明

リリース日

2021-12-16

新機能

  • Windows でのプロセス収集で中国語のプロセス名をサポートしました。

  • Windows での中国語のユーザー名をサポートしました。

修正された問題

  • コンテナサービスが時々、誤った CPU コア数を報告する問題を修正しました。

  • Windows での IP アドレス解決エラーを修正しました。

  • プロセスのスレッド数を収集する際に CloudMonitor エージェントが時々終了する問題を修正しました。

  • 可用性監視の ping プローブが正しく機能しない問題を修正しました。

  • 可用性プローブのスケジューリング間隔が、設定された間隔よりも時々長くなる問題を修正しました。

3.5.3

カテゴリ

説明

リリース日

2021-09-10

新機能

  • Exporter を使用したデータ収集をサポートしました。

  • HTTP 可用性監視タスクは、HTTPS プロトコルのリダイレクトをサポートするようになりました。

  • HTTP 可用性監視タスクは、より多くの SSL 暗号をサポートするようになりました。

  • デフォルトでは、HTTP 可用性監視タスクは curl ツールと同じように動作し、`user_agent` などのヘッダーを含むようになりました。

修正された問題

  • IPv6 接続を持つホストで TCP 接続メトリックの計算が時々誤る問題を修正しました。

  • ディスク使用率メトリックの精度を整数から小数点以下を含むように改善しました。

  • プロセスの `cred` メトリックを収集する際にエージェントが時々無効になる問題を修正しました。

3.5.2

カテゴリ

説明

リリース日

2021-06-30

新機能

  • 可用性監視タスクの監視頻度を調整できるようになりました。

  • 可用性監視の使いやすさを最適化しました。たとえば、ローカルログがより包括的かつ標準化されました。

  • システムの最後の起動からの実行時間を示す Uptime メトリックを追加しました。

修正された問題

Windows 版 CloudMonitor エージェントのダイナミックリンクライブラリの欠落などの問題を修正しました。

3.4.10

カテゴリ

説明

リリース日

2021-03-11

新機能

なし

修正された問題

Alibaba Cloud 以外のホストに接続した後、エージェントが AccessKey パスを読み取れない問題を修正しました。

3.4.9

カテゴリ

説明

リリース日

2021-01-05

新機能

SOCKS5 プロキシのサポートを追加しました。

修正された問題

Windows Server 2012 以前を実行している Alibaba Cloud 以外のホストで、特定のダイナミックリンクライブラリが欠落している問題を修正しました。

3.4.8

カテゴリ

説明

リリース日

2020-11-17

新機能

なし

修正された問題

可用性監視が URL を正しく解析できない問題を修正しました。

3.4.7

カテゴリ

説明

リリース日

2020-07-27

新機能

  • サポートされるメトリック:ディスク I/O と単一 CPU コア使用率。

  • リソース消費の削減:エージェントは、より少ないハードウェアリソースを消費し、メトリック収集中のシステム負荷への影響を少なくするためにリファクタリングされました。

  • 自己保護メカニズムを導入しました。高いシステム負荷やその他の理由でシステムリソースの消費が制限を超えた場合、エージェントは自動的に終了します。

修正された問題

Go バージョンの CloudMonitor エージェントで、システム時刻を自動的に変更するなどの問題を修正しました。

以前のバージョン

詳細については、「以前のバージョン」をご参照ください。