重要な通知を見逃さないように、主要なモニタリングメトリクスのアラートルールを設定することを推奨します。 Tair (Redis OSS-compatible) インスタンスのCPU使用率やメモリ使用量などのパフォーマンスメトリックが異常な場合、またはインスタンスに対してマスターレプリカ切り替えがトリガーされた場合、CloudMonitorはすぐにアラートを送信します。
背景情報
CloudMonitorは、Alibaba Cloudリソースとインターネットアプリケーションのモニタリングに使用できるサービスです。 これは、すぐに使用できるオールインワンのエンタープライズグレードの監視ソリューションを提供します。 詳細については、「CloudMonitor の概要」をご参照ください。 アラートルールを作成し、設定されたアラートに基づいてメトリックを指定できます。 指定されたメトリックのアラートルールがトリガーされると、アラートが生成され、アラート連絡先グループ内のアラート連絡先に送信されます。
CloudMonitorは、アラート連絡先グループのアラート連絡先にアラートを送信します。 アラート送信先をアラート送信先グループに追加する前に、アラート送信先またはアラート送信先グループを作成する必要があります。 詳細については、「アラート送信先またはアラート送信先グループの作成」をご参照ください。
手順
コンソールにログインし、[インスタンス] ページに移動します。 上部のナビゲーションバーで、管理するインスタンスが存在するリージョンを選択します。 次に、インスタンスを見つけて、インスタンスIDをクリックします。
左側のナビゲーションウィンドウで、アラーム設定 をクリックします。
アラーム設定 ページで、現在のインスタンスのメトリックを表示します。
右上隅の 警告の設定 をクリックしてCloudMonitorコンソールに移動し、アラートルールを追加または管理することもできます。 設定方法:
アラートルールの作成: メトリックの値が指定されたしきい値を超えると、システムはアラートを送信します。 たとえば、インスタンスのCPU使用率がしきい値90% を超えると、システムはアラートを送信します。 このアラートメカニズムを使用すると、リソースの正常性とパフォーマンスに関する情報を常に把握し、例外にタイムリーに対応できます。
ほとんどの場合、ワークロードは、インスタンスのCPU使用率、メモリ使用量、ネットワークトラフィックの変動に敏感です。 主要なメトリックのアラートしきい値を指定することを推奨します。 以下のメトリックとしきい値が参照用に提供されます。
CPU使用率: 60% より大きい。
メモリ使用量: 80% より大きい。
インバウンド帯域幅使用量およびアウトバウンド帯域幅使用量: 80% を超える。
CloudMonitorでサポートされているモニタリングメトリクスの詳細については、「付録1: メトリクス」をご参照ください。
イベント通知のサブスクライブ: インスタンスに障害が発生した場合、マスターレプリカ切り替えを実行した場合、またはインスタンスの移行などのプロアクティブなO&Mタスクを実行した場合、システムはアラートを送信します。 これにより、問題をタイムリーに解決できます。 アラートは、InstanceMaintenance (プロアクティブO&M) やインスタンス例外などのイベントによってトリガーされます。
よくある質問
アラート設定のブロックされたクライアント指標とはどういう意味ですか?
アラートルールを作成するために提供されるノード /ブロックされたクライアントメトリックは、インスタンスでのブロックコマンドの実行によりブロック状態になっているクライアント接続の数を示します。 ブロッキングコマンドは、BRPOP、BLPOP、BZPOPMIN、BZPOPMAX、およびXREADを含む。