すべてのプロダクト
Search
ドキュメントセンター

Elastic Compute Service:概要

最終更新日:Aug 26, 2024

システムイベントはAlibaba Cloudによって定義され、O&Mタスクの実行状態、リソース例外、リソースのステータスの変更などのリソース情報通知を記録および送信します。

説明

Elastic Compute Service (ECS) 、ApsaraDB RDS、Server Load Balancer (SLB) など、多くのAlibaba Cloudサービスがシステムイベントをサポートしています。 このトピックでは、ECSシステムイベントについてのみ説明します。 他のAlibaba Cloudサービスのシステムイベントについては、関連ドキュメントをご参照ください。

制限事項

廃止されたインスタンスファミリーは、システムイベントをサポートしません。 詳細は、「廃止されたインスタンスタイプ」をご参照ください。

システムイベントの利用シナリオ

  • リスクと例外の通知

    ECSコンソールに表示されないシステムイベントがトリガーされると、Alibaba CloudはイベントをECSコンソールにプッシュします。 イベントには、ECSリソースの可用性とパフォーマンスに影響を与えるイベントが含まれます。たとえば、スケジュールされたO&MイベントのSystemMaintenance.Rebootイベントや、インスタンスの課金イベントのInstanceExpiration.Stopイベントなどです。 特定の重要なシステムイベントについては、Alibaba Cloudから 追加の電子メールまたは内部メッセージ。 ECSコンソールまたはAPI操作を呼び出すことで、イベントを処理できます。 リソースの可用性とパフォーマンスを確保するために、システムイベントをできるだけ早く処理することを推奨します。 詳細については、「ECSシステムイベントの照会と処理」をご参照ください。

    たとえば、サブスクリプションインスタンスの有効期限が切れると、ECSコンソールは、サービスの継続性を確保するために、特定の期間内にインスタンスを更新するように求めます。

  • 自動化 O&M

    ECSコンソールに表示されるシステムイベントの状態は、システムO&Mタスクの実行状態を理解するのに役立つように定義されています。 一方、新しいシステムイベントとシステムイベントのステータスの変更は、CloudMonitorに報告されます。 これにより、ビジネス要件に基づいてイベント駆動型の自動O&Mシステムを構築できます。 イベントの状態の詳細については、このトピックの「システムイベントの状態とウィンドウ」をご参照ください。

    説明

    各イベント状態は、CloudMonitorイベントに対応します。 たとえば、Executing and Executedは、InstanceFailure.Reboot ECSイベントコードが、Instance:InstanceFailure.Reboot:Executing and InstanceFailure.Reboot:Executed CloudMonitorイベントに対応することを示しています。

    一部のステータス変更イベントはECSコンソールに表示されず、ECSコンソールまたはAPI操作で処理できません。 イベントの例としては、インスタンスの状態の変化やプリエンプティブルインスタンスの中断を示すイベントがある。 システムイベントの状態はECSで定義されていません。 ただし、イベントがトリガーされると、イベントはCloudMonitorに報告されます。 これにより、ビジネス要件に基づいてイベントトリガーの自動O&Mシステムを構築できます。

    たとえば、ステータス変更イベントは、インスタンスの起動または停止時にトリガーされます。 イベントはリスクや例外を示すものではありません。 操作をシステムにログに記録する場合は、ステータス変更イベントのイベント通知を設定し、アラートコールバック機能を使用してインスタンスの起動および停止情報を操作ログに書き込むことができます。

システムイベントのカテゴリ

システムイベントは、リソース情報通知を記録および送信するためにAlibaba Cloudによって定義されています。 システムイベントは, イベントの原因に基づいて, 次の表に示すカテゴリに分類されます。

説明

ECSでサポートされているシステムイベントカテゴリとECSシステムイベントの処理方法については、「概要」をご参照ください。

カテゴリ

説明

ECSコンソールに表示

スケジュールされたO&Mイベント

アリババクラウドは、セキュリティ上の理由からホストソフトウェアをアップグレードするか、基礎となるホストハードウェアおよびソフトウェアにある障害リスクを予測および処理する必要がある場合がある。 このような場合、Alibaba Cloudによって実行されるO&MタスクがECSリソースの可用性またはパフォーマンスに影響を与える可能性がある場合、Alibaba Cloudは事前にスケジュールされたO&Mイベントをトリガーして送信し、実行時間、オブジェクト、影響などのタスクの詳細を通知します。 スケジュールされたO&Mイベントを受け取った後、イベント実行ウィンドウ内のオフピーク期間中にO&Mイベントを処理して、ビジネスへの影響を最小限に抑えることができます。

説明

スケジュールされたO&Mイベントは、プロアクティブなO&Mイベントとも呼ばれ、数百万のサーバーでのAlibaba CloudのO&Mエクスペリエンス、数万の大企業顧客にサービスを提供する能力、および基盤となるホストハードウェアまたはソフトウェアにある障害リスクを予測および処理するAlibaba DAMO Academyの最先端の機械学習アルゴリズムに基づいています。 ホストの障害リスクを防ぐことができない場合、Alibaba CloudはスケジュールされたO&Mイベントを使用して事前に通知します。 これにより、障害が発生する前にビジネスを切り替えることができます。 スケジュールされたO&Mイベントに最も早い機会に応答しない場合、障害が発生したときにECSインスタンスが故障または再起動する可能性があります。

課金されます

説明

ビッグデータインスタンスファミリーのインスタンス、またはローカルSSDを搭載したインスタンスファミリー (i4pインスタンスファミリーを除く) に対して、スケジュールされたO&Mイベントがトリガーされると、[ローカルディスクベースのインスタンスイベント] ページにイベントが表示されます。 ローカルディスクベースのインスタンスイベントの詳細については、「ローカルディスクを搭載したインスタンスのO&Mシナリオとシステムイベント」をご参照ください。

予期しないO&Mイベント

このカテゴリのシステムイベントは、カーネルパニック、メモリ不足 (OOM) エラー、基になるホストのハードウェアまたはソフトウェア障害などの予期しない問題が原因でECSインスタンスが再起動または故障した場合にトリガーされます。 Alibaba Cloudは、トリガーされた後にイベントを送信し、影響を受けるECSリソースをできるだけ早く復元します。 Alibaba Cloudは、イベントに関連するシステムO&Mタスクの実行状態も通知します。

説明

ほとんどの場合、予期しないO&Mイベントは、基になるホストの予期しない障害またはECSインスタンスのオペレーティングシステムのカーネルエラーによるECSインスタンスの突然のダウンタイムまたは再起動を指します。

  • ホスト障害 (SystemFailure.Reboot) によって引き起こされるECSインスタンスのダウンタイムまたは再起動イベントは時折発生し、避けられません。 1つのインスタンスのSLA (Service Level Agreement) に違反した場合、Alibaba Cloudは関連サービスのSLAに基づいて補償金を支払います。

  • ほとんどの場合、オペレーティングシステムのカーネルエラー (InstanceFailure.Reboot) によって引き起こされるECSインスタンスの再起動イベントは、アプリケーションによって引き起こされます。 ダンプファイルをキャプチャして原因を分析できます。

課金されます

説明

ビッグデータインスタンスファミリーのインスタンス、またはローカルSSDを搭載したインスタンスファミリー (i4pインスタンスファミリーを除く) に対して予期しないO&Mイベントがトリガーされると、そのイベントは [ローカルディスクベースのインスタンスイベント] ページに表示されます。 ローカルディスクベースのインスタンスイベントの詳細については、「ローカルディスクを搭載したインスタンスのO&Mシナリオとシステムイベント」をご参照ください。

ローカルディスクベースのインスタンスイベント

このカテゴリのシステムイベントには、ローカルディスクおよびローカルディスクを備えたインスタンスに対してトリガーされるシステムイベントが含まれます。 ローカルディスクに対してトリガーされるシステムイベントには、ローカルディスクが損傷したときにトリガーされるシステムイベントが含まれます。 ローカルディスクを搭載したインスタンスに対してトリガーされるシステムイベントには、ローカルディスクを搭載したインスタンスがローカルディスクの損傷により失敗した場合、またはローカルディスクを搭載したインスタンスに対して基になるホストのハードウェアまたはソフトウェアが故障した場合にトリガーされるシステムイベントが含まれます。

説明

ローカルディスクベースのインスタンスイベントは、システムイベントカテゴリではなく、ビッグデータインスタンスファミリーまたはローカルSSDを備えたインスタンスファミリー (i4pインスタンスファミリーを除く) のインスタンスのスケジュールされたまたは予期しないO&Mイベントを表示し、イベントを扱いやすくするためにのみ使用されます。 ローカルディスクベースのインスタンスイベントの詳細については、「ローカルディスクを搭載したインスタンスのO&Mシナリオとシステムイベント」をご参照ください。

課金されます

バースト可能インスタンスのパフォーマンス制限イベント

このカテゴリのシステムイベントは、バースト可能インスタンスがCPUクレジットを使い果たし、ベースラインCPU使用率またはその近くで実行を開始したときにトリガーされます。 システムイベントは、インスタンス管理、インスタンスO&M、およびアプリケーションの動作に影響を及ぼし、低速アクセスや遅延などの問題を引き起こす可能性があります。

課金されます

インスタンスセキュリティイベント

このカテゴリのシステムイベントは、インスタンスがセキュリティ上の脅威に直面したときにトリガーされます。 たとえば、インスタンスがDDoS攻撃を受けているとき、またはインスタンスのブラックホールフィルタリングがトリガーされたときに、インスタンスセキュリティイベントがトリガーされます。

課金されます

基になるレイヤーでのアップグレードによるインスタンス移行イベント

このカテゴリのシステムイベントは、Alibaba Cloudのインフラストラクチャのアップグレードプランにより、インスタンスを特定のリージョンおよびゾーンから移行する必要がある場合にトリガーされます。 システムイベントに基づいてインスタンスを移行できます。

課金されます

ステータス変更イベント

このカテゴリのシステムイベントは、インスタンスでの [開始] や [停止] などの操作によってインスタンスライフサイクルのステータスが変更された場合、またはインスタンス属性の変更によってインスタンスライフサイクルのステータスが変更された場合、またはその他のステータスが変更された場合にトリガーされます。 ステータス変更イベントは、次のカテゴリに分類されます。

  • ライフサイクルステータス変更イベント: ライフサイクルステータス変更イベントは、インスタンスが別の状態になったとき、プリエンプティブルインスタンスが中断されたとき、スナップショットが作成されたときにトリガーされます。

  • その他の属性変更イベント: たとえば、バースト可能インスタンスのパフォーマンスモードが変更されたとき、またはサブスクリプションディスクが従量課金ディスクに変更されたときに、その他の属性変更イベントがトリガーされます。

  • ライフサイクルステータス変更イベントはECSコンソールに表示されません。

  • その他の特定の属性変更イベントがECSコンソールに表示されます。

システムイベントの重大度

インスタンスの通常の動作に対するシステムイベントの影響に基づいて、次の重要度がシステムイベントに割り当てられます。

  • 重要: 重要なシステムイベントはインスタンスが利用できなくなる可能性があり、できるだけ早い機会に処理する必要があります。 たとえば、料金滞納のためにリソースがリリースされたとき、またはインスタンスエラーのためにインスタンスが再デプロイされたときに、重要なシステムイベントがトリガーされます。

  • 警告: 警告システムイベントはビジネスに影響します。 たとえば、バースト可能インスタンスがパフォーマンスベースラインを超えてバーストできない場合、警告システムイベントがトリガーされます。 イベントをメモするか、必要に応じてイベントを処理する必要があります。

  • 通知: 通知システムイベントはビジネスに影響しません。 たとえば、通知システムイベントは、ディスクのスナップショットが作成されたときにトリガーされます。 通知システムイベントに注意を払うかどうかを選択できます。

システムイベントの状態とウィンドウ

次の表に、ECSコンソールに表示されるシステムイベントに定義されている状態を示します。

説明

さまざまなシステムイベントのサポートされている状態の詳細については、[サマリー] の表の「CloudMonitorイベント」列をご参照ください。

イベント状態

属性

説明

お問い合わせ

中間の状態

システムイベントに関連するO&Mタスクは承認待ちです。 タスクの実行を許可すると、イベントは [実行中] 状態になります。

スケジュール済み

中間の状態

システムイベントに関連するO&Mタスクがスケジュールされ、実行が保留されています。 O&Mタスクが実行されると、イベントはExecuting状態になります。

実行中

中間の状態

システムイベントに関连するO&Mタスクが実行中です。

実行済み

安定

システムイベントに関連するO&Mタスクが完了しました。

回避

安定

影響を受けるインスタンスがユーザー操作ウィンドウ内で移行されるため、システムイベントの影響が防止されます。

失敗した

安定

システムイベントに関連するO&Mタスクに失敗しました。

キャンセル

安定

システムイベントに関连するO&Mタスクは自动的にキャンセルされます。

次の図は、イベントステート間の典型的な遷移を示しています。

image

システムイベントには次のウィンドウがあります。

  • ユーザー操作ウィンドウ

    システムイベントのユーザー操作画面は, イベントの送信時に開始し, 関連するO&Mタスクがスケジュールどおりに実行された時点で終了します。 ユーザーの操作画面内で手動でO&Mタスクを実行したり、システムが自動実行するまで待機したりできます。 ユーザー操作画面の长さについて, 次の项目に注意してください。

    • ほとんどの場合、スケジュールされたO&Mイベントのユーザー操作ウィンドウは24時間から48時間の範囲です。

      説明

      Inquiring状態のシステムイベントでは、ユーザー操作ウィンドウの長さに制限はありません。 イベントに関連するO&Mタスクは、タスクの実行を許可した後にのみ開始できます。

    • ほとんどの場合、障害や不正操作による予期しないO&Mシステムイベントには、ユーザー操作ウィンドウがありません。

    • サブスクリプションインスタンスの有効期限が近づいていることを示すシステムイベントの場合、ウィンドウは3日です。

    • 料金滞納により従量課金インスタンスが停止されようとしていることを示すシステムイベントの場合、ウィンドウは1時間未満です。

  • イベント実行ウィンドウ

    システムイベントの実行画面は、関連するO&Mタスクが実行されると開始され、タスクが完了すると終了します。 イベント実行画面の长さについて, 次の项目に注意してください。

    • 障害回復イベントなどのシステムイベントの場合、ウィンドウは10分以内です。

    • 障害や不正操作による予期しないO&Mイベントは、短いイベント実行ウィンドウを持ちます。

ECSイベントコードとCloudMonitorイベント名の形式

理解しやすいように、ECSイベントコードとCloudMonitorイベントは特定の命名規則に従います。

  • ECSイベントコードは、イベントの原因とリソースへの影響を示し、<event cause>.<event impact> 形式です。

  • CloudMonitorイベント名は、リソースタイプ、イベント原因、リソースへのイベント影響、およびイベント状態を示し、<リソースタイプ >:< イベント原因>.<イベント影響 >:< イベント状態> 形式です。

説明

ECSイベントコードとCloudMonitorイベント名には、前述の情報の一部のみが含まれる場合があります。 たとえば、CloudMonitorイベント名Disk:ErrorDetected:Executingは、ディスクが破損していることを示し、リソースへの影響に関する情報は除外します。

次の表に、ECSイベントコードとCloudMonitorイベント名の例をいくつか示します。

説明

未定義のECSイベントコードは、ECSイベントがECSコンソールに表示されず、ECSコンソールまたはAPI操作で処理できないことを示します。 ECSシステムイベントの詳細については、「概要」をご参照ください。

カテゴリ

ECSイベントコードの例

CloudMonitorイベント名の例

説明

スケジュールされたO&Mイベント

SystemMaintenance.Reboot

インスタンス: SystemMaintenance.Reboot:Inquiring

  • リソースタイプ: インスタンスはECSインスタンスを示します。

  • イベントの原因: SystemMaintenanceは、Alibaba CloudがシステムO&Mタスクをプロアクティブに開始することを示します。

  • イベントの影響: 再起動は、O&Mタスクの実行中にインスタンスが再起動されたことを示します。

  • Event state: Inquiringは、イベントに関連するO&Mタスクが承認待ちであり、タスクの実行を承認した後にのみインスタンスを再起動できることを示します。

予期しないO&Mイベント

エラー検出済み

ディスク: ErrorDetected: 実行中

  • リソースタイプ: ディスクはクラウドディスクを示します。

  • イベントの原因: ErrorDetectedは、ローカルディスクが破損していることを示します。

  • イベント状態: Executingは、破損したローカルディスクが修復されていないことを示します。

ライフサイクル状態変更イベント

Snapshot:CreateSnapshotCompleted

Snapshot:CreateSnapshotCompleted

  • リソースタイプ: Snapshotはスナップショットを示します。

  • イベントの原因: CreateSnapshotCompletedは、スナップショットが作成されたことを示します。

システムイベントに対して実行できる操作

操作

説明と参照

システムイベントを理解する

システムイベントについて学び、イベントコード、名前、重大度、使用シナリオ、制限、状態、および名前形式を理解するには、このトピックを参照してください。

システムイベントを表示する

ECSまたはCloudMonitorコンソールで、またはAlibaba Cloud CLIを使用してシステムイベントを表示できます。

システムイベントの処理

ECSリソースの可用性とパフォーマンスに影響を与えるシステムイベントなど、特定の重要なシステムイベントについては、ECSコンソールで推奨されているようにイベントを処理するか、サービスの可用性を確保するために最も早い機会にAPI操作を呼び出すことを推奨します。

システムイベントの監視

ECSインスタンスで実行されるサービスの安定性を確保し、O&Mを自動化するために、基盤となる環境変更が通知されるようにイベント通知を設定することを推奨します。 イベント通知を設定すると、システムは指定した通知方法を使用して通知を送信します。

システムイベント関連の設定の変更

ビジネス要件に基づいて、システムイベント関連の設定を変更できます。

  • インスタンスのメンテナンス属性を変更して、システムイベントの処理後にインスタンスを再起動するか再デプロイするかを設定できます。 詳細は、「インスタンスメンテナンス属性の変更」をご参照ください。

  • インスタンスの再起動が必要なスケジュール済みシステムイベントの場合、スケジュール済みシステムイベントが処理された後のインスタンスの再起動時間を指定できます。 詳細については、「スケジュールされた再起動時間の変更」をご参照ください。