すべてのプロダクト
Search
ドキュメントセンター

Elastic Compute Service:故障したローカルディスクの分離

最終更新日:Aug 27, 2024

Elastic Compute Service (ECS) インスタンスをホストする物理マシン上のローカルディスクが破損した場合、ローカルディスクが分離された後もインスタンスは物理マシン上に残ります。 このトピックでは、ECSコンソールおよびAlibaba Cloud CLIを使用して、損傷したローカルディスクを分離する方法について説明します。 このトピックで説明する手順は、ECSインスタンスのローカルディスク関連のシステムイベントを処理する場合にのみ実行できます。

背景情報

分離できるのは、ビッグデータインスタンスタイプのインスタンスが使用する破損したローカルディスクのみです。 次のシステムイベントを処理すると、破損したローカルディスクを分離できます。

  • Disk:ErrorDetectedイベント。ローカルディスクに対して損傷アラートが生成されたときにトリガーされます。

  • SystemMaintenance.IsolateErrorDiskイベント。システムメンテナンスのために破損したローカルディスクを分離する必要がある場合にトリガーされます。

  • SystemMaintenance.RebootAndIsolateErrorDiskイベント。インスタンスを再起動する必要があり、システムメンテナンスのためにインスタンスによって使用されている破損したローカルディスクを分離する必要がある場合に発生します

  • SystemMaintenance.ReInitErrorDiskイベント。システムメンテナンスのために破損したローカルディスクを再初期化する必要がある場合にトリガーされます。

  • SystemMaintenance.RebootAndReInitErrorDiskイベント。インスタンスを再起動する必要があり、システムメンテナンスのためにインスタンスによって使用されている破損したローカルディスクを再初期化する必要がある場合に発生します

詳細については、「ローカルディスクを搭載したインスタンスのO&Mシナリオとシステムイベント」をご参照ください。

手順

ECSコンソールで破損したローカルディスクを分離

  1. ECSコンソールにログインします。

  2. 左側のナビゲーションウィンドウで、[イベント] をクリックします。

  3. [イベント] ページの左側のナビゲーションウィンドウで、[ローカルディスクベースのインスタンスイベント] をクリックします。

  4. [ローカルディスクベースのインスタンスイベント] ページで、[ローカルディスクの損傷イベント] タブをクリックします。

  5. 管理するインスタンスを見つけて、[操作] 列の [修復] をクリックします。

  6. [設定の変更] ステップで、インスタンスの設定ファイルを変更します。 次に、[次へ] をクリックします。

    修改配置

    一部のLinuxインスタンスでは、[構成の変更] 手順が表示されている場合、画面の指示に従って次の操作を実行します。 このセクションでは、/dev/vddという名前の破損したローカルディスクが使用されます。

    1. ECS インスタンスに接続します。

      詳細については、「パスワードまたはキーを使用したLinuxインスタンスへの接続」をご参照ください。

    2. (オプション) アプリケーション層でローカルディスクの読み取りおよび書き込み操作を分離します。

    3. nofailパラメーターをローカルディスクのインスタンスの /etc/fstab設定ファイルに追加します。

      /dev/vdd /mnt/vdd ext4 defaults,barrier=0,nofail 0 0

      パラメーター

      説明

      /dev/vdd

      ローカルディスクのデバイス名。DescribeInstanceHistoryEvents操作によって返されるデバイス値です。

      /mnt/vdd

      ローカルディスクのマウントポイント。mount | grep "/dev/vdd" コマンドを使用して照会できます。

      ext4

      ローカルディスクのファイルシステムタイプ。blkid /dev/vdd1コマンドを使用して照会できます。

      バリア=0

      ファイルシステムのバリアを無効にするために使用されるマウントオプション。

      nofail

      ファイルシステムで指定されたローカルディスクが存在しない場合でも、ECSインスタンスのブートシーケンスが中断されないことを示します。

    4. ローカルディスクをアンマウントします。

      umount /dev/vdd
      重要

      ローカルディスクをアンマウントしない場合、ローカルディスクが分離されて修復された後、ローカルディスクのデバイス名が変更されます。 この場合、アプリケーションは、別のディスクからデータを読み取り、または別のディスクにデータを書き込む可能性があります。

  7. [破損したディスクの分離] ステップで、[OK] をクリックします。

    次のステップが表示されない場合は、ページを更新します。

  8. (オプション) [インスタンスの再起動] ステップで、[再起動] をクリックします。

    [インスタンスの再起動] ステップが表示された場合は、[再起動] をクリックしてインスタンスを再起動します。

    説明

    インスタンスの再起動後、分離された破損したローカルディスクは一時的に1 MiBダミーハードディスクに変換され、その後の操作が容易になります。 アプリケーション層では、破損したローカルディスクの読み取り操作と書き込み操作を継続的に分離し、/etc/fstabファイルでnofailパラメーターを設定する必要があります。

  9. インスタンスの再起動後、[新しいディスクの挿入][OK] をクリックします。

    Alibaba Cloudが、インスタンスをホストしている物理マシン上の破損したローカルディスクを交換するのを待ちます。 ほとんどの場合、交換プロセスは完了するまでに最大5営業日を必要とします。 ローカルディスクを交換すると、ディスクを復元する必要があるイベントが表示されます。

  10. イベントを受信したら、[ディスクの復元][復元] をクリックします。

    次のステップが表示されない場合は、ページを更新します。

  11. (オプション) [インスタンスの再起動] ステップで、[再起動] をクリックします。

    [インスタンスの再起動] ステップが表示された場合は、[再起動] をクリックしてインスタンスを再起動します。

  12. インスタンスの再起動後、[完了] ステップで [完了] をクリックします。

Alibaba Cloud CLIを使用して破損したローカルディスクを分離する

Elastic Compute Service (ECS) インスタンスが作成されました。 Alibaba CLIがインスタンスにインストールされています。 さまざまなオペレーティングシステムにAlibaba Cloud CLIをインストールする方法については、以下のトピックを参照してください。

  1. DescribeInstanceHistoryEvents操作を呼び出して、指定したリージョンで [Inquiring] 状態のシステムイベントを照会し、EventIdDiskId、およびDeviceパラメーターの戻り値を記録します。

    Alibaba Cloud CLIで次のコマンドを実行します。

    aliyun ecs DescribeInstanceHistoryEvents \
    --RegionId <TheRegionId> \
    --InstanceEventCycleStatus.1 Inquiring

    次のコードは、JSON形式のサンプルレスポンスを示しています。

    {
      "InstanceSystemEventSet": {
        "InstanceSystemEventType": [
          {
            "InstanceId": "i-2ze3tphuqvc93ci****3",
            "EventId": "e-2ze9y****wtqcvai68rl",
            "EventType": {
              "Code": 3,
              "Name": "SystemMaintenance.IsolateErrorDisk"
            },
            "EventCycleStatus": {
              "Code": 28,
              "Name": "Inquiring"
            },
            "EventPublishTime": "2017-11-30T06:32:31Z",
            "ExtendedAttribute" : {
              "DiskId": "d-disk1",
              "Device": "/dev/xvda"
            }
          }
        ]
      },
      "PageSize": 10,
      "PageNumber": 1,
      "TotalCount": 1,
      "RequestId": "02EA76D3-5A2A-44EB-****-8901881D8707"
    }
  2. 損傷したローカルディスクを分離する前に、ECSインスタンスにログインして準備をします。

    1. ECS インスタンスに接続します。

      詳細については、「パスワードまたはキーを使用したLinuxインスタンスへの接続」をご参照ください。

    2. (オプション) アプリケーション層でローカルディスクの読み取りおよび書き込み操作を分離します。

    3. インスタンスがLinuxインスタンスの場合、nofailパラメーターをローカルディスクのインスタンスの /etc/fstab設定ファイルに追加します。

      /dev/vdd /mnt/vdd ext4 defaults,barrier=0,nofail 0 0

      パラメーター

      説明

      /dev/vdd

      ローカルディスクのデバイス名。DescribeInstanceHistoryEvents操作によって返されるデバイス値です。

      /mnt/vdd

      ローカルディスクのマウントポイント。mount | grep "/dev/vdd" コマンドを使用して照会できます。

      ext4

      ローカルディスクのファイルシステムタイプ。blkid /dev/vdd1コマンドを使用して照会できます。

      バリア=0

      ファイルシステムのバリアを無効にするために使用されるマウントオプション。

      nofail

      ファイルシステムで指定されたローカルディスクが存在しない場合でも、ECSインスタンスのブートシーケンスが中断されないことを示します。

    4. ローカルディスクをアンマウントします。

      umount /dev/vdd
      重要

      ローカルディスクをアンマウントしない場合、ローカルディスクが分離されて修復された後、ローカルディスクのデバイス名が変更されます。 この場合、アプリケーションは、別のディスクからデータを読み取り、または別のディスクにデータを書き込む可能性があります。

  3. AcceptInquiredSystemEvent操作を呼び出して、指定されたシステムイベントに応答します。

    Alibaba Cloud CLIで次のコマンドを実行します。

    aliyun ecs AcceptInquiredSystemEvent -- RegionId <TheRegionId> -- EventId <TheEventId>
  4. インスタンスを再起動するかどうかを確認します。

    • イベントコードがSystemMaintenance.IsolateErrorDiskの場合:

      • RequestId値のみが返された場合、インスタンスを再起動する必要はありません。

      • codeの戻り値がSwitchToOffline.OnlineIsolateFailの場合、インスタンスを再起動する必要があります。

    • イベントコードがSystemMaintenance.RebootAndIsolateErrorDiskの場合、AcceptInquiredSystemEvent操作を呼び出した後にインスタンスを再起動する必要があります。

    インスタンスを再起動するには、Alibaba Cloud CLIで次のコマンドを実行します。

    aliyun ecs RebootInstance -- InstanceId <TheInstanceId>
    説明

    インスタンスの再起動後、分離された破損したローカルディスクは一時的に1 MiBダミーハードディスクに変換され、その後の操作が容易になります。 アプリケーション層では、破損したローカルディスクの読み取り操作と書き込み操作を継続的に分離し、/etc/fstabファイルでnofailパラメーターを設定する必要があります。

  5. Alibaba Cloudが物理マシン上の破損したローカルディスクを置き換え、SystemMaintenance.ReInitErrorDiskまたはSystemMaintenance.RebootAndReInitErrorDiskイベントを発行するまで待ちます。 ほとんどの場合、交換プロセスは完了するまでに最大5営業日を必要とします。

  6. AcceptInquiredSystemEvent操作を思い出して、システムイベントに応答します。 ローカルディスクが再初期化状態になります。

    Alibaba Cloud CLIで次のコマンドを実行します。

    aliyun ecs AcceptInquiredSystemEvent -- RegionId <TheRegionId> -- EventId <TheEventId>
  7. インスタンスを再起動するかどうかを確認します。

    • イベントコードがSystemMaintenance.ReinitErrorDiskの場合:

      • RequestId値のみが返された場合、インスタンスを再起動する必要はありません。

      • codeの戻り値がSwitchToOffline.OnlineReInitFailの場合、インスタンスを再起動します。

    • イベントコードがSystemMaintenance.RebootAndReinitErrorDiskの場合、AcceptInquiredSystemEvent操作を呼び出した後にインスタンスを再起動する必要があります。

    インスタンスを再起動するには、Alibaba Cloud CLIで次のコマンドを実行します。

    aliyun ecs RebootInstance -- InstanceId <TheInstanceId>

結果

破損したローカルディスクが交換されてから数分後、ローカルディスクの破損イベントは消えます。

次のステップ

破損したディスクが分離されたら、インスタンスとローカルディスクのステータスを確認します。 交換されたローカルディスクは元の容量に復元され、データディスクを再フォーマットできます。 詳細については、「Windowsインスタンスでサイズが2 TiBを超えないデータディスクを初期化する」または「Linuxインスタンスでサイズが2 TiBを超えないデータディスクを初期化する」をご参照ください。