すべてのプロダクト
Search
ドキュメントセンター

Elastic Compute Service:ビッグデータインスタンスタイプ

最終更新日:Nov 01, 2024

ビッグデータインスタンスファミリーのほとんどは、CPUとメモリの比率が1:4です。 Hadoop MapReduce、Hadoop Distributed File System (HDFS) 、Hive、HBaseなどのサービスが使用されるビッグデータコンピューティングおよびストレージシナリオや、ElasticsearchやKafkaなどのソリューションが使用される検索およびログデータ処理シナリオに適しています。

推奨インスタンスファミリー

推奨なし (これらのインスタンスファミリーが完売した場合は、推奨されるインスタンスファミリーを使用できます) 。

概要

警告

ローカルディスクに格納されたデータの耐久性は、関連する物理マシンの信頼性によって決まります。 単一障害点のリスクが存在する。 ローカルディスクに保存されたデータは、関連する物理マシンでハードウェア障害が発生すると失われる可能性があります。 一時データのみをローカルディスクに保存することを推奨します。 詳細については、「ローカルディスク」をご参照ください。

ビッグデータインスタンスファミリーは、クラウドコンピューティングとビッグデータストレージを提供し、ビッグデータ指向企業のニーズをサポートするように設計されています。 これらのインスタンスファミリーは、Hadoop分散コンピューティング、大規模なログ処理、大規模なデータウェアハウジングなど、オフラインコンピューティングとビッグデータストレージを必要とするシナリオに適しています。 ビッグデータインスタンスファミリーは、分散ネットワークを使用し、ストレージ、容量、内部帯域幅に対する要件が高いビジネスに最適です。

具体的には、ビッグデータの計算、保存、分析を必要とするインターネットや金融などの業界のお客様に適しています。 ビッグデータインスタンスファミリーでは、ローカルストレージの使用により、大量のストレージスペースおよび高いストレージパフォーマンスが確保されます。

ビッグデータインスタンスには、次の利点があります。

  • エンタープライズレベルのコンピューティングパワーによる、効率的かつ安定したデータ処理。

  • インスタンスあたりの最大内部帯域幅が高くなり、最大パケット転送速度が高くなり、ピーク時のHadoop MapReduceでのシャッフルなどのデータ転送要求を満たすことで、ネットワークパフォーマンスが向上します。

ビッグデータインスタンスを作成する際の注意事項は以下のとおりです。

  • ローカルSSDを備えたインスタンスは、インスタンス構成の変更をサポートしていません。

  • ローカルディスクは、特定のインスタンスタイプにのみ関連付けることができます。 インスタンスにアタッチされているローカルディスクの数と容量は、インスタンスタイプによって異なります。 ローカルディスクを個別に購入したり、インスタンスからローカルディスクをデタッチして他のインスタンスに接続することはできません。

  • ローカルディスクのスナップショットは作成できません。 ローカルSSDを搭載したインスタンスのシステムディスクとデータディスクからイメージを作成する場合は、システムディスクとデータディスクの両方のスナップショットを組み合わせてイメージを作成することをお勧めします。 この場合、データディスクはクラウドディスクでなければなりません。

  • ローカルSSDを搭載したインスタンスに基づいて、システムディスクスナップショットとデータディスクスナップショットで構成されるイメージを作成することはできません。

  • ローカルSSDを搭載したインスタンスに標準SSDをアタッチし、標準SSDの容量を拡張できます。

  • ローカルSSDを備えたインスタンスでの操作は、ローカルSSDに格納されているデータに影響を与える可能性があります。 詳細については、「ローカルディスク」トピックの「ローカルディスクに格納されたデータに対するインスタンス操作の影響」セクションをご参照ください。

ファイルシステムをビッグデータインスタンスにマウントする際のベストプラクティス

ext4などのファイルシステムを初めてマウントするときは、inodeテーブルを初期化する必要があります。 デフォルトでは、Linuxカーネルv2.6.37以降でlazyinit機能が有効になっているため、ファイルシステムがマウントされるまでinodeテーブルは初期化されません。 さらに、ローカルディスクは、初期化時に、ローカルディスクに対して600メガバイト/秒など、大量のスループットを消費する。 これは、サービスの安定性に影響する。 この問題を解決するために、Linuxカーネルv4.xの遅延初期化のオブジェクトの同時数を増やしました。 詳細については、「index: kernel/git/stable/linux.git」をご参照ください。 できるだけ早い機会にinodeテーブルを初期化するには、次のベストプラクティスを使用することをお勧めします。

  1. すべてのローカルシリアル高度技術アタッチメント (SATA) HDDのリストを取得します。

  2. 以下のコマンドを実行して、各ローカルディスクを個別に初期化します。

    この例では、デバイス名が /dev/vdbのローカルディスク上にext4ファイルシステムが作成されます。

    mkfs.ext4 -E lazy_itable_init=0,lazy_journal_init=0 /dev/vdb &
  3. すべてのローカルディスクを初期化後、すべてのローカルディスクの I/O 動作が 0 と表示されるまで iostat -x 5 コマンドを実行します。

  4. mountコマンドを一括実行します。

d3s、ストレージ集約型のビッグデータインスタンスファミリー

特徴:

  • このインスタンスファミリーには、12 TB、大容量、高スループットのローカルSATA HDDが搭載されており、インスタンス間で最大64 Gbit/sのネットワーク帯域幅を提供できます。

  • サポートされるシナリオ:

    • Hadoop MapReduce、HDFS、Hive、HBaseなどのサービスが使用されるビッグデータコンピューティングとストレージのビジネスシナリオ

    • Spark インメモリコンピューティングや MLlib などの機械学習シナリオ

    • ElasticsearchやKafkaなどのソリューションが使用されている検索およびログデータ処理シナリオ

  • このインスタンスファミリーは、インスタンスのシャットダウンを防ぐために、破損したディスクのオンライン交換とホットスワップをサポートします。

    ローカルディスクに障害が発生すると、システムイベントが発生します。 破損したディスクを修復するプロセスを開始することで、システムイベントを処理できます。 詳細については、「ローカルディスクを搭載したインスタンスのO&Mシナリオとシステムイベント」をご参照ください。

    重要

    破損したディスクの修復プロセスを開始すると、破損したディスクに保存されているデータは復元できません。

  • コンピューティング

    • 2.7 GHzインテルを使用®Xeon ®スケーラブル (Ice Lake) プロセッサは、3.5 GHzのオールコアターボ周波数を提供し、一貫したコンピューティングパフォーマンスを提供します。

  • ストレージ

    • I/O 最適化インスタンス。

    • ESSDおよびESSD AutoPLディスクのみをサポートします。

  • ネットワーク

    • IPv4およびIPv6をサポート。

    • 大規模コンピューティング能力で、高いネットワークパフォーマンスを提供します。

インスタンスタイプ

インスタンスタイプ

vCPU

メモリサイズ (GiB)

ローカルストレージ (GB)

ネットワークベースライン /バースト帯域幅 (Gbit/s)

パケット転送レート (pps)

ディスクベースライン /バースト帯域幅 (Gbit/s)

ecs.d3s.2xlarge

8

32

4*11,918

10/burstable 15まで

2,000,000

3/burstable 5まで

ecs.d3s.4xlarge

16

64

8*11,918

25/none

3,000,000

5 /なし

ecs.d3s.8xlarge

32

128

16*11,918

40 /なし

6,000,000

8 /なし

ecs.d3s.12xlarge

48

192

24*11,918

60/none

9,000,000

12 /なし

ecs.d3s.16xlarge

64

256

32*11,918

80/none

12,000,000

16 /なし

d3c、コンピューティング集約型ビッグデータインスタンスファミリー

特徴:

  • このインスタンスファミリーには、大容量および高スループットのローカルディスクが搭載されており、インスタンス間で最大40 Gbit/sの帯域幅を提供できます。

  • サポートされるシナリオ:

    • Hadoop MapReduce、HDFS、Hive、HBaseなどのサービスが使用されるビッグデータコンピューティングとストレージのビジネスシナリオ

    • EMR JindoFSとObject Storage Service (OSS) を組み合わせて使用して、ホットデータとコールドデータを別々に保存し、ストレージをコンピューティングから分離するシナリオ

    • Spark インメモリコンピューティングや MLlib などの機械学習シナリオ

    • ElasticsearchやKafkaなどのソリューションが使用されている検索およびログデータ処理シナリオ

  • このインスタンスファミリーは、インスタンスのシャットダウンを防ぐために、破損したディスクのオンライン交換とホットスワップをサポートします。

    ローカルディスクに障害が発生すると、システムイベントが発生します。 破損したディスクを修復するプロセスを開始することで、システムイベントを処理できます。 詳細については、「ローカルディスクを搭載したインスタンスのO&Mシナリオとシステムイベント」をご参照ください。

    重要

    破損したディスクの修復プロセスを開始すると、破損したディスクに保存されているデータは復元できません。

  • コンピューティング

    • 第3世代2.9 GHzインテルを使用®Xeon ®スケーラブル (Ice Lake) プロセッサは、3.5 GHzのオールコアターボ周波数を提供し、一貫したコンピューティングパフォーマンスを提供します。

  • ストレージ

    • I/O 最適化インスタンス。

    • ESSDおよびESSD AutoPLディスクのみをサポートします。

  • ネットワーク

    • IPv4およびIPv6をサポート。

    • 大規模コンピューティング能力で、高いネットワークパフォーマンスを提供します。

インスタンスタイプ

インスタンスタイプ

vCPU

メモリサイズ (GiB)

ローカルストレージ (GB)

ネットワークベースライン /バースト帯域幅 (Gbit/s)

パケット転送レート (pps)

ディスクベースライン /バーストIOPS

ディスクベースライン /バースト帯域幅 (Gbit/s)

ecs.d3c.3xlarge

14

56.0

1*13,743

8 /10までburstable

1,600,000

40,000 /なし

3/none

ecs.d3c.7xlarge

28

112.0

2*13,743

16/burstable 25まで

2,500,000

50,000 /なし

4 /なし

ecs.d3c.14xlarge

56

224.0

4*13,743

40 /なし

5,000,000

100,000 /なし

8 /なし

説明

このインスタンスファミリーはLinuxイメージのみをサポートします。 このインスタンスファミリーのインスタンスを作成するときに、Linuxイメージを選択します。

d2c、コンピューティング集約型ビッグデータインスタンスファミリー

特徴:

  • このインスタンスファミリーには、大容量で高スループットのローカルSATA HDDが搭載されており、インスタンス間で最大35 Gbit/sの帯域幅を提供できます。

  • サポートされるシナリオ:

    • Hadoop MapReduce、HDFS、Hive、HBaseなどのサービスが使用されるビッグデータコンピューティングとストレージのビジネスシナリオ

    • EMR JindoFSとOSSを組み合わせて使用して、ホットデータとコールドデータを別々に保存し、ストレージをコンピューティングから分離するシナリオ

    • Spark インメモリコンピューティングや MLlib などの機械学習シナリオ

    • ElasticsearchやKafkaなどのソリューションが使用されている検索およびログデータ処理シナリオ

  • このインスタンスファミリーは、インスタンスのシャットダウンを防ぐために、破損したディスクのオンライン交換とホットスワップをサポートします。

    ローカルディスクに障害が発生すると、システムイベントが発生します。 破損したディスクを修復するプロセスを開始することで、システムイベントを処理できます。 詳細については、「ローカルディスクを搭載したインスタンスのO&Mシナリオとシステムイベント」をご参照ください。

    重要

    破損したディスクの修復プロセスを開始すると、破損したディスクに保存されているデータは復元できません。

  • コンピューティング

    • 2.5 GHzインテルを使用®Xeon ®プラチナ8269CY (カスケード湖) プロセッサ。

  • ストレージ

    • I/O 最適化インスタンス。

    • 拡張SSD (ESSD) 、ESSD AutoPLディスク、標準SSD、およびウルトラディスクをサポートします。

  • ネットワーク

    • IPv4およびIPv6をサポート。

    • 大規模コンピューティング能力で、高いネットワークパフォーマンスを提供します。

インスタンスタイプ

インスタンスタイプ

vCPU

メモリサイズ (GiB)

ローカルストレージ (GB)

ネットワークベースライン帯域幅 (Gbit/s)

パケット転送レート (pps)

ecs.d2c.6xlarge

24

88.0

3*3,972

12.0

1,600,000

ecs.d2c.12xlarge

48

176.0

6*3,972

20.0

2,000,000

ecs.d2c.24xlarge

96

352.0

12*3,972

35.0

4,500,000

d2s、ストレージ集約型のビッグデータインスタンスファミリー

特徴:

  • このインスタンスファミリーには、大容量で高スループットのローカルSATA HDDが搭載されており、インスタンス間で最大35 Gbit/sの帯域幅を提供できます。

  • サポートされるシナリオ:

    • Hadoop MapReduce、HDFS、Hive、HBaseなどのサービスが使用されるビッグデータコンピューティングとストレージのビジネスシナリオ

    • Spark インメモリコンピューティングや MLlib などの機械学習シナリオ

    • ElasticsearchやKafkaなどのソリューションが使用されている検索およびログデータ処理シナリオ

  • このインスタンスファミリーは、インスタンスのシャットダウンを防ぐために、破損したディスクのオンライン交換とホットスワップをサポートします。

    ローカルディスクに障害が発生すると、システムイベントが発生します。 破損したディスクを修復するプロセスを開始することで、システムイベントを処理できます。 詳細については、「ローカルディスクを搭載したインスタンスのO&Mシナリオとシステムイベント」をご参照ください。

    重要

    破損したディスクの修復プロセスを開始すると、破損したディスクに保存されているデータは復元できません。

  • コンピューティング

    • 2.5 GHzインテルを使用®Xeon ®プラチナ8163 (Skylake) プロセッサ。

  • ストレージ

    • I/O 最適化インスタンス。

    • ESSD、ESSD AutoPLディスク、標準SSD、およびウルトラディスクをサポートします。

  • ネットワーク

    • IPv4およびIPv6をサポート。

    • 大規模コンピューティング能力で、高いネットワークパフォーマンスを提供します。

インスタンスタイプ

インスタンスタイプ

vCPU

メモリサイズ (GiB)

ローカルストレージ (GB)

ネットワークベースライン帯域幅 (Gbit/s)

パケット転送レート (pps)

ecs.d2s.5xlarge

20

88.0

8*7,838

12.0

1,600,000

ecs.d2s.10xlarge

40

176.0

15*7,838

20.0

2,000,000

ecs.d2s.20xlarge

80

352.0

30*7,838

35.0

4,500,000

d1ne、ネットワークで強化されたビッグデータインスタンスファミリー

特徴:

  • このインスタンスファミリーには、大容量で高スループットのローカルSATA HDDが搭載されており、インスタンス間で最大35 Gbit/sの帯域幅を提供できます。

  • サポートされるシナリオ:

    • Hadoop MapReduce、HDFS、Hive、HBaseなどのサービスが使用されるシナリオ

    • Spark インメモリコンピューティングや MLlib などの機械学習シナリオ

    • Elasticsearchなどのソリューションが使用される検索およびログデータ処理シナリオ

  • コンピューティング

    • CPU 対メモリ比率は、ビッグデータシナリオ向けの 1:4。

    • 2.5 GHzインテルを使用®Xeon ®E5-2682 v4 (Broadwell) プロセッサ。

  • ストレージ

    • I/O 最適化インスタンス。

    • 標準SSDとウルトラディスクのみをサポートします。

  • ネットワーク

    • IPv4およびIPv6をサポート。

    • 大規模コンピューティング能力で、高いネットワークパフォーマンスを提供します。

インスタンスタイプ

インスタンスタイプ

vCPU

メモリサイズ (GiB)

ローカルストレージ (GB)

ネットワークベースライン帯域幅 (Gbit/s)

パケット転送レート (pps)

ecs.d1ne.2xlarge

8

32.0

4*5,905

6.0

1,000,000

ecs.d1ne.4xlarge

16

64.0

8*5,905

12.0

1,600,000

ecs.d1ne.6xlarge

24

96.0

12*5,905

16.0

2,000,000

ecs.d1ne-c8d3.8xlarge

32

128.0

12*5,905

20.0

2,000,000

ecs.d1ne.8xlarge

32

128.0

16*5,905

20.0

2,500,000

ecs.d1ne-c14d3.14xlarge

56

160.0

12*5,905

35.0

4,500,000

ecs.d1ne.14xlarge

56

224.0

28*5,905

35.0

4,500,000

d1:ビッグデータインスタンスファミリー

特徴:

  • このインスタンスファミリーには、大容量で高スループットのローカルSATA HDDが搭載されており、インスタンス間で最大17 Gbit/sの帯域幅を提供できます。

  • サポートされるシナリオ:

    • Hadoop MapReduce、HDFS、Hive、HBaseなどのサービスが使用されるシナリオ

    • Spark インメモリコンピューティングや MLlib などの機械学習シナリオ

    • インターネットや金融などの業界の顧客がビッグデータを計算、保存、分析する必要があるシナリオ

    • Elasticsearchなどのソリューションが使用される検索およびログデータ処理シナリオ

  • コンピューティング

    • CPU 対メモリ比率は、ビッグデータシナリオ向けの 1:4。

    • 2.5 GHzインテルを使用®Xeon ®E5-2682 v4 (Broadwell) プロセッサ。

  • ストレージ

    • I/O 最適化インスタンス。

    • 標準 SSD および Ultra ディスクをサポート。

  • ネットワーク

    • IPv4をサポート

    • 大規模コンピューティング能力で、高いネットワークパフォーマンスを提供します。

インスタンスタイプ

インスタンスタイプ

vCPU

メモリサイズ (GiB)

ローカルストレージ (GB)

ネットワークベースライン帯域幅 (Gbit/s)

パケット転送レート (pps)

ecs.d1.2xlarge

8

32.0

4*5,905

3.0

300,000

ecs.d1.3xlarge

12

48.0

6*5,905

4.0

400,000

ecs.d1.4xlarge

16

64.0

8*5,905

6.0

600,000

ecs.d1.6xlarge

24

96.0

12*5,905

8.0

800,000

ecs.d1-c8d3.8xlarge

32

128.0

12*5,905

10.0

1,000,000

ecs.d1.8xlarge

32

128.0

16*5,905

10.0

1,000,000

ecs.d1-c14d3.14xlarge

56

160.0

12*5,905

17.0

1,800,000

ecs.d1.14xlarge

56

224.0

28*5,905

17.0

1,800,000