用語 - Elasticsearch - Alibaba Cloud ドキュメントセンター

このトピックでは、Alibaba Cloud Elasticsearch に関連する用語を紹介します。

クラスター

Elasticsearch クラスターは、1 つ以上の Elasticsearch ノードで構成されます。クラスター内のすべてのノードは連携してデータを格納します。各クラスターには一意の名前があります。環境内の 2 つのクラスターの名前が同じ場合、不明な例外が発生する可能性があります。

ノード

ノードは、クラスター内のサーバー上で実行されます。ノードは、データを格納し、クラスター内のインデックス作成アクティビティとクエリアクティビティをサポートするために使用されます。クラスターは 1 つ以上のノードで構成され、ノードは異なるロールを果たすことができます。

データノードは、インデックスを格納するために使用されます。データノードを使用して、ドキュメントの追加、削除、変更、検索、および集約を行うことができます。
専用マスターノードは、クラスターに対する操作を実行するために使用されます。専用マスターノードを使用して、インデックスの作成または削除、ノードの追跡、およびシャードの割り当てを行うことができます。専用マスターノードの安定性は、クラスターの正常性にとって重要です。デフォルトでは、クラスター内の各ノードは専用マスターノードとして使用できます。
クライアントノードは、データノードの CPU オーバーヘッドを共有するために使用されます。クライアントノードは、クラスターの計算パフォーマンスとサービスの安定性を向上させることができます。

インデックス

インデックスとは、類似した特徴を持つドキュメントの集合です。インデックスはリレーショナルデータベースに似ています。たとえば、顧客データ、商品カタログデータ、注文データをそれぞれ格納するために 3 つのインデックスを作成できます。ほとんどの場合、識別のために小文字の名前がインデックスに割り当てられます。ドキュメントのインデックス作成、クエリ、更新、または削除を行う場合は、ドキュメントが属するインデックスの名前を指定する必要があります。

タイプ

タイプとは、インデックスの論理クラスまたはパーティションです。タイプはリレーショナルデータベースのテーブルに似ています。インデックスには、ユーザータイプやブログタイプなど、さまざまなタイプのドキュメントを格納できます。 Elasticsearch V6.X 以降では、インデックスに 1 つのタイプしか作成できません。したがって、Elasticsearch V6.X 以降では、タイプの概念については言及されていません。 Elasticsearch V5.X では、インデックスにさまざまなタイプのドキュメントを格納できます。 Elasticsearch V6.X では、インデックスには 1 つのタイプのドキュメントしか格納できません。 Elasticsearch V7.X では、インデックスのタイプは _doc のみです。詳細については、オープンソースの Elasticsearch ドキュメントをご参照ください。

ドキュメント

ドキュメントとは、インデックスを作成できる基本的な情報単位です。ドキュメントはリレーショナルデータベースのテーブルの行に似ています。たとえば、顧客または商品のドキュメントを作成できます。各ドキュメントは JSON オブジェクトです。インデックスに格納されるドキュメントの数に制限はありません。ドキュメントはインデックス化する必要があります。

フィールド

フィールドとは、ドキュメントに含まれる最小単位です。フィールドはリレーショナルデータベースのテーブルの列に似ています。

マッピング

マッピングとは、ドキュメントとドキュメントに含まれるフィールドの格納方法とインデックス作成方法を定義するものです。たとえば、マッピングを使用して、フィールド名、フィールドタイプ、および使用するトークナイザーを定義できます。マッピングはリレーショナルデータベースのテーブルのスキーマに似ています。

次の表に、Elasticsearch の用語とリレーショナルデータベースのマッピングを示します。

Elasticsearch	リレーショナルデータベース
インデックス	データベース
タイプ	テーブル
ドキュメント	行
フィールド	列
マッピング	スキーマ

シャードとレプリカシャード

インデックスは複数のシャードに分割できます。これらのシャードは、分散検索をサポートするために異なるノードに分散できます。シャードは、プライマリシャードとレプリカシャードに分類されます。インデックスを作成するときは、インデックスのプライマリシャードとレプリカシャードの数を指定する必要があります。インデックスを作成した後、プライマリシャードの数を変更することはできません。

レプリカシャードは、インデックスのプライマリシャードのコピーです。プライマリシャードに複数のレプリカシャードを設定できます。クラスターが書き込み操作の要求を受信すると、クラスターは関連するプライマリシャードで操作を実行します。操作が完了すると、クラスターは操作に関連するデータをプライマリシャードのレプリカシャードにコピーします。プライマリシャードまたはレプリカシャードにデータをクエリできます。レプリカシャードは、クラスターの高可用性と検索中のクラスターの同時実行パフォーマンスを向上させることができます。ただし、クラスター内のインデックスに多数のレプリカシャードが設定されている場合、書き込み操作中のクラスターのデータ同期負荷が増加します。

Elasticsearch V7.0 より前のバージョンでは、各インデックスはデフォルトで 5 つのプライマリシャードで構成され、各プライマリシャードは 1 つのレプリカシャードで構成されます。 Elasticsearch V7.0 以降では、各インデックスはデフォルトで 1 つのプライマリシャードと 1 つのレプリカシャードで構成されます。次の表に、プライマリシャードとレプリカシャードの違いを示します。

シャードタイプ

サポートされているリクエストタイプ

シャードの数を変更できるかどうか

備考

プライマリシャード

クエリとインデックス作成リクエスト

インデックスのプライマリシャードの数は変更できません。この数は、インデックスの作成時に指定されます。詳細については、手順 3: インデックスを作成するをご参照ください。

インデックス内の各ドキュメントは 1 つのプライマリシャードに属します。プライマリシャードの数は、インデックスが格納できるデータの最大量を決定します。

重要

プライマリシャードが多いほど、Elasticsearch クラスターのパフォーマンスオーバーヘッドが増加します。

レプリカシャード

クエリリクエスト

レプリカシャードの数はいつでも変更できます。詳細については、インデックステンプレートをご参照ください。

レプリカシャードは検索パフォーマンスにとって重要であり、次の利点があります。

フォールトトレランスの向上: ノード上のプライマリシャードが破損または失われた場合、レプリカシャードからプライマリシャードを復元できます。
検索効率の向上: Elasticsearch は、レプリカシャード間でクエリの負荷を自動的に分散します。

重要

シャードの数と各シャードのサイズはどちらも、Elasticsearch クラスターの安定性とパフォーマンスに影響します。 Elasticsearch クラスター内のすべてのインデックスのシャードを適切に計画する必要があります。これにより、ビジネスシナリオを定義することが難しい場合に、多数のシャードがクラスターのパフォーマンスに影響を与えることを防ぎます。詳細については、仕様とストレージ容量を評価するをご参照ください。

ゲートウェイ

ゲートウェイは、インデックスのスナップショットを格納するために使用されます。デフォルトでは、ノードはそのメモリにすべてのインデックスを格納します。ノードメモリがいっぱいになると、ノードはインデックスをローカルディスクに格納します。 Elasticsearch クラスターが再起動されると、そのインデックスはゲートウェイに格納されているスナップショットから復元されます。スナップショットからのインデックスの復元は、ローカルディスクからのインデックスの読み取りよりも高速です。 Elasticsearch は、ローカルファイルシステム、分散ファイルシステム、Hadoop Distributed File System (HDFS)、Alibaba Cloud Object Storage Service (OSS) など、複数のタイプのゲートウェイをサポートしています。デフォルトでは、ローカルファイルシステムがゲートウェイとして使用されます。

discovery.zen

discovery.zen は、自動ノード検出メカニズムです。 Elasticsearch は、ノードを検出するためにブロードキャストを送信するピアツーピア (P2P) システムです。ノードは、マルチキャストと P2P テクノロジーを使用して相互に通信します。

トランスポート

トランスポートとは、Elasticsearch クラスターまたはクラスター内のノードがクライアントと通信するために使用される方法です。デフォルトでは、通信に TCP が使用されます。 HTTP over JSON、Thrift、Memcached、ZeroMQ などの他のプロトコルを使用するために、プラグインを Elasticsearch クラスターに統合できます。