このトピックでは、既存の OpenSearch 検索エンジン エディション インスタンス内でのベクターインデックスの構成の概要と、ベクタークエリによるデータ取得のための SDK の使用方法について説明します。
OpenSearch 検索エンジン エディション インスタンスを購入する
詳細については、「OpenSearch 検索エンジン エディション インスタンスを購入する」をご参照ください。
テーブルを構成する
新しいインスタンスを購入すると、製品ページでそのステータスが「構成保留中」と表示されます。購入したクエリノードおよびデータノードの数と仕様に一致する空のクラスターが自動的にデプロイされます。検索を開始する前に、クラスターの [テーブル基本情報] > [データ同期] > [インデックススキーマ] > [インデックス再構築] を構成してください。
テーブル名シャード数データ更新リソースの数 をカスタマイズし、 を決定し、 を指定して、テーブルの基本情報を設定します。
テーブルの Shard Count は 256 に制限されており、インスタンス内のデータノード数の 3 倍を超えないようにすることをお勧めします。
デフォルトのプロビジョニングでは、2 つの無料のデータ更新リソースが提供されます。この数を超えると、n-2 として計算される料金が発生します。ここで、n は 1 つのテーブルのデータ更新リソースの総数を表します。
データ同期の場合は、MaxCompute データソース、API データソース、Object Storage Service (OSS)、Data Lake Formation (DLF) データソース など、サポートされている種類を含む完全なデータソースを構成します。MaxCompute を例にとると、「データソースを追加」を選択し、種類として「MaxCompute」を選択し、プロジェクト、accesskeyID、accesskeySecret、テーブル、パーティションキーを入力し、インデックスの自動再作成 を有効にすることを検討します。
データソースの構成が完了したら、インデックス スキーマの設定に進みます。
少なくとも 2 つの必須フィールド (主キー フィールド と ベクトル フィールド。後者は複数値の浮動小数点型として構成する必要があります) を定義します。
カテゴリを持つベクターを含めるには、カテゴリフィールドを追加します。これは、単一値または複数値の整数型のいずれかに設定する必要があります。
プロパティとフィールドの内容の圧縮:
属性フィールドの場合は、圧縮することができます。[フォーム] モードでは、非圧縮と圧縮のいずれかを選択します。[開発者] モードでは、no_compressor または file_compressor のいずれかを選択します。
フィールドコンテンツの場合は、圧縮を適用するかどうかを決定します。デフォルトでは、非圧縮のままです。複数値型と STRING 型はデフォルトで uniq 圧縮になり、単一値の数値型は equal 圧縮を使用します。