このトピックでは、Data Transmission Service (DTS) を使用して、ApsaraDB for MongoDB レプリカセットまたはシャードクラスターインスタンスから Lindorm インスタンスにデータを同期する方法について説明します。Lindorm は安定性、費用対効果、使いやすさに優れています。 Lindorm は柔軟で信頼性の高い機能を提供し、メタデータ、注文、請求書、プロファイル、ソーシャルネットワーキング情報など、さまざまな種類のデータを高い同時実行性と低いレイテンシで保存できます。
前提条件
ドイツ (フランクフルト) リージョンにある ApsaraDB for MongoDB インスタンスが作成されている。
ApsaraDB for MongoDB インスタンスがレプリカセットまたはシャードクラスターアーキテクチャにデプロイされている。
重要ソースインスタンスが ApsaraDB for MongoDB シャードクラスターインスタンスの場合、エンドポイントはシャードノードに割り当てられ、シャードノードは同じアカウントとパスワードを共有します。 詳細については、「シャードのエンドポイントを申請する」をご参照ください。
Lindorm インスタンスが作成されており、使用可能なストレージ容量がソースの ApsaraDB for MongoDB インスタンスのデータの合計サイズよりも大きい。 Lindorm インスタンスにはワイドテーブルエンジンが使用されます。 詳細については、「インスタンスを作成する」をご参照ください。
説明デスティネーションインスタンスの使用可能なストレージ容量は、ソースインスタンスのデータの合計サイズよりも 10% 大きくなっています。 これは推奨される前提条件です。
Lindorm インスタンスにワイドテーブルが作成されている。 詳細については、「Lindorm-cli を使用して LindormTable に接続して使用する」および「Lindorm Shell を使用して LindormTable に接続する」をご参照ください。
説明作成するオブジェクトは、クォータと制限に準拠している必要があります。
Apache HBase API を呼び出してワイドテーブルを作成する場合、カラムマッピングを作成することをお勧めします。 詳細については、このトピックの「Apache HBase API を呼び出して作成されたテーブルにカラムマッピングを追加する例」セクションをご参照ください。
使用上の注意
カテゴリ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
課金
同期タイプ | タスク構成料金 |
完全同期 | 無料。 |
増分同期 | 課金されます。 詳細については、「課金の概要」をご参照ください。 |
同期タイプ
同期タイプ | 説明 |
完全同期 | DTS は、選択したオブジェクトの既存データすべてを、ソースの ApsaraDB for MongoDB インスタンスからデスティネーション Lindorm インスタンスに同期します。 説明 DTS は、データベースとコレクションというタイプのオブジェクトの完全同期をサポートしています。 |
増分同期 | DTS は、ソースの ApsaraDB for MongoDB インスタンスからデスティネーション Lindorm インスタンスに増分データを同期します。 説明
|
データベースアカウントに必要な権限
データベースタイプ | 必要な権限 | アカウントの作成と承認 |
ソース ApsaraDB for MongoDB インスタンス | source、admin、local データベースに対する読み取り権限。 | |
デスティネーション Lindorm インスタンス | デスティネーション Lindorm インスタンスの名前空間に対する読み取り権限と書き込み権限。 |
手順
次のいずれかの方法を使用して [データ同期] ページに移動し、データ同期インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソール にログオンします。
左側のナビゲーションウィンドウで、データ同期 をクリックします。
ページの左上隅で、データ同期タスクが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。 詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルをカスタマイズする」をご参照ください。
DMS コンソール にログオンします。
上部のナビゲーションバーで、ポインターを [データ + AI] に移動し、 を選択します。
データ同期タスク の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク構成ページに移動します。
ソースデータベースとデスティネーションデータベースを構成します。 次の表にパラメーターを示します。
カテゴリ
パラメーター
説明
該当なし
タスク名
DTS タスクの名前。 DTS はタスク名を自動的に生成します。 タスクを簡単に識別できる説明的な名前を指定することをお勧めします。 一意のタスク名を指定する必要はありません。
移行元データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。 DTS は、インスタンスの次のデータベースパラメーターを自動的に入力します。 詳細については、「データベース接続を管理する」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を構成する必要があります。
データベースタイプ
ソースデータベースのタイプ。 MongoDB を選択します。
アクセス方法
ソースデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ソース ApsaraDB for MongoDB インスタンスが存在するリージョン。
Alibaba Cloud アカウント間でデータを複製
Alibaba Cloud アカウント間でデータを同期するかどうかを指定します。この例では、× が選択されています。
アーキテクチャ
ソースインスタンスがデプロイされているアーキテクチャです。この例では、レプリカセット が選択されています。
説明ソース ApsaraDB for MongoDB インスタンスが シャードクラスター アーキテクチャにデプロイされている場合は、Shardアカウント パラメーターと Shardパスワード パラメーターを設定する必要があります。
移行方法
ソースデータベースから増分データを同期するために使用されるメソッド。ビジネス要件に基づいてメソッドを選択します。有効な値:
Oplog(推奨):
このオプションは、ソースデータベースで oplog 機能が有効になっている場合に利用できます。
説明デフォルトでは、oplog 機能は自主管理 MongoDB データベースと ApsaraDB for MongoDB インスタンスの両方で有効になっています。この機能により、高速なログ プル速度のため、低レイテンシで増分データを同期できます。そのため、移行方法パラメーターには Oplog を選択することをお勧めします。
ChangeStream:
このオプションは、ソースデータベースで変更ストリームが有効になっている場合に利用できます。詳細については、「Change Streams」をご参照ください。
説明ソースデータベースが非弾性 Amazon DocumentDB クラスターの場合、「移行方法」パラメーターは ChangeStream のみに設定できます。
シャードクラスター を「アーキテクチャ」パラメーターに選択した場合、「Shardアカウント」および「Shardパスワード」パラメーターを設定する必要はありません。
インスタンス ID
ソース ApsaraDB for MongoDB インスタンスの ID です。
認証データベース
ソース ApsaraDB for MongoDB インスタンスのデータベースアカウントとパスワードを格納する認証データベースの名前です。 以前に名前を変更していない場合、デフォルト値は [admin] です。
データベースアカウント
ソース ApsaraDB for MongoDB インスタンスのデータベースアカウント。必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」セクションをご参照ください。
データベースのパスワード
データベースへのアクセスに使用するパスワードです。
暗号化
ソースデータベースへの接続を暗号化するかどうかを指定します。非暗号化、SSL 暗号化、または Mongo Atlas SSL をビジネス要件に基づいて選択できます。暗号化 パラメーターで使用可能なオプションは、アクセス方法 パラメーターと アーキテクチャ パラメーターで選択された値によって決まります。DTS コンソールに表示されるオプションが優先されます。
説明[アーキテクチャ] パラメーターが [シャーディングされたクラスタ] に設定され、[移行方法] パラメーターが ApsaraDB for MongoDB データベースの Oplog に設定されている場合、暗号化パラメーター SSL 暗号化 は使用できません。
ソースデータベースが レプリカセット アーキテクチャを使用する自主管理 MongoDB データベースであり、アクセス方法 パラメーターが Alibaba Cloud インスタンス に設定されておらず、暗号化パラメーターが SSL 暗号化 に設定されている場合は、認証局(CA)証明書をアップロードして、ソースデータベースへの接続を検証できます。
移行先データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの次のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続を管理する」をご参照ください。
説明DMS コンソールで、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、次のデータベース情報を設定する必要があります。
データベースタイプ
ターゲットデータベースの種類。 Lindorm を選択します。
アクセス方法
ターゲットデータベースのアクセス方式です。Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
宛先の Lindorm インスタンスが存在するリージョンです。
インスタンス ID
宛先 Lindorm インスタンスの ID です。
データベースアカウント
宛先 Lindorm インスタンスのデータベースアカウントです。アカウントに必要な権限の詳細については、この Topic の「データベースアカウントに必要な権限」セクションをご参照ください。
データベースのパスワード
データベースにアクセスするために使用するパスワード。
ページの下部にある 接続をテストして続行 をクリックします。
説明DTS サーバーの CIDR ブロックが、DTS サーバーからのアクセスを許可するために、ソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加できることを確認します。 詳細については、「DTS サーバーの CIDR ブロックを追加する」をご参照ください。
ソースデータベースまたはターゲットデータベースが自己管理データベースであり、その アクセス方法 が Alibaba Cloud インスタンス に設定されていない場合は、DTS サーバーの CIDR ブロック ダイアログボックスで 接続テスト をクリックします。
同期するオブジェクトを設定します。
オブジェクト設定 ステップで、同期するオブジェクトを設定します。
パラメーター
説明
同期タイプ
デフォルトでは、[増分データ同期] が選択されています。[完全データ同期] のみを選択できます。[スキーマ同期] は選択できません。事前チェックが完了すると、DTS は選択したオブジェクトの既存データをソースデータベースから宛先データベースに同期します。既存データは、後続の増分同期の基礎となります。
競合するテーブルの処理モード
デフォルト設定を保持します。
移行先インスタンスでのオブジェクト名の大文字化
宛先インスタンスにおけるデータベース名とコレクション名の大文字小文字の区別。デフォルトでは、[DTS デフォルトポリシー] が選択されています。他のオプションを選択して、オブジェクト名の大文字小文字の区別が、ソースまたは宛先データベースのオブジェクト名のデフォルトの大文字小文字の区別と一致するようにすることができます。詳細については、「宛先インスタンスのオブジェクト名の大文字小文字の区別を指定する」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択し、
アイコンをクリックして、選択中のオブジェクト セクションにオブジェクトを追加します。説明同期対象のオブジェクトとしてコレクションを選択できます。
選択中のオブジェクト
宛先データベースのワイドテーブルが SQL 文を実行することによって作成された場合は、ソースデータベースから同期されるオブジェクトに基づいて、ワイドテーブルに追加の列を追加する必要があります。ソースデータベースに存在するがワイドテーブルに追加されていない列は、宛先データベースに同期されません。
データベース名を編集します。
選択中のオブジェクト セクションで、同期するコレクションを含むデータベースを右クリックします。
スキーマの編集ダイアログボックスで、スキーマ名 フィールドに、Lindorm インスタンスで使用するデータベース名を入力します。

オプション。 同期する DML 操作を選択 セクションで、増分データ同期中に同期する操作を選択します。
[OK] をクリックします。
テーブル名を編集します。
選択中のオブジェクト セクションで、同期するコレクションを右クリックします。
テーブル名の編集ダイアログボックスで、[テーブル名] フィールドに、Lindorm インスタンスで使用するテーブル名を入力します。

オプション。 データをフィルタリングする条件を指定できます。詳細については、「フィルター条件を指定する」をご参照ください。
オプション。 同期する DML 操作を選択 セクションで、増分データ同期中に同期する操作を選択します。
ソース ApsaraDB for MongoDB インスタンスから同期するフィールドを指定します。
デフォルトでは、DTS は同期するコレクションのデータをマッピングし、[値の割り当て] 列に式を設定します。式が要件を満たしているかどうかを確認し、[列名]、[タイプ]、[長さ]、[精度] パラメーターを指定する必要があります。
[値の割り当て] 列の
bson_value()式で、ApsaraDB for MongoDB インスタンスのデータ行のフィールド名を表示します。""内のフィールドは、ApsaraDB for MongoDB インスタンスのフィールド名です。たとえば、式がbson_value("age")の場合、ageは ApsaraDB for MongoDB インスタンスのデータ行のフィールド名です。オプション:同期する必要のないフィールドを削除できます。
説明同期する必要のないフィールドを削除するには、データ行の後の
アイコンをクリックします。同期するフィールドを指定します。
bson_value()式が要件を満たしているかどうかに基づいて、次の手順のいずれかを実行します。式がフィールド要件を満たしている場合
[列名] パラメーターを設定します。
説明宛先 Lindorm インスタンスでデータを受信するために使用されるテーブルの列名を入力します。
宛先テーブルが SQL 文を実行することによって作成された場合は、これらの列名を [列名] パラメーターの値として指定します。
宛先テーブルが Apache HBase API を呼び出すことによって作成され、追加の列が必要な場合は、列名を編集する前に列マッピングを作成する必要があります。詳細については、このトピックの Apache HBase API を呼び出すことによって作成されたテーブルの列マッピングを追加する例 セクションを参照してください。[列名] パラメーターを指定する場合は、次のルールに注意してください。
列がプライマリキーの場合は、列名として [ROW] を指定します。
列がプライマリキーでない場合は、カラムファミリー:列名 の形式で [列名] パラメーターを指定します。例:person:name。
各列のデータ [タイプ] を選択します。
重要宛先テーブルのデータ型がソース ApsaraDB for MongoDB インスタンスのデータと互換性があることを確認してください。
オプション:各列のデータ [長さ] と [精度] を指定します。
ソーステーブルの列を宛先テーブルの列にマッピングするには、上記の手順を繰り返します。
式がフィールド要件を満たしていない場合
説明たとえば、親子構造などの階層関係を持つフィールド。
[アクション] 列で、データ行の後の
アイコンをクリックします。[+ 新しい列] をクリックします。

[列名]、[タイプ]、[長さ]、[精度] パラメーターを設定します。
bson_value()式を [値の割り当て] フィールドに入力します。詳細については、このトピックの「値の割り当ての例」セクションをご参照ください。重要宛先テーブルのプライマリキー列に
bson_value("_id")を割り当てる必要があります。階層関係に基づいて、対応する
bson_value()式で各列のフィールドとサブフィールドを指定する必要があります。そうしないと、データが失われたり、タスクが失敗したりする可能性があります。
上記のステップを繰り返して、ソーステーブルの列をデスティネーションテーブルの列にマップします。
[OK] をクリックします。
次へ:詳細設定 をクリックして詳細設定を行います。
パラメーター
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、専用のクラスターを指定しない場合、DTS は共有クラスターにタスクをスケジュールします。 データ同期インスタンスの安定性を向上させるには、専用のクラスターを購入します。 詳細については、「DTS 専用クラスターとは」をご参照ください。
失敗した接続の再試行時間
接続失敗時の再試行時間の範囲。 データ同期タスクの開始後にソースデータベースまたはターゲットデータベースへの接続に失敗した場合、DTS は指定された時間範囲内で直ちに再接続を試みます。 有効値: 10 ~ 1440。 単位: 分。 デフォルト値: 720。 このパラメーターは 30 より大きい値に設定することをお勧めします。 指定された時間範囲内で DTS がソースデータベースとターゲットデータベースに再接続すると、DTS はデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。
説明同じソースデータベースまたはターゲットデータベースを持つ複数のデータ同期タスクに異なる再試行時間の範囲を指定した場合、最も短い再試行時間の範囲が優先されます。
DTS が再接続を試行すると、DTS インスタンスの料金が発生します。 ビジネス要件に基づいて再試行時間の範囲を指定することをお勧めします。 また、ソースインスタンスと宛先インスタンスが解放された後、できるだけ早く DTS インスタンスを解放することもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題の再試行時間の範囲。 たとえば、データ同期タスクの開始後に DDL または DML 操作の実行に失敗した場合、DTS は指定された時間範囲内で直ちに操作を再試行します。 有効値: 1 ~ 1440。 単位: 分。 デフォルト値: 10。 このパラメーターは 10 より大きい値に設定することをお勧めします。 指定された時間範囲内で失敗した操作が正常に実行されると、DTS はデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくなければなりません。
完全同期レートを制限するかどうか
完全データ同期中、DTS はソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。 1 秒あたりのソースデータベースのクエリ率 QPS、1 秒あたりの完全移行の行数 RPS、1 秒あたりの完全移行データ量 (MB) BPS パラメーターを完全データ同期タスク用に設定して、ターゲットデータベースサーバーの負荷を軽減できます。
説明完全データ同期 が 同期タイプ パラメーターに選択されている場合にのみ、このパラメーターを設定できます。
同期するデータのうち、同一テーブル内のプライマリキー_id のデータ型が一意かどうか
同期対象データのコレクションのプライマリキー
_idのデータ型が一意かどうか。 有効値:説明ビジネス要件に基づいてこのパラメーターを指定します。 そうしないと、データが失われる可能性があります。
このパラメーターは、[完全データ同期] が [同期タイプ] パラメーターに選択されている場合にのみ表示されます。
[はい]: データ型が一意です。 完全データ同期中、DTS はソースデータベースから同期対象データのプライマリキー
_idのデータ型をスキャンしません。 DTS は、単一のコレクション内のデータ型のプライマリキーのデータのみを同期します。[いいえ]: データ型が一意ではありません。 完全データ同期中、DTS はソースデータベースから同期対象データのプライマリキー
_idのデータ型をスキャンし、同期対象のすべてのデータを同期します。
増分同期率を制限するかどうか
増分データ同期の調整を有効にするかどうかを指定します。 ビジネス要件に基づいて、増分データ同期の調整を有効にすることができます。 調整を設定するには、1 秒あたりの増分同期の行数 RPS パラメーターと 1 秒あたりの増分同期データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、ターゲットデータベースサーバーの負荷が軽減されます。
環境タグ
DTS インスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。 この例では、このパラメーターを設定する必要はありません。
ETL の設定
抽出、変換、書き出し (ETL) 機能を有効にするかどうかを指定します。 詳細については、「ETL とは」をご参照ください。有効値:
[はい]: ETL 機能を設定します。 コードエディターにデータ処理文を入力できます。 詳細については、「データ移行タスクまたはデータ同期タスクで ETL を設定する」をご参照ください。
[いいえ]: ETL 機能を設定しません。
説明Lindorm インスタンスのターゲットテーブルが Apache HBase API を呼び出すことによって作成された場合は、次の点に注意してください。
ETL スクリプトで同期するカラムと同期しないカラムを指定する必要があります。 デフォルトでは、ETL タスクで指定されたドキュメントのトップレベルフィールドは、データ同期中に Apache HBase API を呼び出すことによって作成されたテーブルの f カラムファミリーに格納されます。 次のコードは、[ _id ] と [ Name ] 以外のカラムのデータ行を動的カラムとしてターゲットテーブルに書き込む方法を示しています。 詳細については、このトピックの「Apache HBase API を呼び出すことによって作成されたテーブルの ETL タスクの設定例」セクションをご参照ください。
script:e_expand_bson_value("*", "_id,name")追加のカラムを追加して ETL 機能を使用する場合は、Lindorm インスタンスに重複データが含まれていないことを確認してください。
DTS は、追加のカラム、または ETL タスクに含まれていないカラムをターゲットデータベースに同期しません。
監視アラート
データ同期インスタンスのアラートを設定するかどうかを指定します。 タスクが失敗した場合、または同期遅延が指定されたしきい値を超えた場合、アラート連絡先に通知が送信されます。 有効値:
[いいえ]: アラートを有効にしません。
[はい]: アラートを設定します。 この場合、アラートのしきい値と アラート通知設定 も設定する必要があります。 詳細については、「モニタリングとアラートの設定」トピックの「DTS タスクの作成時にモニタリングとアラートを設定する」セクションをご参照ください。
タスク設定を保存し、事前チェックを実行します。
DTS タスクを設定するために関連 API 操作を呼び出すときに指定するパラメーターを表示するには、次:タスク設定の保存と事前チェック にポインターを移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示する必要がない場合、またはすでに表示済みの場合は、ページの下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ同期タスクを開始する前に、DTS は事前チェックを実行します。タスクが事前チェックに合格した後でのみ、データ同期タスクを開始できます。
データ同期タスクが事前チェックに失敗した場合は、失敗した各項目の横にある [詳細の表示] をクリックします。チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。次に、事前チェックを再実行します。
事前チェック中に項目に対してアラートがトリガーされた場合:
アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして、問題をトラブルシューティングします。次に、事前チェックを再度実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。[詳細の表示] ダイアログボックスで、[無視] をクリックします。表示されるメッセージで、[OK] をクリックします。次に、[再チェック] をクリックして、事前チェックを再度実行します。アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ちます。次に、[次へ: インスタンスの購入] をクリックします。
[購入] ページで、データ同期タスクの課金方法とインスタンスクラスのパラメーターを設定します。次の表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
課金方法
サブスクリプション: データ同期インスタンスを作成するときにサブスクリプション料金を支払います。サブスクリプション課金方法は、長期使用の場合、従量課金方法よりも費用対効果が高くなります。
従量課金: 従量課金インスタンスは時間単位で課金されます。従量課金方法は、短期使用に適しています。従量課金データ同期インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。
リソースグループ設定
データ同期インスタンスが属するリソースグループ。デフォルト値: [デフォルトのリソースグループ]。詳細については、「リソース管理とは」をご参照ください。
インスタンスクラス
DTS は、同期速度が異なるインスタンスクラスを提供します。ビジネス要件に基づいてインスタンスクラスを選択できます。詳細については、「データ同期インスタンスのインスタンスクラス」をご参照ください。
サブスクリプション期間
サブスクリプション課金方法を選択した場合は、サブスクリプション期間と作成するデータ同期インスタンスの数 を指定します。サブスクリプション期間は、1 ~ 9 か月、1 年、2 年、3 年、または 5 年です。
説明このパラメーターは、サブスクリプション 課金方法を選択した場合にのみ使用できます。
[Data Transmission Service (従量課金) サービス規約] を読んで選択します。
[購入して開始] をクリックします。表示されるダイアログボックスで、OK をクリックします。
タスクの進捗状況は、タスクリストで確認できます。
Apache HBase API を呼び出して作成されたテーブルへのカラムマッピングの追加例
この例では、SQL Shell を使用します。
Lindorm インスタンスのエンジンバージョンは 2.4.0 以降である必要があります。
Apache HBase API を呼び出して作成されたテーブルのカラムマッピングを作成します。
ALTER TABLE test MAP DYNAMIC COLUMN f:_mongo_id_ HSTRING/HINT/..., person:name HSTRING, person:age HINT;Apache HBase API を呼び出して作成されたテーブルのセカンダリインデックスを作成します。
CREATE INDEX idx ON test(f:_mongo_id_);
Apache HBase API を呼び出すことによって作成されたテーブルの ETL タスク設定例
ソース ApsaraDB for MongoDB インスタンス内のドキュメント
{
"_id" : 0,
"person" : {
"name" : "cindy0",
"age" : 0,
"student" : true
}
}ETL 構文
script:e_expand_bson_value("*", "_id")同期結果

値の割り当ての例
ソース ApsaraDB for MongoDB インスタンスのデータ構造
{
"_id":"62cd344c85c1ea6a2a9f****",
"person":{
"name":"neo",
"age":"26",
"sex":"male"
}
}Lindorm インスタンスのデスティネーションテーブルのスキーマ
列名 | カテゴリ |
id | STRING |
person_name | STRING |
person_age | INT |
追加列の設定
階層関係に基づいて、対応する bson_value() 式で各列のフィールドとサブフィールドを指定する必要があります。指定しないと、データが失われたり、タスクが失敗したりする可能性があります。たとえば、bson_value("person") 式を使用してソース列の person フィールドのみを指定した場合、DTS は person フィールドのサブフィールド(name、age、sex など)の増分データをデスティネーション列に書き込むことができません。
列名 | カテゴリ | 値 |
id | STRING | bson_value("_id") |
person_name | STRING | bson_value("person","name") |
person_age | BIGINT | bson_value("person","age") |