すべてのプロダクト
Search
ドキュメントセンター

Data Transmission Service:ApsaraDB for MongoDBインスタンスからLindormインスタンスへのデータの同期

最終更新日:Oct 22, 2024

このトピックでは、data Transmission Service (DTS) を使用して、ApsaraDB for MongoDBレプリカセットまたはシャードクラスターインスタンスからLindormインスタンスにデータを同期する方法について説明します。 Lindormは安定しており、費用対効果が高く、使いやすいです。 Lindormは柔軟で信頼性の高い機能を提供し、メタデータ、注文、請求書、プロファイル、ソーシャルネットワーキング情報などのさまざまな種類のデータを、高い同時実行性と低いレイテンシで保存できます。

前提条件

  • ドイツ (フランクフルト) リージョンにあるApsaraDB for MongoDBインスタンスが作成されています。

  • ApsaraDB for MongoDBインスタンスは、レプリカセットまたはシャードクラスターアーキテクチャにデプロイされています。

    重要

    ソースインスタンスがApsaraDB for MongoDBシャードクラスターインスタンスの場合、エンドポイントはシャードノードに割り当てられ、シャードノードは同じアカウントとパスワードを共有します。 詳細については、「シャードノードまたはシャードクラスターインスタンスのConfigServerノードのエンドポイントの申請」をご参照ください。

  • 使用可能なストレージスペースがソースApsaraDB for MongoDBインスタンスのデータの合計サイズよりも大きいLindormインスタンスが作成されます。 広いテーブルエンジンは、Lindormインスタンスに使用されます。 詳細については、「インスタンスの作成」をご参照ください。

    説明

    ターゲットインスタンスの使用可能なストレージスペースは、ソースインスタンスのデータの合計サイズよりも10% に大きい。 これは推奨される前提条件です。

  • Lindormインスタンスにワイドテーブルが作成されます。 詳細については、「Lindorm-cliを使用してLindormTableに接続して使用する」および「Lindorm Shellを使用してLindormTableに接続する」をご参照ください。

    説明

    Apache HBase APIを呼び出してワイドテーブルを作成する場合は、列マッピングを作成することを推奨します。 詳細については、このトピックの「Apache HBase APIを呼び出して作成したテーブルの列マッピングの追加例」をご参照ください。

使用上の注意

カテゴリ

説明

ソースデータベースの制限

  • 帯域幅要件: ソースデータベースがデプロイされるサーバーには、十分なアウトバウンド帯域幅が必要です。 そうしないと、データ同期速度が影響を受けます。

  • 同期するコレクションには、PRIMARY KEYまたはUNIQUE制約が必要で、すべてのフィールドが一意である必要があります。 そうでない場合、宛先データベースは重複するデータレコードを含み得る。

  • 同期するオブジェクトとしてコレクションを選択し、ターゲットデータベース内のコレクションを変更する場合 (コレクションの名前の変更など) 、1つのデータ同期タスクで最大1,000個のコレクションを同期できます。 タスクを実行して1,000を超えるコレクションを同期すると、リクエストエラーが発生します。 この場合、複数のタスクを構成してコレクションをバッチで同期するか、タスクを構成してデータベース全体を同期することをお勧めします。

  • ソースMongoDBインスタンスがシャードクラスタアーキテクチャにデプロイされている場合、インスタンス内のMongosノードの数は10を超えることはできません。

  • ターゲットApsaraDB for MongoDBインスタンスの操作ログ機能を有効にする必要があります。 それ以外の場合、事前チェック中にエラーメッセージが返され、データ同期タスクを開始できません。

    説明

    ソースデータベースの操作ログは、少なくとも7日間保持する必要があります。 そうしないと、DTSは操作ログの取得に失敗し、タスクが失敗したり、データの不整合やデータの損失が発生する可能性があります。 操作ログの保持期間は、上記の要件に基づいて設定してください。 それ以外の場合、DTSのサービスレベル契約 (SLA) はサービスの信頼性またはパフォーマンスを保証しません。

  • ソースデータベースで実行する操作の制限:

    • データ同期タスクのスキーマ同期および完全データ同期段階では、データベースまたはコレクションのスキーマを変更しないでください。 それ以外の場合、データ同期タスクは失敗します。

    • 完全データ同期のみを実行する場合は、データ同期中にソースデータベースにデータを書き込まないでください。 そうしないと、ソースデータベースとターゲットデータベースの間でデータの不一致が発生する可能性があります。 データの一貫性を確保するために、同期タイプとしてスキーマ同期、完全データ同期、および増分データ同期を選択することを推奨します。

  • TTL (time to live) インデックスを含むコレクションは同期できません。 ソースデータベースにTTLインデックスが含まれている場合、同期後にソースデータベースとターゲットデータベース間でデータの不整合が発生する可能性があります。

  • 分離先のMongoDBシャードクラスターインスタンスで孤立したドキュメントが削除されていることを確認します。 そうしないと、データの不整合が発生したり、タスクが失敗したりします。 詳細については、MongoDBの公式ドキュメントの用語集およびシャードクラスターアーキテクチャにデプロイされたMongoDBデータベースの孤立したドキュメントを削除する方法をご参照ください。 「FAQ」トピックのセクション。

その他の制限

  • ドイツ (フランクフルト) リージョン内の同期タスクのみがサポートされています。

  • ターゲットインスタンスは、新しいエディションのLindorm V2.0インスタンスにすることはできません。

  • DTSは、adminまたはローカルデータベースのデータを同期できません。

  • ターゲットLindormインスタンスには、_idまたは _value列を持つコレクションを含めることはできません。 それ以外の場合、データ同期タスクは失敗します。

  • 増分データ同期中にUPDATEまたはDELETE操作を同期するには、次の制限事項に注意してください。

    • Lindorm SQLステートメントを実行してワイドテーブルを作成する場合は、テーブルを作成するときに _mongo_id_ という名前の非プライマリキー列を追加する必要があります。 列のデータ型は、ソースApsaraDB for MongoDBインスタンスの _id列のデータ型によって決まります。 さらに、主キー以外の列にセカンダリインデックスを作成する必要があります。

    • Apache HBase APIを呼び出してワイドテーブルを作成する場合は、テーブルを作成するときに列ファミリがfである _mongo_id_ という名前の非プライマリキー列を追加する必要があります。 列のデータ型は、ソースApsaraDB for MongoDBインスタンスの _id列のデータ型によって決まります。 さらに、主キー以外の列にセカンダリインデックスを作成する必要があります。 列を追加し、抽出、変換、および読み込み (ETL) 機能を使用する場合は、Lindormインスタンスに重複データが含まれていないことを確認してください。

  • トランザクション情報は保持されません。 トランザクションが宛先データベースに同期されると、トランザクションは単一のレコードに変換されます。

  • データを同期する前に、ソースデータベースとターゲットデータベースのパフォーマンスに対するデータ同期の影響を評価します。 オフピーク時にデータを同期することを推奨します。 完全データ同期中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。

  • 完全なデータ同期中、同時INSERT操作により、ターゲットデータベースのコレクションが断片化されます。 完全なデータ同期が完了すると、ターゲットデータベースのコレクションのストレージ使用量は、ソースデータベースのコレクションのストレージ使用量よりも大きくなります。

  • FLOATまたはDOUBLEデータ型の列の精度設定がビジネス要件を満たしていることを確認します。 DTSはROUND(COLUMN,PRECISION) 関数を使用して、FLOATまたはDOUBLEデータ型の列から値を取得します。 精度を指定しない場合、DTSはFLOATデータ型の列の精度を38桁に設定し、DOUBLEデータ型の列の精度を308桁に設定します。

  • DTSは、過去7日以内に失敗したデータ同期タスクを再開しようとします。 ワークロードをターゲットデータベースに切り替える前に、失敗したタスクを停止またはリリースする必要があります。 REVOKEステートメントを実行して、DTSがターゲットデータベースにアクセスするために使用するアカウントの書き込み権限を取り消すこともできます。 それ以外の場合、タスクが自動的に再開された後、ソースデータベースのデータがターゲットインスタンスのデータを上書きします。

  • DTSは、同期先データベースの最新の同期データのタイムスタンプとソースデータベースの現在のタイムスタンプに基づいて、増分データ同期のレイテンシを計算します。 長期間にわたってソースデータベースに対して更新操作が実行されない場合、同期レイテンシが不正確になる可能性があります。 データ同期タスクのレイテンシが高すぎる場合は、ソースデータベースで更新操作を実行してレイテンシを更新できます。

課金

同期タイプ

タスク設定料金

完全データ同期

無料です。

増分データ同期

有料。 詳細については、「課金の概要」をご参照ください。

同期タイプ

同期タイプ

説明

完全データ同期

DTSは、選択したオブジェクトのすべての既存データをソースApsaraDB for MongoDBインスタンスからターゲットLindormインスタンスに同期します。

説明

DTSは、データベースとコレクションのオブジェクトの完全なデータ同期をサポートしています。

増分データ同期

DTSは、移行元ApsaraDB for MongoDBインスタンスから移行先Lindormインスタンスに増分データを同期します。

説明

コレクションのドキュメントの挿入、更新、および削除操作のみがサポートされています。

データベースアカウントに必要な権限

データベースタイプ

必要な権限

関連ドキュメント

ApsaraDB for MongoDBインスタンスのソース

ソース、管理者、およびローカルデータベースの読み取り権限。

MongoDBデータベースユーザーの権限の管理

宛先Lindormインスタンス

宛先Lindormインスタンスの名前空間に対する読み取りおよび書き込み権限。

アクセス制御の権限管理

手順

  1. [データ同期タスク] ページに移動します。

    1. にログインします。 DMSコンソールを使用します。

    2. 上部のナビゲーションバーで、ポインタを上に移動します。データ开発.

    3. 選択DTS (DTS) > データ同期.

    説明
  2. の右側にデータ同期タスク、データ同期インスタンスが存在するリージョンを選択します。

    説明

    新しいDTSコンソールを使用する場合は、上部のナビゲーションバーでデータ同期タスクを作成するリージョンを選択します。

  3. [タスクの作成] をクリックします。 [タスクの作成] ページで、ソースデータベースとターゲットデータベースを設定します。 次の表にパラメーターを示します。

    セクション

    パラメーター

    説明

    非該当

    タスク名

    DTSタスクの名前。 タスク名は自動生成されます。 タスクを簡単に識別できるように、わかりやすい名前を指定することをお勧めします。 一意のタスク名を指定する必要はありません。

    移行元データベース

    既存の DMS データベースインスタンスを選択します。(任意です。DMS データベースインスタンスが未登録の場合は、このオプションを無視して、以下のセクションでデータベース設定を行ってください。)

    使用するデータベースインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。

    • 既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。

    • 既存のインスタンスを選択しない場合は、次のデータベース情報を設定する必要があります。

    データベースタイプ

    移行元ディスクのタイプを設定します。 MongoDB を選択します。

    アクセス方法

    ソースデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。

    インスタンスのリージョン

    ソースApsaraDB for MongoDBインスタンスが存在するリージョン。

    Alibaba Cloud アカウント間でデータを複製

    Alibaba Cloudアカウント間でデータを同期するかどうかを指定します。 この例では、× が選択されています。

    アーキテクチャ

    ソースインスタンスがデプロイされるアーキテクチャ。 この例では、レプリカセットが選択されています。

    説明

    ソースApsaraDB for MongoDBインスタンスがシャードクラスターアーキテクチャにデプロイされている場合、ShardアカウントおよびShardパスワードパラメーターを設定する必要があります。

    インスタンス ID

    ソースApsaraDB for MongoDBインスタンスのID。

    認証データベース

    ソースApsaraDB for MongoDBインスタンスのデータベースアカウントとパスワードを格納する認証データベースの名前。 以前に名前を変更しなかった場合、デフォルト値はadminです。

    データベースアカウント

    ソースApsaraDB for MongoDBインスタンスのデータベースアカウント。 必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」をご参照ください。

    データベースのパスワード

    データベースインスタンスへのアクセスに使用されるパスワード。

    移行先データベース

    既存の DMS データベースインスタンスを選択します。(任意です。DMS データベースインスタンスが未登録の場合は、このオプションを無視して、以下のセクションでデータベース設定を行ってください。)

    使用するデータベースインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。

    • 既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。

    • 既存のインスタンスを選択しない場合は、次のデータベース情報を設定する必要があります。

    データベースタイプ

    ターゲットデータベースのタイプ。 Lindormを選択します。

    アクセス方法

    ターゲットデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。

    インスタンスのリージョン

    ターゲットLindormインスタンスが存在するリージョン。

    インスタンス ID

    宛先LindormインスタンスのID。

    データベースアカウント

    ターゲットLindormインスタンスのデータベースアカウント。 アカウントに必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」をご参照ください。

    データベースのパスワード

    データベースインスタンスへのアクセスに使用されるパスワード。

  4. ページの下部で、接続性をテストして続行.

    ソースまたはターゲットデータベースがAlibaba Cloudデータベースインスタンス (ApsaraDB RDS for MySQLインスタンスやApsaraDB for MongoDBインスタンスなど) の場合、DTSは自動的にDTSサーバーのCIDRブロックをインスタンスのホワイトリストに追加します。 ソースデータベースまたはターゲットデータベースがElastic Compute Service (ECS) インスタンスでホストされている自己管理データベースの場合、DTSサーバーのCIDRブロックがECSインスタンスのセキュリティグループルールに自動的に追加されます。ECSインスタンスがデータベースにアクセスできることを確認する必要があります。 データベースが複数のECSインスタンスにデプロイされている場合、DTSサーバーのCIDRブロックを各ECSインスタンスのセキュリティグループルールに手動で追加する必要があります。 ソースデータベースまたはターゲットデータベースが、データセンターにデプロイされているか、サードパーティのクラウドサービスプロバイダーによって提供される自己管理データベースである場合、DTSサーバーのCIDRブロックをデータベースのホワイトリストに手動で追加して、DTSがデータベースにアクセスできるようにする必要があります。 詳細については、「DTSサーバーのCIDRブロックの追加」トピックの「DTSサーバーのCIDRブロック」セクションをご参照ください。

    警告

    DTSサーバーのCIDRブロックがデータベースまたはインスタンスのホワイトリスト、またはECSセキュリティグループルールに自動的または手動で追加されると、セキュリティリスクが発生する可能性があります。 したがって、DTSを使用してデータを同期する前に、潜在的なリスクを理解して認識し、次の対策を含む予防策を講じる必要があります。VPNゲートウェイ、またはSmart Access Gateway。

  5. 同期するオブジェクトと詳細設定を設定します。

    パラメーター

    説明

    同期タイプ

    デフォルトでは、増分データ同期が選択されています。 [フルデータ同期] のみを選択できます。 [スキーマ同期] は選択できません。 事前チェックが完了すると、DTSは選択したオブジェクトの履歴データをソースデータベースからターゲットデータベースに同期します。 履歴データは、その後の増分同期の基礎となる。

    競合するテーブルの処理モード

    • エラーの事前チェックと報告: ターゲットデータベースに、ソースデータベースのコレクションと同じ名前のコレクションが含まれているかどうかを確認します。 ソースデータベースとターゲットデータベースに同じコレクション名のコレクションが含まれていない場合は、事前チェックに合格します。 それ以外の場合、事前チェック中にエラーが返され、データ同期タスクを開始できません。

      説明

      ソースデータベースとターゲットデータベースに同じ名前のコレクションがあり、ターゲットデータベース内のコレクションを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに同期されるコレクションの名前を変更できます。 詳細については、「同期するオブジェクトの名前変更」をご参照ください。

    • エラーを無視して続行: ソースデータベースとターゲットデータベースで同じコレクション名の事前チェックをスキップします。

      警告

      エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。

      • ターゲットデータベースのデータレコードに、ソースデータベースのデータレコードと同じプライマリキー値または一意のキー値がある場合、DTSはデータレコードをターゲットデータベースに同期しません。 ターゲットデータベースの既存のデータレコードが保持されます。

      • データの初期化に失敗するか、特定の列のみが同期されるか、データ同期タスクが失敗する可能性があります。

    移行先インスタンスでのオブジェクト名の大文字化

    ターゲットインスタンスのデータベース名とコレクション名の大文字化。 デフォルトでは、DTSデフォルトポリシーが選択されています。 他のオプションを選択して、オブジェクト名の大文字化が、ソースまたはターゲットデータベースのオブジェクト名のデフォルトの大文字化と一致するようにすることができます。 詳細については、「ターゲットインスタンスのオブジェクト名の大文字化の指定」をご参照ください。

    ソースオブジェクト

    ソースオブジェクト セクションから1つ以上のオブジェクトを選択し、向右アイコンをクリックして 選択中のオブジェクト セクションにオブジェクトを追加します。

    説明

    同期するオブジェクトとしてコレクションを選択できます。

    選択中のオブジェクト

    SQL文を実行してターゲットデータベースのワイドテーブルを作成する場合は、ソースデータベースから同期するオブジェクトに基づいてワイドテーブルに列を追加する必要があります。 ソースデータベースに存在するがワイドテーブルに追加されていない列は、ターゲットデータベースに同期されません。

    1. データベース名を編集します。

      1. 選択中のオブジェクト セクションで、同期するコレクションを含むデータベースを右クリックします。

      2. [スキーマの編集] ダイアログボックスで、Lindormインスタンスで使用するデータベース名を スキーマ名 フィールドに入力します。

        image.png

      3. オプションです。 同期する DML 操作を選択 セクションで、増分データ同期中に同期する操作を選択します。

      4. [OK] をクリックします。

    2. テーブル名を編集します。

      1. 選択中のオブジェクト セクションで、同期するコレクションを右クリックします。

      2. [テーブル名の編集] ダイアログボックスで、Lindormインスタンスで使用するテーブル名を [テーブル名] フィールドに入力します。

        image.png

      3. オプションです。 データをフィルタリングする条件を指定できます。 詳細については、「フィルター条件の指定」をご参照ください。

      4. オプションです。 同期する DML 操作を選択 セクションで、増分データ同期中に同期する操作を選択します。

    3. ソースApsaraDB for MongoDBインスタンスから同期する列を指定します。

      image.png

      1. [追加列] セクションで、[+ 列の追加] をクリックします。

      2. [列名] パラメーターを設定します。

        説明

        Lindormインスタンスのターゲットテーブルで使用する列名を入力します。

        • SQL文を実行してターゲットテーブルを作成する場合は、これらの列名を [column Name] パラメーターの値として指定します。

        • Apache HBase APIを呼び出してターゲットテーブルを作成し、追加の列が必要な場合は、列名を編集する前に列マッピングを作成する必要があります。 詳細については、このトピックの「Apache HBase APIを呼び出して作成したテーブルの列マッピングの追加例」をご参照ください。 [列名] パラメーターを指定するときは、次のルールに注意してください。

          • 列が主キーの場合は、列名としてROWを指定します。

          • 列が主キーでない場合は、columnファミリ: Column Name形式でColumn nameパラメーターを指定します。 例: person:name

      3. 各列のデータ型を設定します。

      4. オプションです。 各列のデータ長と精度を設定します。

      5. [値の割り当て] 列にbson_value() 式を入力します。 詳細については、このトピックの「値の割り当て例」をご参照ください。

        重要

        階層関係に基づいて、対応するbson_value() 式の各列のフィールドとサブフィールドを指定する必要があります。 そうしないと、データ損失が発生したり、タスクが失敗したりします。

      6. 上記の手順を繰り返して、ソーステーブルの列をターゲットテーブルの列にマップします。

      7. [OK] をクリックします。

  6. [次へ:詳細設定] をクリックして詳細設定を構成します。

    パラメーター

    説明

    タスクのスケジュールに使用する専用クラスターの選択

    デフォルトでは、DTSはタスクを共有クラスターにスケジュールします。 このパラメーターを設定する必要はありません。 データ同期タスクの安定性を向上させたい場合は、専用クラスターを購入してください。 詳細については、「DTS専用クラスターの概要」をご参照ください。

    アラートの設定

    データ同期タスクのアラートを設定するかどうかを指定します。 タスクが失敗するか、同期レイテンシが指定されたしきい値を超えると、アラート送信先は通知を受け取ります。 有効な値:

    失敗した接続の再試行時間

    失敗した接続のリトライ時間範囲。 データ同期タスクの開始後にソースデータベースまたはターゲットデータベースの接続に失敗した場合、DTSはその時間範囲内ですぐに接続を再試行します。 有効な値: 10 ~ 1440 単位は分です。 デフォルト値: 720 このパラメーターを30より大きい値に設定することを推奨します。 DTSが指定された時間範囲内にソースデータベースとターゲットデータベースに再接続すると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。

    説明
    • ソースまたはターゲットデータベースが同じである複数のデータ同期タスクに対して異なるリトライ時間範囲を指定した場合、最も短いリトライ時間範囲が優先されます。

    • DTSが接続を再試行すると、DTSインスタンスに対して課金されます。 業務要件に基づいて再試行時間範囲を指定することを推奨します。 ソースインスタンスとターゲットインスタンスがリリースされた後、できるだけ早くDTSインスタンスをリリースすることもできます。

    移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。

    その他の問題の再試行時間範囲。 たとえば、データ同期タスクの開始後にDDLまたはDML操作の実行に失敗した場合、DTSはその時間範囲内ですぐに操作を再試行します。 有効な値: 1 ~ 1440 単位は分です。 デフォルト値は 10 です。 このパラメーターを10より大きい値に設定することを推奨します。 指定された時間範囲内で失敗した操作が正常に実行されると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。

    重要

    移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくする必要があります。

    完全移行率を制限するかどうか

    完全データ同期中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。 1 秒あたりのソースデータベースのクエリ率 QPS1 秒あたりの完全移行の行数 RPS、および1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定して、ターゲットデータベースサーバーの負荷を軽減できます。

    説明

    このパラメーターは、同期タイプ パラメーターで 完全データ同期 が選択されている場合にのみ表示されます。

    増分同期率を制限するかどうか

    増分データ同期のスロットリングを有効にするかどうかを指定します。 ビジネス要件に基づいて、増分データ同期のスロットリングを有効にできます。 スロットリングを設定するには、1 秒あたりの増分同期の行数 RPSおよび1 秒あたりの増分同期データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、移行先データベースサーバーの負荷が軽減されます。

    環境タグ

    DTSインスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。 この例では、このパラメーターを設定する必要はありません。

    ETL の設定

    抽出、変換、および読み込み (ETL) 機能を有効にするかどうかを指定します。 詳細については、「」をご参照ください。ETLとは何ですか? 有効な値:

    説明

    Lindormインスタンスの宛先テーブルがApache HBase APIを呼び出して作成されている場合は、次の項目に注意してください。

    • 同期する列と同期しない列をETLスクリプトで指定する必要があります。 デフォルトでは、ETLタスクで指定されたドキュメントの最上位フィールドは、データ同期中にApache HBase APIを呼び出して作成されたテーブルのf列ファミリに格納されます。 次のコードは、_idおよびname以外の列のデータ行を動的列として宛先テーブルに書き込む方法を示しています。 詳細については、このトピックの「Apache HBase APIを呼び出して作成されたテーブルのETLタスクの設定例」をご参照ください。

      script:e_expand_bson_value("*", "_id,name")
    • 列を追加してETL機能を使用する場合は、Lindormインスタンスに重複データが含まれていないことを確認してください。

    • DTSは、ETLタスクに含まれていない追加の列または列をターゲットデータベースに同期しません。

  7. タスク設定を保存し、事前チェックを実行します。

    • 関連するAPI操作を呼び出してDTSタスクを設定するときに指定するパラメーターを表示するには、ポインターを 次:タスク設定の保存と事前チェック に移動し、OpenAPI パラメーターのプレビュー をクリックします。

    • パラメーターを表示または表示する必要がない場合は、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。

    説明
    • データ同期タスクを開始する前に、DTSは事前チェックを実行します。 データ同期タスクは、タスクが事前チェックに合格した後にのみ開始できます。

    • データ同期タスクが事前チェックに失敗した場合は、失敗した各項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題のトラブルシューティングを行います。 次に、プレチェックを再実行します。

    • 事前チェック中にアイテムに対してアラートがトリガーされた場合:

      • アラートアイテムを無視できない場合は、失敗したアイテムの横にある [詳細の表示] をクリックして、問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。

      • アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されたメッセージボックスで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして、事前チェックを再度実行します。 アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。

  8. 成功率100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。

  9. 購入ページで、データ同期インスタンスの課金方法とインスタンスクラスのパラメーターを設定します。 下表にパラメーターを示します。

    セクション

    パラメーター

    説明

    新しいインスタンスクラス

    Billing Method

    • サブスクリプション: データ同期インスタンスの作成時にサブスクリプションの料金を支払います。 サブスクリプションの課金方法は、長期使用の場合、従量課金の課金方法よりも費用対効果が高くなります。

    • 従量課金: 従量課金インスタンスは1時間ごとに課金されます。 従量課金方法は、短期使用に適しています。 従量課金データ同期インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。

    リソースグループの設定

    データ同期インスタンスが属するリソースグループ。 デフォルト値: Default resource group 詳細については、「」をご参照ください。リソース管理とは

    インスタンスクラス

    DTSは、同期速度が異なるインスタンスクラスを提供します。 ビジネス要件に基づいてインスタンスクラスを選択できます。 詳細については、「データ同期仕様」をご参照ください。

    サブスクリプション期間

    サブスクリプションの課金方法を選択した場合は、サブスクリプション期間と作成するデータ同期インスタンスの数を指定します。 サブスクリプション期間は、1〜9か月、1年、2年、3年、または5年とすることができる。

    説明

    このパラメーターは、サブスクリプション の課金方法を選択した場合にのみ使用できます。

  10. 読み取りと選択データ伝送サービス (従量課金) サービス規約.

  11. [購入して開始] をクリックします。 表示されるダイアログボックスで、OK をクリックします。

    タスクリストでタスクの進行状況を確認できます。

  12. 成功率100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。

Apache HBase APIを呼び出して作成したテーブルに列マッピングを追加する例

この例では、SQL Shellが使用されています。

説明

Lindormインスタンスのエンジンバージョンは2.4.0以降である必要があります。

  1. Apache HBase APIを呼び出して作成したテーブルの列マッピングを作成します。

    ALTER TABLE test MAP DYNAMIC COLUMN f:_mongo_id_ HSTRING/HINT/..., person:name HSTRING, person:age HINT;
  2. Apache HBase APIを呼び出して作成したテーブルのセカンダリインデックスを作成します。

    CREATE INDEX idx ON test(f:_mongo_id_);

Apache HBase APIを呼び出して作成されたテーブルのETLタスクの設定例

ソースApsaraDB for MongoDBインスタンスのドキュメント

{
  "_id" : 0,
  "person" : {
    "name" : "cindy0",
    "age" : 0,
    "student" : true
  }
}

ETL構文

script:e_expand_bson_value("*", "_id")

同期結果

迁移结果

値の割り当て例

ソースApsaraDB for MongoDBインスタンスのデータ構造

{
  "_id":"62cd344c85c1ea6a2a9f****",
  "person":{
    "name":"neo",
    "age":"26",
    "sex":"male"
  }
}

Lindormインスタンスの宛先テーブルのスキーマ。

列名

カテゴリ

id

STRING

person_name

STRING

person_age

INT

追加列の設定

重要

階層関係に基づいて、対応するbson_value() 式の各列のフィールドとサブフィールドを指定する必要があります。 そうしないと、データ損失が発生したり、タスクが失敗したりします。 たとえば、bson_value("person") 式を使用してソース列のpersonフィールドのみを指定した場合、DTSは、名前、年齢、性別などのpersonフィールドのサブフィールドの増分データをターゲット列に書き込むことができません。

列名

カテゴリ

id

STRING

bson_value("_id")

person_name

STRING

bson_value("person","name")

person_age

BIGINT

bson_value("person" 、"age")