Data Transmission Service (DTS) を使用すると、シャーディングキーなしでソースMongoDBインスタンスからシャードクラスターアーキテクチャにデプロイされているMongoDBインスタンスにデータを同期できます。 ターゲットMongoDBインスタンスのシャーディングキーのデフォルト値を指定できます。 このトピックでは、DTSを使用して、ApsaraDB for MongoDBレプリカセットインスタンスからApsaraDB for MongoDBシャードクラスターインスタンスにデータを同期する方法について説明します。
前提条件
ターゲットApsaraDB for MongoDBシャードクラスターインスタンスが作成されました。 詳細については、「シャードクラスターインスタンスの作成」をご参照ください。
説明ソースApsaraDB for MongoDBインスタンスがシャードクラスターアーキテクチャにデプロイされている場合、エンドポイントがソースApsaraDB for MongoDBインスタンスのシャードに割り当てられ、シャードが同じアカウントとパスワードを共有していることを確認します。 詳細については、「シャードまたはConfigServerノードのエンドポイントの申請」をご参照ください。
サポートされているデータベースバージョンの詳細については、「データ同期シナリオの概要」をご参照ください。
移行元ApsaraDB for MongoDBインスタンスの使用可能なストレージ容量が、移行元ApsaraDB for MongoDBインスタンスのデータの合計サイズよりも10% に大きいこと。 これは推奨される前提条件です。
ターゲットApsaraDB for MongoDBインスタンスでシャードするデータベースとコレクションが作成され、ビジネス要件に基づいてシャードが設定され、バランサーが事前シャードが有効になっています。 詳細については、「シャードのパフォーマンスを最大化するためのシャーディングの設定」および「MongoDBシャードクラスターインスタンスでのデータ分散のバランスを取る方法」をご参照ください。 「FAQ」トピックのセクション。
説明シャードクラスターインスタンスのシャーディングを設定すると、同期されたデータは異なるシャードに分散されます。 これにより、シャードクラスターのパフォーマンスが最大になります。 事前シャーディングのためにbalancerを有効にすると、データスキューが防止されます。
制限事項
カテゴリ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
特別なケース | ソースデータベースが自己管理型MongoDBデータベースの場合、次の制限事項に注意してください。
説明 同期するオブジェクトとしてデータベース全体を選択した場合は、ハートビートテーブルを作成できます。 ハートビートテーブルは1秒ごとに更新されるか、データを受信します。 |
課金
同期タイプ | タスク設定料金 |
スキーマ同期と完全データ同期 | 無料です。 |
増分データ同期 | 有料。 詳細については、「課金の概要」をご参照ください。 |
同期タイプ
同期タイプ | 説明 |
スキーマ同期 | DTSは、選択したオブジェクトのスキーマをソースApsaraDB for MongoDBインスタンスからターゲットApsaraDB for MongoDBインスタンスに同期します。 |
完全データ同期 | DTSは、ソースApsaraDB for MongoDBインスタンスのオブジェクトの既存のすべてのデータを、ターゲットApsaraDB for MongoDBインスタンスに同期します。 説明 DTSは、データベースとコレクションの完全なデータ同期をサポートしています。 |
増分データ同期 | DTSは、増分データをソースApsaraDB for MongoDBインスタンスからターゲットApsaraDB for MongoDBインスタンスに同期します。 説明 DTSは、タスクの実行開始後に作成されるデータベースからの増分データ同期をサポートしません。 DTSは、次の操作によって生成された増分データを同期します。
|
データベースアカウントに必要な権限
データベース | 必要な権限 | 関連ドキュメント |
ApsaraDB for MongoDBインスタンスのソース | ソース、管理者、およびローカルデータベースに対する読み取り権限。 | |
ターゲットApsaraDB for MongoDBインスタンス | dbAdminAnyDatabaseアクセス許可、ターゲットデータベースの読み取りおよび書き込みアクセス許可、およびローカルデータベースと設定データベースの読み取りアクセス許可。 |
手順
[データ同期タスク] ページに移動します。
DMSコンソール にログインします。
上部のナビゲーションバーで、ポインタをDTSの上に移動します。
を選択します。
説明実際の動作は、DMSのモードおよびレイアウトに応じて変化し得る。 詳細については、「シンプルモード」および「DMSコンソールのレイアウトとスタイルのカスタマイズ」をご参照ください。
に行くこともできます 新しいDTSコンソールのデータ同期タスクページ。
データ同期タスクの右側に、データ同期タスクを作成するリージョンを選択します。
説明新しいDTSコンソールを使用する場合は、上部のナビゲーションバーでデータ同期タスクを作成するリージョンを選択します。
[タスクの作成] をクリックします。 [タスクの作成] ページで、ソースデータベースとターゲットデータベースを設定します。 次の表にパラメーターを示します。
セクション
パラメーター
説明
N/A
タスク名
タスクの名前。 DTSはタスクに名前を自動的に割り当てます。 タスクを簡単に識別できるように、わかりやすい名前を指定することをお勧めします。 一意のタスク名を指定する必要はありません。
移行元データベース
既存の DMS データベースインスタンスを選択します。(任意です。DMS データベースインスタンスが未登録の場合は、このオプションを無視して、以下のセクションでデータベース設定を行ってください。)
使用するデータベースインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。
既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。
既存のインスタンスを選択しない場合は、ソースデータベースのパラメーターを設定する必要があります。
データベースタイプ
移行元ディスクのタイプを設定します。 MongoDB を選択します。
アクセス方法
ソースデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ソースApsaraDB for MongoDBインスタンスが存在するリージョン。
Alibaba Cloud アカウント間でデータを複製
Alibaba Cloudアカウント間でデータを同期するかどうかを指定します。 この例では、× が選択されています。
アーキテクチャ
ソースApsaraDB for MongoDBインスタンスのアーキテクチャ。 この例では、レプリカセットが選択されています。 有効な値:
レプリカセット: レプリカセットインスタンスに複数のタイプのノードをデプロイして、高可用性と読み書き分離を実装できます。 詳細は、「レプリカセットインスタンス」をご参照ください。
シャードクラスター: シャードクラスターインスタンスは、mongos、shard、Configserverノードの3種類のコンポーネントで構成されています。 mongosおよびshardノードの設定と数をカスタマイズできます。 詳細については、「シャードクラスターインスタンス」をご参照ください。
インスタンス ID
ソースApsaraDB for MongoDBインスタンスのID。
認証データベース
ソースApsaraDB for MongoDBインスタンスのデータベースアカウントとパスワードを格納する認証データベースの名前。 以前に認証データベースの名前を変更しなかった場合、デフォルト値はadminです。
データベースアカウント
ソースApsaraDB for MongoDBインスタンスのデータベースアカウント。 アカウントに必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースアカウントのパスワードを設定します。
移行先データベース
既存の DMS データベースインスタンスを選択します。(任意です。DMS データベースインスタンスが未登録の場合は、このオプションを無視して、以下のセクションでデータベース設定を行ってください。)
使用するデータベースインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。
既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。
既存のインスタンスを選択しない場合は、ソースデータベースのパラメーターを設定する必要があります。
データベースタイプ
ターゲットデータベースのタイプ。 MongoDB を選択します。
アクセス方法
ターゲットデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ターゲットApsaraDB for MongoDBインスタンスが存在するリージョン。
アーキテクチャ
ターゲットApsaraDB for MongoDBインスタンスのアーキテクチャ。 この例では、シャードクラスターが選択されています。
インスタンス ID
移行先のApsaraDB for MongoDBインスタンスのID。
認証データベース
ターゲットApsaraDB for MongoDBインスタンスのデータベースアカウントとパスワードを格納する認証データベースの名前。 以前に認証データベースの名前を変更しなかった場合、デフォルト値はadminです。
データベースアカウント
移行先ApsaraDB for MongoDBインスタンスのデータベースアカウント。 必要な権限の詳細については、このトピックの「データベースアカウントに必要な権限」をご参照ください。
データベースのパスワード
データベースアカウントのパスワードを設定します。
ページの下部で、接続性をテストして続行をクリックします。
ソースまたはターゲットデータベースがAlibaba Cloudデータベースインスタンス (ApsaraDB RDS for MySQLインスタンスやApsaraDB for MongoDBインスタンスなど) の場合、DTSは自動的にDTSサーバーのCIDRブロックをインスタンスのホワイトリストに追加します。 ソースデータベースまたはターゲットデータベースがElastic Compute Service (ECS) インスタンスでホストされている自己管理データベースの場合、DTSサーバーのCIDRブロックがECSインスタンスのセキュリティグループルールに自動的に追加されます。ECSインスタンスがデータベースにアクセスできることを確認する必要があります。 データベースが複数のECSインスタンスにデプロイされている場合、DTSサーバーのCIDRブロックを各ECSインスタンスのセキュリティグループルールに手動で追加する必要があります。 ソースデータベースまたはターゲットデータベースが、データセンターにデプロイされているか、サードパーティのクラウドサービスプロバイダーによって提供される自己管理データベースである場合、DTSサーバーのCIDRブロックをデータベースのホワイトリストに手動で追加して、DTSがデータベースにアクセスできるようにする必要があります。 詳細については、「DTSサーバーのCIDRブロックの追加」をご参照ください。
警告DTSサーバーのCIDRブロックがデータベースまたはインスタンスのホワイトリスト、またはECSセキュリティグループルールに自動的または手動で追加されると、セキュリティリスクが発生する可能性があります。 したがって、DTSを使用してデータを同期する前に、潜在的なリスクを理解して認識し、次の対策を含む予防策を講じる必要があります。VPNゲートウェイ、またはSmart Access Gateway。
同期するオブジェクトと詳細設定を設定します。
パラメーター
説明
同期タイプ
デフォルトでは、増分データ同期が選択されています。 [スキーマ同期] および [完全データ同期] も選択する必要があります。 事前チェックが完了すると、DTSは選択したオブジェクトの履歴データをソースデータベースからターゲットクラスターに同期します。 履歴データは、その後の増分同期の基礎となる。
競合するテーブルの処理モード
事前チェックエラーとレポートエラー: ターゲットデータベースに、ソースデータベースのコレクションと同じ名前のコレクションが含まれているかどうかを確認します。 ソースデータベースとターゲットデータベースに同じコレクション名のコレクションが含まれていない場合は、事前チェックに合格します。 それ以外の場合、事前チェック中にエラーが返され、データ同期タスクを開始できません。
説明オブジェクト名マッピング機能を使用して、ターゲットデータベースに同期されるコレクションの名前を変更できます。 この機能は、ソースデータベースとターゲットデータベースに同じ名前のコレクションが含まれていて、ターゲットデータベースのコレクションを削除または名前変更できない場合に使用できます。 詳細については、「同期するオブジェクトの名前変更」をご参照ください。
エラーを無視して続行: ソースデータベースとターゲットデータベースで同じコレクション名の事前チェックをスキップします。
警告[エラーを無視して続行] を選択すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
DTSは、ターゲットデータベースのデータレコードと同じ主キー値を持つデータレコードを同期しません。
データの初期化に失敗するか、一部の列のみが同期されるか、データ同期タスクが失敗する可能性があります。
同期トポロジ
データ同期タスクの同期トポロジ。 一方向同期 を選択します。
移行先インスタンスでのオブジェクト名の大文字化
ターゲットインスタンスのデータベース名、テーブル名、および列名の大文字化。 デフォルトでは、DTSデフォルトポリシーが選択されています。 他のオプションを選択して、オブジェクト名の大文字化をソースまたはターゲットデータベースの大文字化と一致させることができます。 詳細については、「ターゲットインスタンスのオブジェクト名の大文字化の指定」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから1つ以上のオブジェクトを選択し、アイコンをクリックして、オブジェクトを 選択中のオブジェクト セクションに移動します。
説明同期するオブジェクトとして、データベースまたはコレクションを選択できます。
選択中のオブジェクト
ターゲットApsaraDB for MongoDBシャードクラスターインスタンスでデータが同期されるデータベースを指定するには、次の操作を実行します。
選択中のオブジェクト セクションでデータベースを右クリックします。 スキーマの編集 ダイアログボックスで、ターゲットApsaraDB for MongoDBシャードクラスターインスタンスでデータが同期されるデータベースの名前を スキーマ名 フィールドに入力します。 詳細については、「マップオブジェクト名」をご参照ください。
ターゲットApsaraDB for MongoDBシャードクラスターインスタンスでデータが同期されるコレクションを指定するには、次の操作を実行します。
選択中のオブジェクト セクションでコレクションを右クリックします。 テーブルの編集 ダイアログボックスで、ターゲットApsaraDB for MongoDBシャードクラスターインスタンスでデータが同期されるコレクションの名前を テーブル名 フィールドに入力します。
重要同期するオブジェクトとしてコレクションを選択した場合にのみ、データを受信するコレクションを選択できます。
説明データをフィルタリングする条件を指定するには、選択中のオブジェクト セクションでテーブルを右クリックします。 表示されるダイアログボックスで、条件を指定します。 データ同期タスクの完全データ同期段階でデータをフィルタリングする条件を指定できます。 データ同期タスクの増分データ同期ステージ中にデータをフィルタリングする条件を指定することはできません。 詳細については、「フィルター条件の設定」をご参照ください。
オブジェクト名マッピング機能を使用して、データが同期されるデータベースまたはコレクションの名前を変更すると、データベースまたはコレクションに依存する他のオブジェクトの同期が失敗する可能性があります。
[次へ:詳細設定] をクリックして詳細設定を構成します。
データ検証設定
データ検証機能の設定方法の詳細については、「データ検証の設定」をご参照ください。
詳細設定
パラメーター
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、DTSはタスクを共有クラスターにスケジュールします。 このパラメーターを設定する必要はありません。 データ移行タスクの安定性を向上させたい場合は、専用クラスターを購入してください。 詳細については、「DTS専用クラスターの概要」をご参照ください。
アラートの設定
データ同期タスクのアラートを設定するかどうかを指定します。 タスクが失敗するか、同期レイテンシが指定されたしきい値を超えると、アラート送信先は通知を受け取ります。 有効な値:
No: アラートを設定しません。
Yes: アラートを設定します。 この場合、アラートしきい値と アラート通知設定 詳細については、「DTSタスクの作成時のモニタリングとアラートの設定」をご参照ください。
失敗した接続の再試行時間
失敗した接続のリトライ時間範囲。 データ同期タスクの開始後にソースデータベースまたはターゲットデータベースの接続に失敗した場合、DTSはその時間範囲内ですぐに接続を再試行します。 有効な値: 10 ~ 1440 単位は分です。 デフォルト値: 720 このパラメーターを30より大きい値に設定することを推奨します。 DTSが指定された時間範囲内にソースデータベースとターゲットデータベースに再接続すると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。
説明ソースまたはターゲットデータベースが同じである複数のデータ同期タスクに対して異なるリトライ時間範囲を指定した場合、最も短いリトライ時間範囲が優先されます。
DTSが接続を再試行すると、DTSインスタンスに対して課金されます。 業務要件に基づいて再試行時間範囲を指定することを推奨します。 ソースインスタンスとターゲットインスタンスがリリースされた後、できるだけ早くDTSインスタンスをリリースすることもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題の再試行時間範囲。 たとえば、データ同期タスクの開始後にDDLまたはDML操作の実行に失敗した場合、DTSはその時間範囲内ですぐに操作を再試行します。 有効な値: 1 ~ 1440 単位は分です。 デフォルト値は 10 です。 このパラメーターを10より大きい値に設定することを推奨します。 指定された時間範囲内で失敗した操作が正常に実行されると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。
重要の値は、移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターは、失敗した接続の再試行時間 パラメーターの値より小さくする必要があります。
完全移行率を制限するかどうか
完全データ同期中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。 1 秒あたりのソースデータベースのクエリ率 QPS 、1 秒あたりの完全移行の行数 RPS、および1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定して、ターゲットデータベースサーバーの負荷を軽減できます。
説明このパラメーターは、同期タイプ パラメーターで 完全データ同期 が選択されている場合にのみ表示されます。
増分同期率を制限するかどうか
増分データ同期のスロットリングを有効にするかどうかを指定します。 ビジネス要件に基づいて、増分データ同期のスロットリングを有効にできます。 スロットリングを設定するには、1 秒あたりの増分同期の行数 RPSおよび1 秒あたりの増分同期データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、移行先データベースサーバーの負荷が軽減されます。
環境タグ
DTSインスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。 この例では、環境タグは選択されていません。
ETL の設定
抽出、変換、および読み込み (ETL) 機能を有効にするかどうかを指定します。 詳細については、「ETLとは何ですか?」をご参照ください。有効値:
Yes: ETL機能を設定します。 コードエディターでデータ処理ステートメントを入力できます。 詳細については、「データ移行またはデータ同期タスクでのETLの設定」をご参照ください。
No: ETL機能を設定しません。
次:データベースおよびテーブルのフィールド設定 をクリックして、シャーディングキーのデフォルト値を指定します。
設定するターゲットコレクションを見つけて、[操作] 列の デフォルト値の設定 をクリックします。
説明コレクションのShardKey の数パラメーターの値が0の場合、コレクションにはシャーディングキーがありません。 この手順はスキップできます。テーブル名
ShardKey デフォルト値タイプパラメーターを設定します。
説明ShardKey デフォルト値タイプパラメーターの値として、stringまたはintを選択できます。
デフォルト値パラメーターを設定します。
重要設定したDefault Valueパラメーターは、ターゲットApsaraDB for MongoDBシャードクラスターインスタンスのバージョンが4.4より前の場合にのみ有効になります。
同期するコレクションの各シャーディングキーのデフォルト値を指定する必要があります。 そうしないと、事前チェック中にアラートがトリガーされ、データ同期タスクが失敗する可能性があります。事前チェック
タスク設定を保存し、事前チェックを実行します。
関連するAPI操作を呼び出してDTSタスクを設定するときに指定するパラメーターを表示するには、ポインターを 次:タスク設定の保存と事前チェック に移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示または表示する必要がない場合は、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。
説明データ同期タスクを開始する前に、DTSは事前チェックを実行します。 データ同期タスクは、タスクが事前チェックに合格した後にのみ開始できます。
タスクが事前チェックに合格しなかった場合は、失敗した各項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。
事前チェック中にアイテムに対してアラートが生成された場合は、シナリオに基づいて次の操作を実行します。
アラートアイテムを無視できない場合は、失敗したアイテムの横にある [詳細の表示] をクリックして、問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されたメッセージボックスで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして、事前チェックを再度実行します。 アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
成功率が100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。
[インスタンスの購入] ページで、データ同期インスタンスの課金方法とインスタンスクラスのパラメーターを設定します。 下表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
Billing Method
サブスクリプション: インスタンスの作成時にサブスクリプションの料金を支払います。 サブスクリプションの課金方法は、長期使用の場合、従量課金の課金方法よりも費用対効果が高くなります。 サブスクリプション期間が長くなると、低価格が提供されます。
従量課金: 従量課金インスタンスは1時間ごとに課金されます。 従量課金方法は、短期使用に適しています。 従量課金インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。
リソースグループの設定
インスタンスが属するリソースグループ。 デフォルト値: Default resource group 詳細については、「」をご参照ください。リソース管理とは
インスタンスクラス
DTSは、異なるパフォーマンスをサポートするさまざまな同期仕様を提供します。 同期速度は、選択した同期仕様によって異なります。 ビジネス要件に基づいて同期仕様を選択できます。 詳細については、「データ同期インスタンスの仕様」をご参照ください。
サブスクリプション期間
サブスクリプションの課金方法を選択した場合は、サブスクリプション期間と作成するインスタンスの数を設定します。 サブスクリプション期間は、1〜9か月、1年、2年、3年、または5年とすることができる。
説明このパラメーターは、サブスクリプション の課金方法を選択した場合にのみ使用できます。
データ伝送サービス (従量課金) サービス規約.を読み取り、選択します。
[購入と開始] をクリックして、データ同期タスクを開始します。 タスクリストでタスクの進行状況を確認できます。