このトピックでは、data Transmission Service (DTS) を使用して、ApsaraDB for MongoDBレプリカセットまたはシャードクラスターインスタンスからLindormインスタンスにデータを移行する方法について説明します。
前提条件
ドイツ (フランクフルト) リージョン内の移行タスクのみがサポートされています。
ApsaraDB for MongoDBインスタンスは、レプリカセットまたはシャードクラスターアーキテクチャにデプロイされています。
重要ソースインスタンスがApsaraDB for MongoDBシャードクラスターインスタンスの場合、エンドポイントはシャードノードに割り当てられ、シャードノードは同じアカウントとパスワードを共有します。 詳細については、「シャードノードまたはシャードクラスターインスタンスのConfigServerノードのエンドポイントの申請」をご参照ください。
Lindormインスタンスが作成され、ワイドテーブルエンジンが使用されます。 詳細は、インスタンスの作成をご参照ください。
Lindormインスタンスにワイドテーブルが作成されます。 詳細については、「Lindorm-cliを使用してLindormTableに接続して使用する」および「Lindorm Shellを使用してLindormTableに接続する」をご参照ください。
説明Apache HBase APIを呼び出してワイドテーブルを作成する場合は、列マッピングを作成することを推奨します。 詳細については、このトピックの「Apache HBase APIを呼び出して作成したテーブルの列マッピングの追加例」をご参照ください。
ターゲットインスタンスの使用可能なストレージスペースは、ソースインスタンスのデータの合計サイズよりも10% に大きい。 これは推奨される前提条件です。
使用上の注意
カテゴリ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
課金
移行タイプ | タスク設定料金 | データ転送料金 |
フルデータ移行 | 無料 | インターネット経由でAlibaba Cloudからデータが移行された場合にのみ課金されます。 詳細については、「課金の概要」をご参照ください。 |
増分データ移行 | 有料。 詳細については、「課金の概要」をご参照ください。 |
移行タイプ
移行タイプ | 説明 |
フルデータ移行 | DTSは、移行するオブジェクトの既存のデータを、移行元のApsaraDB for MongoDBインスタンスから移行先のLindormインスタンスに移行します。 説明 DTSは、データベースとコレクションの完全なデータ移行をサポートします。 |
増分データ移行 | 完全データ移行が完了すると、DTSは増分データを移行元ApsaraDB for MongoDBインスタンスから移行先Lindormインスタンスに移行します。 説明 コレクションのドキュメントの挿入、更新、および削除操作のみがサポートされています。 |
データベースアカウントに必要な権限
データベースタイプ | 完全なデータ移行 | 増分データ移行 | 関連ドキュメント |
ApsaraDB for MongoDBインスタンスのソース | ソースデータベースの読み取り権限 | ソースデータベース、管理者データベース、およびローカルデータベースの読み取り権限 | |
宛先Lindormインスタンス | Lindormインスタンスの読み取りおよび書き込み権限 |
手順
この例では、LindormインスタンスでSQL文を実行して作成されたワイドテーブルを使用します。
[データ移行タスク] ページに移動します。
データ管理 (DMS) コンソール にログインします。
上部のナビゲーションバーで、ポインタをDTSの上に移動します。
を選択します。
説明また、新しいDTSコンソールの [データ移行タスク] ページに移動することもできます。
データ移行タスクの横にあるドロップダウンリストから、ソースインスタンスが存在するリージョンを選択します。
説明新しいDTSコンソールを使用する場合は、左上隅にあるデータ移行インスタンスが存在するリージョンを選択します。
[タスクの作成] をクリックします。 [データ移行タスクの作成] ウィザードで、ソースデータベースとターゲットデータベースを設定します。 次の表にパラメーターを示します。
セクション
パラメーター
説明
非該当
タスク名
DTSタスクの名前。 タスク名は自動生成されます。 タスクを簡単に識別できるように、わかりやすい名前を指定することをお勧めします。 一意のタスク名を指定する必要はありません。
ソースデータベース
既存のDMSデータベースインスタンスの選択
使用するデータベースインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。
既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。
既存のインスタンスを選択しない場合は、次のデータベース情報を設定する必要があります。
データベースタイプ
移行元ディスクのタイプを設定します。 MongoDB を選択します。
アクセス方法
ソースデータベースのアクセス方法。 [Alibaba Cloudインスタンス] を選択します。
インスタンスリージョン
ソースApsaraDB for MongoDBインスタンスが存在するリージョン。
Alibaba Cloud アカウント間でデータを複製
Alibaba Cloudアカウント間でデータを移行するかどうかを指定します。 × を選択します。
アーキテクチャ
ソースインスタンスがデプロイされるアーキテクチャ。 この例では、レプリカセットが選択されています。
説明ソースApsaraDB for MongoDBインスタンスがシャードクラスターアーキテクチャにデプロイされている場合、シャードアカウントおよびシャードパスワードパラメーターを設定する必要があります。
インスタンスID
ソースApsaraDB for MongoDBインスタンスのID。
認証データベース
ソースApsaraDB for MongoDBインスタンスのデータベースアカウントとパスワードを格納する認証データベースの名前。 以前に认证データベースの名前を変更しなかった场合、デフォルト値はadminです。
データベースアカウント
ソースApsaraDB for MongoDBインスタンスのデータベースアカウント。
データベースパスワード
データベースインスタンスへのアクセスに使用されるパスワード。
宛先データベース
既存のDMSデータベースインスタンスの選択
使用するデータベースインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。
既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。
既存のインスタンスを選択しない場合は、次のデータベース情報を設定する必要があります。
データベースタイプ
ターゲットデータベースのタイプ。 Lindormを選択します。
アクセス方法
ターゲットデータベースのアクセス方法。 [Alibaba Cloudインスタンス] を選択します。
インスタンスリージョン
ターゲットLindormインスタンスが存在するリージョン。
インスタンスID
宛先LindormインスタンスのID。
データベースアカウント
ターゲットLindormインスタンスのデータベースアカウント。
データベースパスワード
データベースインスタンスへのアクセスに使用されるパスワード。
ページの下部で、[接続のテストと続行] をクリックします。
、ソースまたはターゲットデータベースがAlibaba Cloudデータベースインスタンス (ApsaraDB RDS for MySQL、ApsaraDB for MongoDBインスタンスなど) の場合、DTSは自動的にDTSサーバーのCIDRブロックをインスタンスのIPアドレスホワイトリストに追加します。 ソースデータベースまたはターゲットデータベースがElastic Compute Service (ECS) インスタンスでホストされている自己管理データベースの場合、DTSサーバーのCIDRブロックがECSインスタンスのセキュリティグループルールに自動的に追加されます。ECSインスタンスがデータベースにアクセスできることを確認する必要があります。 自己管理データベースが複数のECSインスタンスでホストされている場合、DTSサーバーのCIDRブロックを各ECSインスタンスのセキュリティグループルールに手動で追加する必要があります。 ソースデータベースまたはターゲットデータベースが、データセンターにデプロイされているか、サードパーティのクラウドサービスプロバイダーによって提供される自己管理データベースである場合、DTSサーバーのCIDRブロックをデータベースのIPアドレスホワイトリストに手動で追加して、DTSがデータベースにアクセスできるようにする必要があります。 詳細については、「DTSサーバーのCIDRブロックの追加」トピックの「DTSサーバーのCIDRブロック」セクションをご参照ください。
警告DTSサーバーのパブリックCIDRブロックがデータベースインスタンスのホワイトリストまたはECSインスタンスのセキュリティグループルールに自動的または手動で追加されると、セキュリティリスクが発生する可能性があります。 したがって、DTSを使用してデータを移行する前に、潜在的なリスクを理解して認識し、ユーザー名とパスワードのセキュリティの強化、公開されるポートの制限、API呼び出しの認証、ホワイトリストまたはセキュリティグループルールの定期的なチェック、CIDRブロックの禁止、またはExpress Connectを使用したデータベースインスタンスのDTSへの接続、VPNゲートウェイ、またはSmart Access Gateway。
移行するオブジェクトを設定します。
パラメーター
説明
移行タイプ
フルデータ移行のみを実行するには、[フルデータ移行] のみを選択します。
データ移行中のサービスの継続性を確保するには、[フルデータ移行] および [増分データ移行] を選択します。
説明増分データ移行を選択しない場合、データ移行中にソースデータベースにデータを書き込まないことを推奨します。 これにより、ソースデータベースとターゲットデータベース間のデータの整合性が確保されます。
競合するテーブルの処理モード
エラーの事前チェックと報告: ターゲットデータベースに、ソースデータベースのコレクションと同じ名前のコレクションが含まれているかどうかを確認します。 ソースデータベースとターゲットデータベースに同じ名前のコレクションが含まれていない場合は、事前チェックに合格します。 それ以外の場合、事前チェック中にエラーが返され、データ移行タスクを開始できません。
説明ソースデータベースとターゲットデータベースに同じ名前のコレクションが含まれていて、ターゲットデータベース内のコレクションを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに移行されるコレクションの名前を変更できます。 詳細については、「マップオブジェクト名」をご参照ください。
エラーを無視して続行: ソースデータベースとターゲットデータベースで同じコレクション名の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データの一貫性が保証されず、ビジネスが潜在的なリスクにさらされる可能性があります。
DTSは、ターゲットデータベースのデータレコードと同じ主キーを持つデータレコードを移行しません。
データの初期化に失敗するか、特定の列のみが移行されるか、データ移行タスクが失敗する可能性があります。
宛先インスタンスでのオブジェクト名の大文字化
ターゲットインスタンスのデータベース名とコレクション名の大文字化。 デフォルトでは、DTSデフォルトポリシーが選択されています。 他のオプションを選択して、オブジェクト名の大文字化が、ソースまたはターゲットデータベースのオブジェクト名のデフォルトの大文字化と一致するようにすることができます。 詳細については、「ターゲットインスタンスのオブジェクト名の大文字化の指定」をご参照ください。
ソースオブジェクト
[ソースオブジェクト] セクションで移行するコレクションを選択し、アイコンをクリックして、コレクションを [選択済みオブジェクト] セクションに移動します。
[選択済みオブジェクト]
SQL文を実行してターゲットデータベースのワイドテーブルを作成する場合は、ソースインスタンスから移行するオブジェクトに基づいて、テーブルに必要な列を作成します。 ソースインスタンスに存在するが、テーブルに作成されていない列は、ターゲットデータベースに移行されません。
スキーマ名を編集します。
選択中のオブジェクト セクションで、移行するコレクションを含むデータベースを右クリックします。
[スキーマの編集] ダイアログボックスで、Lindormインスタンスで使用するデータベース名を スキーマ名 フィールドに入力します。
オプションです。 同期する DDL および DML 操作を選択 セクションで、増分データ移行時に移行する操作を選択できます。
[OK] をクリックします。
テーブル名を編集します。
[選択したオブジェクト] セクションで、移行するコレクションを右クリックします。
[テーブル名の編集] ダイアログボックスで、Lindormインスタンスで使用するテーブル名を [テーブル名] フィールドに入力します。
オプションです。 データをフィルタリングする条件を指定できます。 詳細については、「フィルター条件の指定」をご参照ください。
オプションです。 同期する DDL および DML 操作を選択 セクションで、増分データ移行時に移行する操作を選択できます。
ソースApsaraDB for MongoDBインスタンスから移行する列を指定します。
[+ 列の追加] をクリックします。
[列名] を指定します。
説明Lindormインスタンスのターゲットテーブルで使用する列名を入力します。
SQL文を実行してターゲットテーブルを作成する場合は、これらの列名を [column Name] パラメーターの値として指定します。
Apache HBase APIを呼び出してターゲットテーブルを作成し、追加の列が必要な場合は、列名を編集する前に列マッピングを作成する必要があります。 詳細については、このトピックの「Apache HBase APIを呼び出して作成したテーブルの列マッピングの追加例」をご参照ください。 [列名] パラメーターを指定するときは、次のルールに注意してください。
列が主キーの場合は、列名としてROWを指定します。
列が主キーでない場合は、columnファミリ: Column Name形式でColumn nameパラメーターを指定します。 例: person:name
各列のデータ型を設定します。
オプションです。 各列のデータ長と精度を設定します。
[値の割り当て] 列に
bson_value()
式を入力します。 詳細については、このトピックの「値の割り当て例」をご参照ください。重要階層関係に基づいて、対応する
bson_value()
式の各列のフィールドとサブフィールドを指定する必要があります。 そうしないと、データ損失が発生したり、タスクが失敗したりします。上記の手順を繰り返して、ソーステーブルの列をターゲットテーブルの列にマップします。
[OK] をクリックします。
[次へ: 詳細設定] をクリックして詳細設定を設定します。 下表にパラメーターを示します。
パラメーター
説明
タスクのスケジュールに使用する専用クラスターの選択
既定では、専用クラスターを指定しない場合、DTSは共有クラスターへのデータ移行タスクをスケジュールします。 データ移行タスクの安定性を向上させたい場合は、専用クラスターを購入してください。 詳細については、「DTS専用クラスターの概要」をご参照ください。
アラートの設定
データ移行タスクのアラートを設定するかどうかを指定します。 タスクが失敗するか、移行の待ち時間が指定されたしきい値を超えると、アラート送信先は通知を受け取ります。 有効な値:
No: アラートを設定しません。
Yes: アラートを設定します。 この場合、アラートしきい値と アラート通知設定 詳細については、「モニタリングとアラートの設定」トピックの「DTSタスクを作成するときのモニタリングとアラートの設定」をご参照ください。
失敗した接続の再試行時間
失敗した接続のリトライ時間範囲。 データ移行タスクの開始後にソースデータベースまたはターゲットデータベースの接続に失敗した場合、DTSは再試行時間範囲内ですぐに接続を再試行します。 有効な値: 10 ~ 1440 単位は分です。 デフォルト値: 720 パラメーターを30より大きい値に設定することを推奨します。 指定した再試行時間内にDTSがソースデータベースとターゲットデータベースに再接続された場合、DTSはデータ移行タスクを再開します。 それ以外の場合、データ移行タスクは失敗します。
説明同じソースまたはターゲットデータベースを共有する複数のデータ移行タスクに対して異なるリトライ時間範囲を指定した場合、後で指定される値が優先されます。
DTSが接続を再試行すると、DTSインスタンスに対して課金されます。 業務要件に基づいて再試行時間範囲を指定することを推奨します。 ソースデータベースとターゲットインスタンスがリリースされた後、できるだけ早くDTSインスタンスをリリースすることもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題の再試行時間範囲。 たとえば、データ移行タスクの開始後にDDLまたはDML操作の実行に失敗した場合、DTSは再試行時間範囲内ですぐに操作を再試行します。 有効な値: 1 ~ 1440 単位は分です。 デフォルト値は 10 です。 パラメーターを10より大きい値に設定することを推奨します。 指定された再試行時間内に失敗した操作が正常に実行された場合、DTSはデータ移行タスクを再開します。 それ以外の場合、データ移行タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくする必要があります。
完全移行率を制限するかどうか
フルデータ移行のスロットリングを有効にするかどうかを指定します。 完全データ移行中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これは、データベースサーバの負荷を増加させる可能性がある。 ビジネス要件に基づいて、フルデータ移行のスロットリングを有効にできます。 スロットリングを設定するには、1 秒あたりのソースデータベースのクエリ率 QPS 、1 秒あたりの完全移行の行数 RPS、1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、移行先データベースサーバーの負荷が軽減されます。
説明このパラメーターは、移行タイプ パラメーターに 完全データ移行 を選択した場合にのみ設定できます。
増分移行率を制限するかどうか
増分データ移行のスロットリングを有効にするかどうかを指定します。 スロットリングを設定するには、1 秒あたりの増分移行の行数 RPSと1 秒あたりの増分移行データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、移行先データベースサーバーの負荷が軽減されます。
説明このパラメーターは、移行タイプ パラメーターに 増分データ移行 を選択した場合にのみ設定できます。
環境タグ
DTSインスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。 この例では、このパラメーターを設定する必要はありません。
ETL の設定
抽出、変換、および読み込み (ETL) 機能を有効にするかどうかを指定します。 詳細については、「ETLとは何ですか? 」をご参照ください。有効な値:
Yes: ETL機能を設定します。 コードエディターでデータ処理ステートメントを入力できます。 詳細については、「データ移行またはデータ同期タスクでのETLの設定」をご参照ください。
No: ETL機能を設定しません。
説明Lindormインスタンスの宛先テーブルがApache HBase APIを呼び出して作成されている場合は、次の項目に注意してください。
ETLスクリプトで、移行する列と移行しない列を指定する必要があります。 デフォルトでは、ETLタスクで指定されたドキュメントのトップレベルフィールドは、データ移行中にApache HBase APIを呼び出して作成されたテーブルのf列ファミリに格納されます。 次のコードは、_idおよびname以外の列のデータ行を動的列として宛先テーブルに書き込む方法を示しています。 詳細については、このトピックの「Apache HBase APIを呼び出して作成されたテーブルのETLタスクの設定例」をご参照ください。
script:e_expand_bson_value("*", "_id,name")
列を追加してETL機能を使用する場合は、Lindormインスタンスに重複データが含まれていないことを確認してください。
DTSは、ETLタスクに含まれていない追加の列または列を移行しません。
ページの下部にある次条: タスク設定と事前チェックを保存するページの下部にあるをクリックします。
説明データ移行タスクを開始する前に、DTSは事前チェックを実行します。 データ移行タスクは、タスクが事前チェックに合格した後にのみ開始できます。
タスクが事前チェックに合格しなかった場合は、失敗した各項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。
事前チェック中にアイテムに対してアラートがトリガーされた場合:
アラートアイテムを無視できない場合は、失敗したアイテムの横にある [詳細の表示] をクリックして問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。
アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されたメッセージボックスで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして、事前チェックを再度実行します。 アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
成功率が100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。
[インスタンスの購入] ページで、データ移行インスタンスのインスタンスクラスパラメーターを設定します。 下表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
リソースグループ
データ移行インスタンスが属するリソースグループ。 デフォルト値: Default resource group 詳細については、「リソース管理とは 」をご参照ください。
インスタンスクラス
DTSは、移行速度が異なるインスタンスクラスを提供します。 ビジネスシナリオに基づいてインスタンスクラスを選択できます。 詳細については、「データ移行インスタンスのインスタンスクラス」をご参照ください。
読み取りと選択データ伝送サービス (従量課金) サービス規約.
[購入して開始] をクリックします。 表示されるメッセージで、 [OK] をクリックします。
[データ移行] ページでタスクの進行状況を確認できます。
Apache HBase APIを呼び出して作成したテーブルに列マッピングを追加する例
この例では、SQL Shellが使用されています。
Lindormインスタンスのエンジンバージョンは2.4.0以降である必要があります。
Apache HBase APIを呼び出して作成したテーブルの列マッピングを作成します。
ALTER TABLE test MAP DYNAMIC COLUMN f:_mongo_id_ HSTRING/HINT/..., person:name HSTRING, person:age HINT;
Apache HBase APIを呼び出して作成したテーブルのセカンダリインデックスを作成します。
CREATE INDEX idx ON test(f:_mongo_id_);
Apache HBase APIを呼び出して作成されたテーブルのETLタスクの設定例
ソースApsaraDB for MongoDBインスタンスのドキュメント
{
"_id" : 0,
"person" : {
"name" : "cindy0",
"age" : 0,
"student" : true
}
}
ETL構文
script:e_expand_bson_value("*", "_id")
移行結果
値の割り当て例
ソースApsaraDB for MongoDBインスタンスのデータ構造
{
"_id":"62cd344c85c1ea6a2a9f****",
"person":{
"name":"neo",
"age":"26",
"sex":"male"
}
}
Lindormインスタンスの宛先テーブルのスキーマ。
列名 | カテゴリ |
id | STRING |
person_name | STRING |
person_age | INT |
追加列の設定
階層関係に基づいて、対応するbson_value()
式の各列のフィールドとサブフィールドを指定する必要があります。 そうしないと、データ損失が発生したり、タスクが失敗したりします。 たとえば、bson_value("person")
式を使用してソース列のperson
フィールドのみを指定した場合、DTSは、名前、年齢、性別などのpersonフィールドのサブフィールドの増分データをターゲット列に書き込むことができません。
列名 | カテゴリ | 値 |
id | STRING | bson_value("_id") |
person_name | STRING | bson_value("person","name") |
person_age | BIGINT | bson_value("person" 、"age") |