このトピックでは、Data Transmission Service (DTS) を使用して、ApsaraDB RDS for SQL Server インスタンスから DataHub プロジェクトにデータを同期する方法について説明します。
前提条件
ソースの ApsaraDB RDS for SQL Server インスタンスが作成されていること。詳細については、「ApsaraDB RDS for SQL Server インスタンスを作成する」をご参照ください。
重要ソースの ApsaraDB RDS for SQL Server インスタンスでサポートされている SQL Server のバージョンについては、「データ同期シナリオの概要」をご参照ください。
DataHub がアクティブ化され、同期されるデータを受信するためのプロジェクトが作成されていること。詳細については、「DataHub を使い始める」および「プロジェクトを管理する」をご参照ください。
ソースの ApsaraDB RDS for SQL Server インスタンスが次のいずれかの条件に該当する場合は、同期タスクを複数のサブタスクに分割することをお勧めします。
ソースインスタンスに 10 個を超えるデータベースが含まれている。
ソースインスタンスの単一データベースが 1 時間未満の間隔でログをバックアップする。
ソースインスタンスの単一データベースが 1 時間ごとに 100 個を超える DDL 文を実行する。
ソースインスタンスの単一データベースのログ書き込み速度が 20 MB/s である。
ソースの ApsaraDB RDS for SQL Server インスタンスの 1,000 個を超えるテーブルで変更データキャプチャ (CDC) 機能を有効にする必要がある。
使用上の注意
DTS は、ソースデータベースからターゲットデータベースに外部キーを同期しません。そのため、ソースデータベースのカスケード操作と削除操作は、ターゲットデータベースに同期されません。
制限タイプ | 説明 |
ソースデータベースの制限 |
|
その他の制限 |
|
特別な場合 | ソースインスタンスが RDS for SQL Server インスタンスの場合、DTS は RDS for SQL Server インスタンスに |
課金
| 同期タイプ | タスク構成料金 |
| スキーマ同期と完全データ同期 | 無料。 |
| 増分同期 | 有料。詳細については、「課金概要」をご参照ください。 |
サポートされている同期トポロジ
一方向 1 対 1 同期
一方向 1 対多同期
一方向多対 1 同期
DTS でサポートされている同期トポロジの詳細については、「同期トポロジ」をご参照ください。
同期可能な SQL 操作
操作タイプ | SQL 文 |
DML | INSERT、UPDATE、および DELETE 説明 UPDATE 操作でラージフィールドのみが更新される場合、DTS はその操作を同期しません。 |
データベースアカウントに必要な権限
データベースタイプ | 必要な権限 | 参照 |
ApsaraDB RDS for SQL Server インスタンス | 同期対象のオブジェクトに対する所有者権限。 |
手順
次のいずれかの方法を使用して [データ同期] ページに移動し、データ同期インスタンスが存在するリージョンを選択します。
DTS コンソール
DTS コンソール にログインします。
左側のナビゲーションウィンドウで、データ同期 をクリックします。
ページの左上隅で、データ同期インスタンスが存在するリージョンを選択します。
DMS コンソール
説明実際の操作は、DMS コンソールのモードとレイアウトによって異なる場合があります。詳細については、「シンプルモード」および「DMS コンソールのレイアウトとスタイルをカスタマイズする」をご参照ください。
DMS コンソール にログインします。
上部のナビゲーションバーで、[データ + AI] にポインターを移動し、 を選択します。
データ同期タスク の右側にあるドロップダウンリストから、データ同期インスタンスが存在するリージョンを選択します。
タスクの作成 をクリックして、タスク構成ページに移動します。
ソースデータベースとターゲットデータベースを構成します。次の表にパラメーターを示します。
セクション
パラメーター
説明
該当なし
タスク名
DTS タスクの名前。DTS はタスク名を自動的に生成します。タスクを簡単に識別できるわかりやすい名前を指定することをお勧めします。一意のタスク名を指定する必要はありません。
移行元データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの以下のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続を管理する」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、以下のデータベース情報を構成する必要があります。
データベースタイプ
ソースのタイプ。SQL Server を選択します。
アクセス方法
ソースデータベースのアクセス方法。Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ソースの ApsaraDB RDS for SQL Server インスタンスが存在するリージョン。
Alibaba Cloud アカウント間でデータを複製
Alibaba Cloud アカウント間でデータを同期するかどうかを指定します。この例では、× が選択されています。
RDS インスタンス ID
ソースの ApsaraDB RDS for SQL Server インスタンスの ID。
データベースアカウント
ソースの ApsaraDB RDS for SQL Server インスタンスのデータベースアカウント。アカウントに必要な権限については、このトピックの「データベースアカウントに必要な権限」セクションをご参照ください。
データベースのパスワード
データベースへのアクセスに使用するパスワード。
暗号化
ソースデータベースへの接続を暗号化するかどうかを指定します。ビジネス要件に基づいて、非暗号化 または SSL 暗号化 を選択します。
ソースデータベースで SSL 暗号化が有効になっていない場合は、非暗号化 を選択します。
ソースデータベースで SSL 暗号化が有効になっている場合は、SSL 暗号化 を選択します。デフォルトでは、DTS はサーバー証明書を信頼します。
移行先データベース
既存の接続情報の選択
DTS に登録されているデータベースインスタンスを使用する場合は、ドロップダウンリストからインスタンスを選択します。DTS は、インスタンスの以下のデータベースパラメーターを自動的に入力します。詳細については、「データベース接続を管理する」をご参照ください。
説明DMS コンソールでは、[DMS データベースインスタンスを選択] ドロップダウンリストからデータベースインスタンスを選択できます。
インスタンスを DTS に登録できなかった場合、または DTS に登録されているインスタンスを使用する必要がない場合は、以下のデータベース情報を構成する必要があります。
データベースタイプ
ターゲットデータベースのタイプ。DataHub を選択します。
アクセス方法
ターゲットデータベースのアクセス方法。Alibaba Cloud インスタンス を選択します。
インスタンスのリージョン
ターゲット DataHub プロジェクトが存在するリージョン。
プロジェクト
ターゲット DataHub プロジェクト の名前。
ページの下部にある 接続をテストして続行 をクリックします。
説明DTS サーバーの CIDR ブロックをソースデータベースとターゲットデータベースのセキュリティ設定に自動または手動で追加して、DTS サーバーからのアクセスを許可できることを確認してください。詳細については、「DTS サーバーの CIDR ブロックを追加する」をご参照ください。
ソースデータベースまたはターゲットデータベースが自己管理データベースであり、その アクセス方法 が Alibaba Cloud インスタンス に設定されていない場合は、DTS サーバーの CIDR ブロック ダイアログボックスの 接続テスト をクリックします。
同期するオブジェクトを構成します。
オブジェクト設定 ステップで、同期するオブジェクトを構成します。
パラメーター
説明
同期タイプ
デフォルトでは、[増分同期] が選択されています。[スキーマ同期] も選択する必要があります。
競合するテーブルの処理モード
エラーの事前チェックと報告: ターゲットデータベースにソースデータベースのテーブルと同じ名前のテーブルが含まれているかどうかを確認します。ソースデータベースとターゲットデータベースに同じテーブル名のテーブルが含まれていない場合、事前チェックは合格です。それ以外の場合、事前チェック中にエラーが返され、データ同期タスクを開始できません。
説明ソースデータベースとターゲットデータベースに同じ名前のテーブルが含まれており、ターゲットデータベースのテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに同期されるテーブルの名前を変更できます。詳細については、「オブジェクト名をマッピングする」をご参照ください。
エラーを無視して続行: ソースデータベースとターゲットデータベースで同じテーブル名の事前チェックをスキップします。
警告エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
ソースデータベースとターゲットデータベースのスキーマが同じで、ターゲットデータベースのデータレコードのプライマリキー値または一意キー値がソースデータベースのデータレコードと同じである場合:
完全同期中、DTS はデータレコードをターゲットデータベースに同期しません。ターゲットデータベースの既存のデータレコードは保持されます。
増分同期中、DTS はデータレコードをターゲットデータベースに同期します。ターゲットデータベースの既存のデータレコードは上書きされます。
ソースデータベースとターゲットデータベースのスキーマが異なる場合、データの初期化に失敗する可能性があります。この場合、一部の列のみが同期されるか、データ同期タスクが失敗します。注意して進めてください。
[追加の列ルール]
DTS が DataHub プロジェクトにデータを同期する場合、DTS はターゲットトピックに追加の列を追加します。追加の列の名前がターゲットトピックの既存の列の名前と同じである場合、データ同期タスクは失敗します。ビジネス要件に基づいて、[追加の列の命名規則] パラメーターを [新ルール] または [以前のルール] に設定できます。
警告このパラメーターを設定する前に、ターゲットトピックの追加列と既存の列に名前の競合がないか確認してください。そうしないと、データ同期タスクが失敗したり、データが失われたりする可能性があります。詳細については、「追加列の命名規則を変更する」トピックの「追加列の命名規則」セクションをご参照ください。
宛先インスタンスでのオブジェクト名の大文字化
ターゲットインスタンスのデータベース名、テーブル名、および列名の大文字と小文字の区別。デフォルトでは、[DTS デフォルトポリシー] が選択されています。オブジェクト名の大文字と小文字の区別がソースデータベースまたはターゲットデータベースと一致するように、他のオプションを選択できます。詳細については、「ターゲットインスタンスのオブジェクト名の大文字と小文字の区別を指定する」をご参照ください。
ソースオブジェクト
ソースオブジェクト セクションから 1 つ以上のオブジェクトを選択し、
アイコンをクリックして、選択中のオブジェクト セクションにオブジェクトを追加します。説明列、テーブル、またはデータベースを同期対象のオブジェクトとして選択できます。テーブルまたは列を同期対象のオブジェクトとして選択した場合、DTS はビュー、トリガー、ストアドプロシージャなどの他のオブジェクトをターゲットデータベースに同期しません。
[選択済みオブジェクト]
宛先インスタンスに同期するオブジェクトの名前を変更するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。 詳細については、「単一オブジェクトの名前をマッピングする」セクションのオブジェクト名マッピング Topic をご参照ください。
複数のオブジェクトの名前を一度に変更するには、選択中のオブジェクト セクションの右上隅にある 一括編集 をクリックします。 詳細については、「複数のオブジェクト名を一度にマッピングする」セクションのオブジェクト名マッピング Topic をご参照ください。
説明特定のデータベースまたはテーブルで実行される SQL 操作を選択するには、[選択済みオブジェクト] セクションでオブジェクトを右クリックします。表示されるダイアログボックスで、同期する SQL 操作を選択します。
WHERE 条件を指定してデータをフィルタリングするには、[選択済みオブジェクト] セクションでオブジェクトを右クリックします。表示されるダイアログボックスで、条件を指定します。詳細については、「フィルター条件を設定する」をご参照ください。
オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、そのオブジェクトに依存する他のオブジェクトの同期が失敗する可能性があります。
次へ:詳細設定 をクリックして詳細設定を行います。
パラメーター
説明
タスクのスケジュールに使用する専用クラスターの選択
デフォルトでは、専用のクラスターを指定しない場合、DTS は共有クラスターにタスクをスケジュールします。 データ同期タスクの安定性を向上させるには、専用のクラスターを購入します。 詳細については、「DTS 専用クラスターとは」をご参照ください。
失敗した接続の再試行時間
接続失敗時の再試行時間の範囲です。 データ同期タスクの開始後にソースデータベースまたはターゲットデータベースへの接続に失敗した場合、DTS は指定された時間範囲内で直ちに再接続を試みます。 有効値: 10 ~ 1440。 単位: 分。 デフォルト値: 720。 このパラメーターは 30 より大きい値に設定することをお勧めします。 指定された時間範囲内で DTS がソースデータベースとターゲットデータベースに再接続すると、DTS はデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。
説明同じソースデータベースまたはターゲットデータベースを持つ複数のデータ同期タスクに異なる再試行時間の範囲を指定した場合、最も短い再試行時間の範囲が優先されます。
DTS が再接続を試行すると、DTS インスタンスの料金が発生します。 ビジネス要件に基づいて再試行時間の範囲を指定することをお勧めします。 また、ソースインスタンスと宛先インスタンスが解放された後、できるだけ早く DTS インスタンスを解放することもできます。
移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。
その他の問題の再試行時間の範囲。 たとえば、データ同期タスクの開始後に DDL または DML 操作の実行に失敗した場合、DTS は指定された時間範囲内で直ちに操作を再試行します。 有効値: 1 ~ 1440。 単位: 分。 デフォルト値: 10。 このパラメーターは 10 より大きい値に設定することをお勧めします。 指定された時間範囲内で失敗した操作が正常に実行されると、DTS はデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。
重要移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくなければなりません。
増分同期率を制限するかどうか
増分データ同期の速度制限を有効にするかどうかを指定します。 ビジネス要件に基づいて、増分データ同期の速度制限を有効にすることができます。 速度制限を設定するには、1 秒あたりの増分同期の行数 RPS パラメーターと 1 秒あたりの増分同期データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、ターゲットデータベースサーバーの負荷が軽減されます。
環境タグ
DTS インスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。 この例では、このパラメーターを設定する必要はありません。
ETL の設定
抽出、変換、書き出し (ETL) 機能を有効にするかどうかを指定します。 詳細については、「ETL とは」をご参照ください。有効値:
[はい]: ETL 機能を設定します。 コードエディターにデータ処理文を入力できます。 詳細については、「データ移行タスクまたはデータ同期タスクで ETL を設定する」をご参照ください。
[いいえ]: ETL 機能を設定しません。
監視アラート
データ同期タスクのアラートを設定するかどうかを指定します。 タスクが失敗した場合、または同期遅延が指定されたしきい値を超えた場合、アラート連絡先に通知が送信されます。有効値:
[いいえ]: アラートを有効にしません。
[はい]: アラートを設定します。 この場合、アラートのしきい値と アラート通知設定 も設定する必要があります。 詳細については、「監視とアラートの設定」トピックの「DTS タスクの作成時に監視とアラートを設定する」セクションをご参照ください。
タスク設定を保存し、事前チェックを実行します。
DTS タスクを設定するために関連 API 操作を呼び出すときに指定するパラメーターを表示するには、次:タスク設定の保存と事前チェック にポインターを移動し、OpenAPI パラメーターのプレビュー をクリックします。
パラメーターを表示する必要がない場合、またはすでに表示済みの場合は、ページの下部にある 次:タスク設定の保存と事前チェック をクリックします。
説明データ同期タスクを開始する前に、DTS は事前チェックを実行します。タスクが事前チェックに合格した後にのみ、データ同期タスクを開始できます。
データ同期タスクが事前チェックに失敗した場合は、失敗した各項目の横にある [詳細の表示] をクリックします。チェック結果に基づいて原因を分析した後、問題をトラブルシューティングします。次に、事前チェックを再実行します。
事前チェック中に項目に対してアラートがトリガーされた場合:
アラート項目を無視できない場合は、失敗した項目の横にある [詳細の表示] をクリックして、問題をトラブルシューティングします。次に、事前チェックを再度実行します。
アラート項目を無視できる場合は、[アラートの詳細の確認] をクリックします。[詳細の表示] ダイアログボックスで、[無視] をクリックします。表示されるメッセージで、[OK] をクリックします。次に、[再チェック] をクリックして、事前チェックを再度実行します。アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。
インスタンスを購入します。
[成功率] が [100%] になるまで待ちます。その後、[次へ: インスタンスの購入] をクリックします。
[購入] ページで、データ同期インスタンスの請求方法とインスタンスクラスのパラメーターを設定します。次の表にパラメーターを示します。
セクション
パラメーター
説明
新しいインスタンスクラス
課金方法
サブスクリプション: データ同期インスタンスを作成する際にサブスクリプション料金を支払います。 サブスクリプション課金方法は、長期利用の場合、従量課金方法よりも費用対効果が高くなります。
従量課金: 従量課金インスタンスは時間単位で課金されます。 従量課金方法は、短期利用に適しています。 従量課金データ同期インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。
リソースグループ設定
データ同期インスタンスが属するリソースグループ。 デフォルト値: [デフォルトリソースグループ]。 詳細については、「リソース管理とは」をご参照ください。
インスタンスクラス
DTS は、同期速度が異なるインスタンスクラスを提供します。 ビジネス要件に基づいてインスタンスクラスを選択できます。 詳細については、「データ同期インスタンスのインスタンスクラス」をご参照ください。
サブスクリプション期間
サブスクリプション課金方法を選択した場合は、サブスクリプション期間と作成するデータ同期インスタンスの数をご指定ください。 サブスクリプション期間は、1~9か月、1年、2年、3年、または 5 年です。
説明このパラメーターは、サブスクリプション 課金方法を選択した場合にのみ使用できます。
[従量課金制 Data Transmission Service サービス規約] を読んで選択します。
[購入して開始] をクリックします。表示されるダイアログボックスで、OK をクリックします。
タスクリストでタスクの進捗状況を確認できます。