すべてのプロダクト
Search
ドキュメントセンター

Data Transmission Service:PolarDB-X 1.0インスタンスからApsaraMQ for Kafkaインスタンスへのデータの移行

最終更新日:Oct 31, 2024

このトピックでは、data Transmission Service (DTS) を使用して、PolarDB-X 1.0インスタンスからApsaraMQ for Kafkaインスタンスにデータを移行する方法について説明します。

前提条件

  • ソースPolarDB-X 1.0インスタンスが作成されました。 詳細については、次をご参照ください: PolarDB-X 1.0インスタンスの作成

  • 移行先のApsaraMQ for Kafkaインスタンスで、移行されたデータを受け取るトピックが作成されます。 詳細については、「概要」をご参照ください。

  • ターゲットApsaraMQ for Kafkaインスタンスの使用可能なストレージ容量が、ソースPolarDB-X 1.0インスタンスのデータの合計サイズよりも大きいこと。

制限事項

カテゴリ

説明

ソースデータベースの制限

  • 移行するテーブルには、PRIMARY KEYまたはUNIQUE制約が必要であり、すべてのフィールドが一意である必要があります。 そうでない場合、宛先データベースは重複するデータレコードを含み得る。

  • 移行するオブジェクトとしてテーブルを選択し、テーブルまたは列の名前の変更など、移行先データベースのテーブルを変更する必要がある場合は、1つのデータ移行タスクで最大1,000のテーブルを移行できます。 タスクを実行して1,000を超えるテーブルを移行すると、リクエストエラーが発生します。 この場合、複数のタスクを構成してテーブルをバッチで移行するか、タスクを構成してデータベース全体を移行することをお勧めします。

  • 増分データを移行する必要がある場合は、次の要件が満たされていることを確認してください。

    • バイナリログ機能が有効になっています。 binlog_row_imageパラメーターの値がfullに設定されています。 それ以外の場合、事前チェック中にエラーメッセージが返され、データ移行タスクを開始できません。

    • 増分データ移行のみを実行する場合、ソースデータベースのバイナリログを24時間以上保存する必要があります。 完全データ移行と増分データ移行を実行する場合、ソースデータベースのバイナリログを少なくとも7日間保存する必要があります。 そうしないと、Data Transmission Service (DTS) がバイナリログの取得に失敗し、タスクが失敗する可能性があります。 例外的な状況では、データの不整合または損失が発生します。 完全なデータ移行が完了したら、保持期間を24時間以上に設定できます。 上記の要件に基づいて、バイナリログの保持期間を設定してください。 それ以外の場合、DTSのサービスレベル契約 (SLA) はサービスの信頼性またはパフォーマンスを保証しません。

  • 読み取り専用のPolarDB-X 1.0インスタンスからデータを移行することはできません。

  • ソースデータベースで実行する操作の制限:

    • データ移行中は、ソースインスタンスをアップグレードまたはダウングレードしたり、頻繁に更新されるテーブルを移行したり、シャードキーを変更したり、ソースオブジェクトに対してDDL操作を実行したりしないでください。 それ以外の場合、データ移行タスクは失敗します。

    • 完全データ移行および増分データ移行中、DTSはセッションレベルで外部キーに対する制約チェックおよびカスケード操作を一時的に無効にします。 データ移行中にソースデータベースに対してカスケード更新および削除操作を実行すると、データの不整合が発生する可能性があります。

    • データ移行中にPolarDB-X 1.0インスタンスのネットワークタイプを変更する場合は、データ移行タスクのネットワーク接続情報も変更する必要があります。

    • フルデータ移行のみを実行する場合は、データ移行中にソースデータベースにデータを書き込まないでください。 そうしないと、ソースデータベースとターゲットデータベースの間でデータの不一致が発生する可能性があります。 データの一貫性を確保するために、移行タイプとしてスキーマ移行、フルデータ移行、および増分データ移行を選択することを推奨します。

その他の制限

  • データを移行する前に、移行元データベースと移行先データベースのパフォーマンスに対するデータ移行の影響を評価します。 オフピーク時にデータを移行することを推奨します。 完全データ移行中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。

  • 完全データ移行中、同時INSERT操作により、ターゲットデータベースのテーブルが断片化されます。 完全データ移行が完了すると、移行先データベースの使用表領域のサイズが移行元データベースのサイズよりも大きくなります。

  • DTSは、過去7日以内に失敗したデータ移行タスクを再開しようとします。 ワークロードをターゲットデータベースに切り替える前に、失敗したタスクを停止またはリリースする必要があります。 REVOKEステートメントを実行して、DTSがターゲットデータベースにアクセスするために使用するアカウントの書き込み権限を取り消すこともできます。 それ以外の場合、失敗したタスクが再開された後、ソースデータベースのデータがターゲットデータベースのデータを上書きします。

注意事項

  • DTSは、ソースデータベースの 'dts_health_check '.'ha_health_check' テーブルを定期的に更新して、バイナリログファイルの位置を進めます。

  • データ移行中にターゲットApsaraMQ for Kafkaインスタンスがアップグレードまたはダウングレードされた場合、インスタンスを再起動する必要があります。

課金

移行タイプ

インスタンス設定料金

インターネットトラフィック料金

スキーマ移行とフルデータ移行

無料です。

無料です。

増分データ移行

有料。 詳細については、「Billing overview」をご参照ください。

移行タイプ

  • スキーマ移行

    DTSは、選択したオブジェクトのスキーマをソースデータベースからターゲットデータベースに移行します。

  • 完全なデータ移行

    DTSは、必要なオブジェクトの履歴データをソースデータベースからターゲットデータベースに移行します。

  • 増分データ移行

    完全データ移行が完了すると、DTSは増分データをソースデータベースからターゲットデータベースに移行します。 増分データ移行により、データ移行中に自己管理型アプリケーションのサービスを中断することなく、データをスムーズに移行できます。

増分移行可能なSQL操作

操作タイプ

SQL文

DML

挿入、更新、および削除

データベースアカウントに必要な権限

データベース

スキーマ移行

完全なデータ移行

増分データ移行

PolarDB-X 1.0インスタンス

SELECT権限。

SELECT権限。

移行するオブジェクトに対するREPLICATION SLAVEおよびREPLICATION CLIENT権限、およびSELECT権限。

説明

データベースアカウントにアクセス許可を付与する方法の詳細については、「PolarDB-Xのデータ同期ツール」トピックの「アカウントのデータ同期に必要なアクセス許可」をご参照ください。

ApsaraMQ for Kafkaインスタンス

読み取りおよび書き込み権限。

データ型マッピング

詳細については、「スキーマ同期のためのデータ型マッピング」をご参照ください。

手順

  1. [データ移行タスク] ページに移動します。

    1. データ管理 (DMS) コンソールにログインします。

    2. 上部のナビゲーションバーで、ポインタをDTS上に移動します。

    3. DTS (DTS) > データ移行を選択します。

    説明
  2. データ移行タスクの右側にあるドロップダウンリストから、データ移行インスタンスが存在するリージョンを選択します。

    説明

    新しいDTSコンソールを使用する場合は、左上隅にデータ移行インスタンスが存在するリージョンを選択する必要があります。

  3. [タスクの作成] をクリックします。 表示されるページで、ソースデータベースとターゲットデータベースを設定します。

    警告

    ソースインスタンスとターゲットインスタンスを選択した後、ページの上部に表示される [制限] セクションの手順を読むことを推奨します。 これは、データ移行タスクの作成と実行に役立ちます。

    カテゴリ

    パラメーター

    説明

    非該当

    タスク名

    タスクの名前。 タスク名は自動生成されます。 タスクを識別するために、有益な名前を指定することを推奨します。 一意のタスク名を指定する必要はありません。

    ソースデータベース

    既存のDMSデータベースインスタンスの選択

    使用するインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。

    • 既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。

    • 既存のインスタンスを選択しない場合は、ソースデータベースのパラメーターを設定する必要があります。

    データベースタイプ

    移行元ディスクのタイプを設定します。 [PolarDB-X 1.0] を選択します。

    アクセス方法

    ソースデータベースのアクセス方法。 [Alibaba Cloudインスタンス] を選択します。

    インスタンスリージョン

    ソースPolarDB-X 1.0インスタンスが存在するリージョン。

    Alibaba Cloudアカウント全体でのデータの複製

    Alibaba Cloudアカウント間でデータを移行するかどうかを指定します。 この例では、[いいえ] が選択されています。

    インスタンスID

    ソースPolarDB-X 1.0インスタンスのID。

    データベースアカウント

    ソースPolarDB-Xデータベースインスタンスの1.0アカウント。 ターゲットApsaraMQ for Kafkaインスタンスにデータが保存されている形式に基づいて、アカウントに権限を付与します。

    データベースパスワード

    データベースアカウントのパスワードを設定します。

    宛先データベース

    既存のDMSデータベースインスタンスの選択

    使用するインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。

    • 既存のインスタンスを選択した場合、DTSはインスタンスのパラメーターを自動的に入力します。

    • 既存のインスタンスを選択しない場合、ターゲットデータベースのパラメーターを設定する必要があります。

    データベースタイプ

    ターゲットデータベースのタイプ。 Kafkaを選択します。

    アクセス方法

    ターゲットデータベースのアクセス方法。 Express Connect、VPN Gateway、またはSmart Access Gatewayを選択します。

    インスタンスリージョン

    ターゲットApsaraMQ for Kafkaインスタンスが存在するリージョン。

    接続済みVPC

    ターゲットApsaraMQ for Kafkaインスタンスが属する仮想プライベートクラウド (VPC) のID。 ApsaraMQ for Kafkaコンソールにログインし、ApsaraMQ for Kafkaインスタンスの [インスタンスの詳細] ページに移動します。 [インスタンス情報] タブの [設定情報] セクションで、VPC IDを表示します。

    ドメイン名または IP アドレス

    宛先ApsaraMQ for KafkaインスタンスのIPアドレス。

    説明

    ApsaraMQ for KafkaインスタンスのIPアドレスを取得するには、次の操作を実行します。ApsaraMQ for Kafkaコンソールにログインし、ApsaraMQ for Kafkaインスタンスの [インスタンスの詳細] ページに移動します。 [インスタンス情報] タブの [エンドポイント情報] セクションで、Default EndpointパラメーターからIPアドレスを取得します。

    ポート番号

    宛先ApsaraMQ for Kafkaインスタンスのサービスポート番号。 デフォルト値: 9092

    データベースアカウント

    ターゲットApsaraMQ for Kafkaインスタンスのデータベースアカウント。

    説明

    データベースアカウントとデータベースパスワードは、アクセス制御リスト (ACL) 機能が有効になっているApsaraMQ for Kafkaインスタンスにのみ必要です。 ACL機能を有効にする方法の詳細については、「SASLユーザーへの権限の付与」をご参照ください。

    データベースのパスワード

    Kafka のバージョン

    ターゲットApsaraMQ for Kafkaインスタンスのバージョン。

    暗号化

    接続先インスタンスへの接続を暗号化するかどうかを指定します。 ビジネスとセキュリティの要件に基づいて、[非暗号化] または [SCRAM-SHA 256] を選択します。

    トピック

    移行されたデータの受信に使用されるトピック。 ドロップダウンリストからトピックを選択します。

    DDL 情報を格納するトピック

    DDL情報を格納するために使用されるトピック。 ドロップダウンリストからトピックを選択します。 このパラメーターを指定しない場合、DDL情報はtopicパラメーターで指定されたトピックに格納されます。

    Kafka スキーマレジストリの使用の使用

    Kafka Schema Registryを使用するかどうかを指定します。 Kafka Schema Registryは、メタデータの提供レイヤーを提供します。 Avroスキーマを保存および取得するためのRESTful APIを提供します。 有効な値:

    • いいえ: Kafka Schema Registryを使用しません。

    • はい: Kafka Schema Registryを使用します。 この場合、AvroスキーマのKafka Schema Registryに登録されているURLまたはIPアドレスを入力する必要があります。

  4. ページの下部で、[接続のテストと続行] をクリックします。

    、ソースまたはターゲットデータベースがAlibaba Cloudデータベースインスタンス (ApsaraDB RDS for MySQLApsaraDB for MongoDBインスタンスなど) の場合、DTSは自動的にDTSサーバーのCIDRブロックをインスタンスのIPアドレスホワイトリストに追加します。 ソースデータベースまたはターゲットデータベースがElastic Compute Service (ECS) インスタンスでホストされている自己管理データベースの場合、DTSサーバーのCIDRブロックがECSインスタンスのセキュリティグループルールに自動的に追加されます。ECSインスタンスがデータベースにアクセスできることを確認する必要があります。 自己管理データベースが複数のECSインスタンスでホストされている場合、DTSサーバーのCIDRブロックを各ECSインスタンスのセキュリティグループルールに手動で追加する必要があります。 ソースデータベースまたはターゲットデータベースが、データセンターにデプロイされているか、サードパーティのクラウドサービスプロバイダーによって提供される自己管理データベースである場合、DTSサーバーのCIDRブロックをデータベースのIPアドレスホワイトリストに手動で追加して、DTSがデータベースにアクセスできるようにする必要があります。 詳細については、「DTSサーバーのCIDRブロックの追加」トピックの「DTSサーバーのCIDRブロック」セクションをご参照ください。

    警告

    DTSサーバーのパブリックCIDRブロックがデータベースインスタンスのホワイトリストまたはECSインスタンスのセキュリティグループルールに自動的または手動で追加されると、セキュリティリスクが発生する可能性があります。 したがって、DTSを使用してデータを移行する前に、潜在的なリスクを理解して認識し、ユーザー名とパスワードのセキュリティの強化、公開されるポートの制限、API呼び出しの認証、ホワイトリストまたはセキュリティグループルールの定期的なチェック、CIDRブロックの禁止、またはExpress Connectを使用したデータベースインスタンスのDTSへの接続、VPNゲートウェイ、またはSmart Access Gateway。

  5. タスクに移行するオブジェクトを選択し、詳細設定を構成します。

    パラメーター

    説明

    移行タイプ

    ビジネス要件に基づいて移行タイプを選択します。 移行タイプはデータベースエンジンでサポートされている必要があります。

    • フルデータ移行のみを実行するには、[スキーマ移行][フルデータ移行] を選択します。

    • データ移行中のサービスの継続性を確保するには、[スキーマ移行][フルデータ移行] 、および [増分データ移行] を選択します。

    説明

    増分データ移行を選択しない場合、データ移行中にソースデータベースにデータを書き込まないことを推奨します。 これにより、ソースデータベースとターゲットデータベース間のデータの整合性が確保されます。

    競合テーブルの処理モード

    • エラーの事前チェックと報告: ターゲットデータベースに、ソースデータベースのテーブルと同じ名前を使用するテーブルが含まれているかどうかを確認します。 ソースデータベースとターゲットデータベースに同じテーブル名のテーブルが含まれていない場合は、事前チェックに合格します。 それ以外の場合、事前チェック中にエラーが返され、データ移行タスクを開始できません。

      説明

      ソースデータベースとターゲットデータベースに同じ名前のテーブルが含まれていて、ターゲットデータベース内のテーブルを削除または名前変更できない場合は、オブジェクト名マッピング機能を使用して、ターゲットデータベースに移行されるテーブルの名前を変更できます。 詳細については、「マップオブジェクト名」をご参照ください。

    • エラーを無視して続行: ソースデータベースとターゲットデータベースの同じテーブル名の事前チェックをスキップします。

      警告

      エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが次の潜在的なリスクにさらされる可能性があります。

      • ソースデータベースとターゲットデータベースが同じスキーマを持ち、データレコードがターゲットデータベースの既存のデータレコードと同じプライマリキーを持つ場合、次のシナリオが発生する可能性があります。

        • 完全データ移行中、DTSはデータレコードを移行先データベースに移行しません。 ターゲットデータベースの既存のデータレコードが保持されます。

        • 増分データ移行中に、DTSはデータレコードを移行先データベースに移行します。 ターゲットデータベースの既存のデータレコードが上書きされます。

      • ソースデータベースとターゲットデータベースのスキーマが異なる場合、特定の列のみが移行されるか、データ移行タスクが失敗します。 作業は慎重に行ってください。

    Kafka のデータ形式

    ApsaraMQ for Kafkaインスタンスにデータが格納される形式。

    • DTS Avroを選択した場合、データはDTS Avroのスキーマ定義に基づいて解析されます。 詳細については、『GitHub』をご参照ください。

    • Canal Jsonを選択した場合、データはCanal JSON形式で保存されます。 関連するパラメーターと例の詳細については、「Kafkaクラスターのデータ形式」トピックの「Canal Json」セクションをご参照ください。

    説明

    PolarDB-X 1.0はCanal Jsonをサポートしていません。 デフォルトでは、DTS Avroが選択されています。

    Kafka パーティションへのデータ転送ポリシー

    この機能はサポートされていません。

    宛先インスタンスでのオブジェクト名の大文字化

    ターゲットインスタンスのデータベース名、テーブル名、および列名の大文字化。 デフォルトでは、DTSデフォルトポリシーが選択されています。 他のオプションを選択して、オブジェクト名の大文字化がソースまたはターゲットデータベースの大文字化と一致していることを確認できます。 詳細については、「ターゲットインスタンスのオブジェクト名の大文字化の指定」をご参照ください。

    ソースオブジェクト

    ソースオブジェクト セクションから1つ以上のオブジェクトを選択します。 向右小箭头アイコンをクリックして、選択中のオブジェクト セクションにオブジェクトを追加します。

    説明
    • 移行するオブジェクトとして、列、テーブル、またはデータベースを選択できます。 移行するオブジェクトとしてテーブルを選択した場合、DTSは、ビュー、トリガー、ストアドプロシージャなどの他のオブジェクトを移行先データベースに移行しません。

    • 移行するオブジェクトとしてデータベースを選択した場合、DTSは次のデフォルトルールに基づいてデータを移行します。

      • 移行元データベースで移行するテーブルに、単一列の主キーや複合主キーなどの主キーがある場合、主キー列が配布キーとして指定されます。

      • 移行元データベース内の移行するテーブルにプライマリキーがない場合、移行先テーブルに自動インクリメントのプライマリキー列が自動的に生成されます。 これにより、ソースデータベースとターゲットデータベース間でデータの不一致が発生する可能性があります。

    [選択済みオブジェクト]

    • 移行先インスタンスに移行するオブジェクトの名前を変更するには、[選択済みオブジェクト] セクションでオブジェクトを右クリックします。 詳細については、「オブジェクト名のマップ」トピックの「単一オブジェクト名のマップ」セクションをご参照ください。

    • 一度に複数のオブジェクトの名前を変更するには、[選択済みオブジェクト] セクションの右上隅にある [一括編集] をクリックします。 詳細については、「オブジェクト名のマップ」トピックの「複数のオブジェクト名を一度にマップする」セクションをご参照ください。

    説明
    • オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、そのオブジェクトに依存する他のオブジェクトの移行に失敗する可能性があります。

    • データをフィルタリングするWHERE条件を指定するには、[選択済みオブジェクト] セクションでオブジェクトを右クリックします。 表示されるダイアログボックスで、条件を指定します。 詳細については、「フィルター条件の指定」をご参照ください。

    • 特定のデータベースまたはテーブルで実行されたSQL操作を選択するには、[選択済みオブジェクト] セクションでオブジェクトを右クリックします。 表示されるダイアログボックスで、移行するSQL操作を選択します。 詳細については、このトピックの「SQL操作を段階的に移行できる」をご参照ください。

  6. [次へ: 詳細設定] をクリックして詳細設定を構成します。

    パラメーター

    説明

    タスクのスケジュールに使用する専用クラスターの選択

    この例では、タスクのスケジュールに使用するDTS専用クラスターを選択する必要はありません。 詳細については、「DTS専用クラスターとは 」をご参照ください。

    Set Alerts

    データ移行タスクのアラートを設定するかどうかを指定します。 タスクが失敗するか、移行の待ち時間が指定されたしきい値を超えると、アラート送信先は通知を受け取ります。 有効な値:

    失敗した接続の再試行時間

    失敗した接続のリトライ時間範囲。 データ移行タスクの開始後にソースデータベースまたはターゲットデータベースの接続に失敗した場合、DTSは再試行時間範囲内ですぐに接続を再試行します。 有効な値: 10 ~ 1440 単位は分です。 デフォルト値: 720 パラメーターを30より大きい値に設定することを推奨します。 指定した再試行時間内にDTSがソースデータベースとターゲットデータベースに再接続された場合、DTSはデータ移行タスクを再開します。 それ以外の場合、データ移行タスクは失敗します。

    説明
    • 同じソースまたはターゲットデータベースを共有する複数のデータ移行タスクに対して異なるリトライ時間範囲を指定した場合、後で指定される値が優先されます。

    • DTSが接続を再試行すると、DTSインスタンスに対して課金されます。 業務要件に基づいて再試行時間範囲を指定することを推奨します。 ソースデータベースとターゲットインスタンスがリリースされた後、できるだけ早くDTSインスタンスをリリースすることもできます。

    ソースデータベースとターゲットデータベースで他の問題が発生した場合の再試行前の待機時間

    その他の問題の再試行時間範囲。 たとえば、データ移行タスクの開始後にDDLまたはDML操作の実行に失敗した場合、DTSは再試行時間範囲内ですぐに操作を再試行します。 有効な値: 1 ~ 1440 単位は分です。 デフォルト値は 10 です。 パラメーターを10より大きい値に設定することを推奨します。 指定された再試行時間内に失敗した操作が正常に実行された場合、DTSはデータ移行タスクを再開します。 それ以外の場合、データ移行タスクは失敗します。

    重要

    移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくする必要があります。

    ETLの設定

    抽出、変換、および読み込み (ETL) 機能を有効にするかどうかを指定します。 詳細については、「ETLとは何ですか?」をご参照ください。 有効な値:

  7. ページの下部で、次:タスク設定の保存と事前チェック をクリックします。

    ポインタを 次:タスク設定の保存と事前チェック に移動し、[OpenAPIパラメーターのプレビュー] をクリックして、関連するAPI操作を呼び出してDTSタスクを設定するときに指定するパラメーターを表示できます。

    説明
    • データ移行タスクを開始する前に、DTSは事前チェックを実行します。 データ移行タスクは、タスクが事前チェックに合格した後にのみ開始できます。

    • タスクが事前チェックに合格しなかった場合は、失敗した各項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。

    • 事前チェック中にアイテムに対してアラートがトリガーされた場合:

      • アラートアイテムを無視できない場合は、失敗したアイテムの横にある [詳細の表示] をクリックして問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。

      • アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されたメッセージボックスで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして、事前チェックを再度実行します。 アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。

  8. 成功率100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。

  9. [インスタンスの購入] ページで、データ移行インスタンスのインスタンスクラスパラメーターを設定します。 下表にパラメーターを示します。

    セクション

    パラメーター

    説明

    新しいインスタンスクラス

    リソースグループ

    データ移行インスタンスが属するリソースグループ。 デフォルト値: Default resource group 詳細については、「リソース管理とは 」をご参照ください。

    インスタンスクラス

    DTSは、移行速度が異なるインスタンスクラスを提供します。 ビジネスシナリオに基づいてインスタンスクラスを選択できます。 詳細については、「データ移行インスタンスのインスタンスクラス」をご参照ください。

  10. 読んで同意するデータ伝送サービス (従量課金) サービス規約チェックボックスを選択します。

  11. [購入して開始] をクリックします。 表示されるメッセージで、 [OK] をクリックします。

    [データ移行] ページでタスクの進行状況を確認できます。