すべてのプロダクト
Search
ドキュメントセンター

Data Transmission Service:PolarDB-X 1.0インスタンスからElasticsearchクラスターへのデータの同期

最終更新日:Oct 31, 2024

このトピックでは、data Transmission Service (DTS) を使用して、PolarDB-X 1.0インスタンスからElasticsearchクラスターにデータを同期する方法について説明します。

前提条件

  • ソースPolarDB-X 1.0インスタンスのストレージタイプは、ApsaraDB RDS for MySQLです。これには、カスタムApsaraDB RDSインスタンスと購入したApsaraDB RDSインスタンスが含まれます。 PolarDB for MySQLはストレージタイプとしてサポートされていません。

  • ターゲットElasticsearchクラスターが作成されます。 詳細については、「Elasticsearchクラスターの作成」をご参照ください。

  • ターゲットElasticsearchクラスターの使用可能なストレージ容量が、ソースPolarDB-X 1.0インスタンスのデータの合計サイズよりも大きいこと。

制限

カテゴリ

説明

ソースデータベースの制限

    • 同期するテーブルには、PRIMARY KEYまたはUNIQUE制約が必要であり、すべてのフィールドが一意である必要があります。 そうでない場合、宛先データベースは重複するデータレコードを含み得る。 UNIQUE制約のみがあるテーブルは、スキーマ同期をサポートしません。 したがって、PRIMARY KEY制約があるテーブルを同期することを推奨します。 セカンダリインデックスを持つテーブルは同期できません。

    • 同期するオブジェクトとしてテーブルを選択し、テーブルや列の名前の変更など、ターゲットデータベースのテーブルを変更する必要がある場合は、1つのデータ同期タスクで最大1,000のテーブルを同期できます。 タスクを実行して1,000を超えるテーブルを同期すると、リクエストエラーが発生します。 この場合、複数のタスクを構成してテーブルをバッチで同期するか、タスクを構成してデータベース全体を同期することをお勧めします。

    • PolarDB-X 1.0インスタンスにアタッチされているApsaraDB RDS for MySQLインスタンスは、バイナリログの次の要件を満たす必要があります。

      • デフォルトでは、ApsaraDB RDS for MySQLインスタンスに対してバイナリログ機能が有効になっています。 binlog_row_imageパラメーターがfullに設定されていることを確認します。 詳細については、「ApsaraDB RDS For MySQLインスタンスのパラメーターの表示」をご参照ください。 それ以外の場合、事前チェック中にエラーメッセージが返され、データ同期タスクを開始できません。

      • 増分データ同期のみを実行する場合は、ソースデータベースのバイナリログを少なくとも24時間保持する必要があります。 完全データ同期と増分データ同期の両方を実行する場合、ソースデータベースのバイナリログは少なくとも7日間保持する必要があります。 そうしないと、DTSはバイナリログの取得に失敗し、タスクが失敗したり、データの不整合やデータの損失が発生する可能性があります。 完全なデータ同期が完了したら、保持期間を24時間以上に設定できます。 上記の要件に基づいて、バイナリログの保持期間を設定してください。 それ以外の場合、DTSのサービスレベル契約 (SLA) はサービスの信頼性またはパフォーマンスを保証しません。

    • ソースデータベースで実行する操作の制限:

      • データ同期中にPolarDB-X 1.0インスタンスのネットワークタイプを変更する場合は、データ同期タスクのネットワーク接続情報も変更する必要があります。

      • データ同期中は、ソースインスタンスの容量をスケーリングしたり、頻繁にアクセスされるテーブルを同期したり、シャードを変更したり、DDL操作を実行したりしないでください。 そうしないと、データ同期タスクが失敗するか、データの不一致が発生します。

      • 完全データ同期のみを実行する場合は、データ同期中にソースインスタンスにデータを書き込まないでください。 そうしないと、ソースインスタンスとターゲットインスタンスの間でデータの不一致が発生する可能性があります。 データの一貫性を確保するために、同期タイプとしてスキーマ同期、完全データ同期、および増分データ同期を選択することを推奨します。

その他の制限

  • 同期するテーブルに列を追加するには、次の操作を実行します。Elasticsearchクラスターのテーブルのマッピングを変更し、ソースPolarDB-X 1.0インスタンスでDDL操作を実行してから、データ同期タスクを一時停止して開始します。

  • データを同期する前に、ソースデータベースとターゲットデータベースのパフォーマンスに対するデータ同期の影響を評価します。 オフピーク時にデータを同期することを推奨します。 完全データ同期中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。

  • DTSは、過去7日以内に失敗したデータ同期タスクを再開しようとします。 ワークロードをターゲットインスタンスに切り替える前に、失敗したタスクを停止またはリリースする必要があります。 REVOKEステートメントを実行して、DTSがターゲットインスタンスにアクセスするために使用するアカウントの書き込み権限を取り消すこともできます。 それ以外の場合、失敗したタスクが再開された後、ソースインスタンスのデータがターゲットインスタンスのデータを上書きします。

特別なケース

DTSは、バイナリログファイルの位置を移動するようにスケジュールされたソースデータベースの 'dts_health_check '.'ha_health_check' テーブルを更新します。

課金

同期タイプ

タスク設定料金

スキーマ同期と完全データ同期

無料です。

増分データ同期

有料。 詳細については、「課金の概要」をご参照ください。

増分同期が可能なSQL操作

操作タイプ

SQL文

DML

挿入、更新、および削除

データ型マッピング

詳細については、「スキーマ同期のためのデータ型マッピング」をご参照ください。

データベースアカウントに必要な権限

インスタンスタイプ

必要な権限

関連ドキュメント

ソースPolarDB-X 1.0インスタンス

同期するオブジェクトの読み取り権限。

アカウントの管理

移行先Elasticsearchクラスター

ターゲットクラスターの読み取りおよび書き込み権限。 ほとんどの場合、アカウントは弾力性があります。

手順

  1. [データ同期タスク] ページに移動します。

    1. DMSコンソールにログインします。

    2. 上部のナビゲーションバーで、ポインタをデータ开発上に移動します。

    3. DTS (DTS) > データ同期を選択します。

    説明
  2. データ同期タスクの右側で、データ同期インスタンスが存在するリージョンを選択します。

    説明

    新しいDTSコンソールを使用する場合は、上部のナビゲーションバーでデータ同期タスクを作成するリージョンを選択します。

  3. [タスクの作成] をクリックします。 タスクの作成ウィザードで、ソースデータベースとターゲットデータベースを設定します。

    セクション

    パラメーター

    説明

    非該当

    タスク名

    DTSタスクの名前。 タスク名は自動生成されます。 タスクを簡単に識別できるように、わかりやすい名前を指定することをお勧めします。 一意のタスク名を指定する必要はありません。

    移行元データベース

    既存の DMS データベースインスタンスを選択します。(任意です。DMS データベースインスタンスが未登録の場合は、このオプションを無視して、以下のセクションでデータベース設定を行ってください。)

    使用するデータベースインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。

    • 既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。

    • 既存のインスタンスを選択しない場合は、次のデータベース情報を設定する必要があります。

    データベースタイプ

    移行元ディスクのタイプを設定します。 PolarDB-X 1.0 を選択します。

    アクセス方法

    ソースデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。

    インスタンスのリージョン

    ソースPolarDB-X 1.0インスタンスが存在するリージョン。

    Alibaba Cloud アカウント間でデータを複製

    Alibaba Cloudアカウント間でデータを同期するかどうかを指定します。 この例では、× が選択されています。

    インスタンス ID

    ソースPolarDB-X 1.0インスタンスのID。

    データベースアカウント

    ソースPolarDB-X 1.0インスタンスのデータベースアカウント。

    データベースのパスワード

    データベースインスタンスへのアクセスに使用されるパスワード。

    移行先データベース

    既存の DMS データベースインスタンスを選択します。(任意です。DMS データベースインスタンスが未登録の場合は、このオプションを無視して、以下のセクションでデータベース設定を行ってください。)

    使用するデータベースインスタンス。 ビジネス要件に基づいて、既存のインスタンスを使用するかどうかを選択できます。

    • 既存のインスタンスを選択すると、DTSはデータベースのパラメーターを自動的に入力します。

    • 既存のインスタンスを選択しない場合は、次のデータベース情報を設定する必要があります。

    データベースタイプ

    ターゲットデータベースのタイプ。 Elasticsearch を選択します。

    アクセス方法

    ターゲットデータベースのアクセス方法。 Alibaba Cloud インスタンス を選択します。

    インスタンスのリージョン

    ターゲットElasticsearchクラスターが存在するリージョン。

    インスタンス ID

    移行先のElasticsearchクラスターのID。

    データベースアカウント

    Elasticsearchクラスターへの接続に使用されるユーザー名。 Elasticsearchクラスターの作成時に指定したユーザー名を入力します。 Elasticsearchクラスターのデフォルトのアカウントはelasticです。

    データベースのパスワード

    データベースインスタンスへのアクセスに使用されるパスワード。

  4. ページの下部で、接続性をテストして続行をクリックします。

    ソースまたはターゲットデータベースがAlibaba Cloudデータベースインスタンス (ApsaraDB RDS for MySQLインスタンスやApsaraDB for MongoDBインスタンスなど) の場合、DTSは自動的にDTSサーバーのCIDRブロックをインスタンスのホワイトリストに追加します。 ソースデータベースまたはターゲットデータベースがElastic Compute Service (ECS) インスタンスでホストされている自己管理データベースの場合、DTSサーバーのCIDRブロックがECSインスタンスのセキュリティグループルールに自動的に追加されます。ECSインスタンスがデータベースにアクセスできることを確認する必要があります。 データベースが複数のECSインスタンスにデプロイされている場合、DTSサーバーのCIDRブロックを各ECSインスタンスのセキュリティグループルールに手動で追加する必要があります。 ソースデータベースまたはターゲットデータベースが、データセンターにデプロイされているか、サードパーティのクラウドサービスプロバイダーによって提供される自己管理データベースである場合、DTSサーバーのCIDRブロックをデータベースのホワイトリストに手動で追加して、DTSがデータベースにアクセスできるようにする必要があります。 詳細については、「DTSサーバーのCIDRブロックの追加」トピックの「DTSサーバーのCIDRブロック」セクションをご参照ください。

    警告

    DTSサーバーのCIDRブロックがデータベースまたはインスタンスのホワイトリスト、またはECSセキュリティグループルールに自動的または手動で追加されると、セキュリティリスクが発生する可能性があります。 したがって、DTSを使用してデータを同期する前に、潜在的なリスクを理解して認識し、次の対策を含む予防策を講じる必要があります。VPNゲートウェイ、またはSmart Access Gateway。

  5. 同期するオブジェクトと詳細設定を設定します。

    パラメーター

    説明

    同期タイプ

    同期タイプ。 デフォルトでは、増分データ同期が選択されています。 [スキーマ同期] および [完全データ同期] も選択する必要があります。 事前チェックが完了すると、DTSは選択したオブジェクトの履歴データをソースデータベースからターゲットクラスターに同期します。 履歴データは、その後の増分同期の基礎となる。

    競合するテーブルの処理モード

    • エラーの事前チェックと報告: ターゲットクラスターに、ソーステーブルと同じ名前のインデックスが含まれているかどうかを確認します。 ターゲットクラスターにソーステーブルと同じ名前のインデックスが含まれていない場合、事前チェックが渡されます。 それ以外の場合、事前チェック中にエラーが返され、データ同期タスクを開始できません。

      説明

      オブジェクト名マッピング機能を使用して、同期先クラスターに同期されるテーブルの名前を変更できます。 この機能は、ソースインスタンスとターゲットクラスターに同じテーブル名が含まれていて、ターゲットクラスター内のテーブルを削除または名前変更できない場合に使用できます。 詳細については、「同期するオブジェクトの名前変更」をご参照ください。

    • エラーを無視して続行: ソーステーブルと同じ名前を持つターゲットクラスターのインデックスの事前チェックをスキップします。

      警告

      エラーを無視して続行 を選択すると、データの不整合が発生し、ビジネスが次の潜在的なリスクにさらされる可能性があります。

      • ソースインスタンスとターゲットクラスターのマッピングが同じで、ターゲットクラスターのレコードのプライマリキーがソースインスタンスのプライマリキーと同じ場合、レコードは初期データ同期中も変更されません。 ただし、増分データ同期中にレコードが上書きされます。

      • ソースインスタンスとターゲットクラスターのマッピングが異なる場合、初期データ同期が失敗する可能性があります。 この場合、一部の列のみが同期されるか、データ同期タスクが失敗します。

    インデックス名

    • テーブル名 を選択した場合、ターゲットElasticsearchクラスターで作成されたインデックスは、PolarDB-X 1.0インスタンスのテーブルと同じ名前を使用します。

    • データベース名_テーブル名 を選択した場合、ターゲットElasticsearchクラスターで作成されたインデックスの名前は、Database name_Table名の形式です。

    説明

    インデックス名マッピングルールは、すべてのテーブルに対して有効です。

    移行先インスタンスでのオブジェクト名の大文字化

    ターゲットインスタンスのデータベース名、テーブル名、および列名の大文字化。 デフォルトでは、DTSデフォルトポリシーが選択されています。 他のオプションを選択して、オブジェクト名の大文字化をソースまたはターゲットデータベースの大文字化と一致させることができます。 詳細については、「ターゲットインスタンスのオブジェクト名の大文字化の指定」をご参照ください。

    ソースオブジェクト

    ソースオブジェクト セクションから1つ以上のオブジェクトを選択し、向右小箭头アイコンをクリックして 選択中のオブジェクト セクションにオブジェクトを追加します。

    説明

    同期するオブジェクトとしてテーブルまたはデータベースを選択できます。

    選択中のオブジェクト

    • 同期先のインスタンスに同期するオブジェクトの名前を変更するには、選択中のオブジェクト セクションでオブジェクトを右クリックします。 詳細については、「オブジェクト名のマップ」トピックの「単一オブジェクトの名前のマップ」セクションをご参照ください。

    • 一度に複数のオブジェクトの名前を変更するには、選択中のオブジェクト セクションの右上隅にある 一括編集 をクリックします。 詳細については、「オブジェクト名のマップ」トピックの「一度に複数のオブジェクト名をマップする」セクションをご参照ください。

    説明
    • データをフィルタリングするWHERE条件を指定するには、選択中のオブジェクト セクションでテーブルを右クリックします。 表示されるダイアログボックスで、条件を指定します。 詳細については、「フィルター条件の指定」をご参照ください。

    • オブジェクト名マッピング機能を使用してオブジェクトの名前を変更すると、そのオブジェクトに依存する他のオブジェクトの同期が失敗する可能性があります。

  6. 次へ:詳細設定をクリックして詳細設定を設定します。

    パラメーター

    説明

    タスクのスケジュールに使用する専用クラスターの選択

    デフォルトでは、DTSはタスクを共有クラスターにスケジュールします。 このパラメーターを設定する必要はありません。 データ同期タスクの安定性を向上させたい場合は、専用クラスターを購入してください。 詳細については、「DTS専用クラスターの概要」をご参照ください。

    アラートの設定

    データ同期タスクのアラートを設定するかどうかを指定します。 タスクが失敗するか、同期レイテンシが指定されたしきい値を超えると、アラート送信先は通知を受け取ります。 有効な値:

    失敗した接続の再試行時間

    失敗した接続のリトライ時間範囲。 データ同期タスクの開始後にソースデータベースまたはターゲットデータベースの接続に失敗した場合、DTSはその時間範囲内ですぐに接続を再試行します。 有効な値: 10 ~ 1440 単位は分です。 デフォルト値: 720 このパラメーターを30より大きい値に設定することを推奨します。 DTSが指定された時間範囲内にソースデータベースとターゲットデータベースに再接続すると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。

    説明
    • ソースまたはターゲットデータベースが同じである複数のデータ同期タスクに対して異なるリトライ時間範囲を指定した場合、最も短いリトライ時間範囲が優先されます。

    • DTSが接続を再試行すると、DTSインスタンスに対して課金されます。 業務要件に基づいて再試行時間範囲を指定することを推奨します。 ソースインスタンスとターゲットインスタンスがリリースされた後、できるだけ早くDTSインスタンスをリリースすることもできます。

    移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。

    その他の問題の再試行時間範囲。 たとえば、データ同期タスクの開始後にDDLまたはDML操作の実行に失敗した場合、DTSはその時間範囲内ですぐに操作を再試行します。 有効な値: 1 ~ 1440 単位は分です。 デフォルト値は 10 です。 このパラメーターを10より大きい値に設定することを推奨します。 指定された時間範囲内で失敗した操作が正常に実行されると、DTSはデータ同期タスクを再開します。 それ以外の場合、データ同期タスクは失敗します。

    重要

    移行元データベースと移行先データベースで他の問題が発生した場合の、再試行までの待機時間です。 パラメーターの値は、失敗した接続の再試行時間 パラメーターの値よりも小さくする必要があります。

    完全移行率を制限するかどうか

    完全データ同期中、DTSはソースデータベースとターゲットデータベースの読み取りおよび書き込みリソースを使用します。 これにより、データベースサーバーの負荷が増加する可能性があります。 1 秒あたりのソースデータベースのクエリ率 QPS1 秒あたりの完全移行の行数 RPS、および1 秒あたりの完全移行データ量 (MB) BPS パラメーターを設定して、ターゲットデータベースサーバーの負荷を軽減できます。

    説明

    このパラメーターは、同期タイプ パラメーターで 完全データ同期 が選択されている場合にのみ表示されます。

    増分同期率を制限するかどうか

    増分データ同期のスロットリングを有効にするかどうかを指定します。 ビジネス要件に基づいて、増分データ同期のスロットリングを有効にできます。 スロットリングを設定するには、1 秒あたりの増分同期の行数 RPSおよび1 秒あたりの増分同期データ量 (MB) BPS パラメーターを設定する必要があります。 これにより、移行先データベースサーバーの負荷が軽減されます。

    環境タグ

    DTSインスタンスを識別するために使用される環境タグ。 ビジネス要件に基づいて環境タグを選択できます。

    シャード構成

    ターゲットElasticsearchクラスターのインデックスのシャード設定に基づくプライマリシャードとレプリカシャードの数。

    文字列インデックス

    ターゲットElasticsearchクラスターに同期される文字列のインデックス作成に使用されるメソッド。 有効な値:

    • analyzed: インデックス作成前に文字列が分析されます。 特定のアナライザーを選択する必要があります。 アナライザーの種類の詳細については、「組み込みアナライザーリファレンス」をご参照ください。

    • not analyze: 文字列は元の値でインデックスされます。

    • no: 文字列はインデックス付けされません。

    タイムゾーン

    DATETIMEやTIMESTAMPなどの日付と時刻のデータ型のタイムゾーン。 日付と時刻のデータを移行先Elasticsearchクラスターに同期するためのタイムゾーンを選択できます。

    説明

    移行先クラスターの日付と時刻のデータ型にタイムゾーンが必要ない場合は、データ同期を実行する前に、移行先クラスターの日付と時刻のデータ型のドキュメント型を指定する必要があります。

    DOCID

    パラメーターのデフォルト値は、Elasticsearchクラスターのテーブルのプライマリキーです。 テーブルにプライマリキーがない場合、パラメーターの値はElasticsearchによって自動的に生成されるID列になります。

    ETL の設定

    抽出、変換、および読み込み (ETL) 機能を有効にするかどうかを指定します。 詳細については、「ETLとは何ですか?」をご参照ください。 有効な値:

  7. ページの下部で、次:データベースおよびテーブルのフィールド設定 をクリックします。 表示されるページで、同期先のElasticsearchクラスターに同期するテーブルの_ルーティングポリシーと_id値を設定します。

    パラメーター

    説明

    _routing の設定

    ターゲットElasticsearchクラスターの特定のシャードにドキュメントを保存するかどうかを指定します。 詳細については、「 _routing」をご参照ください。 有効な値:

    • Yes: ルーティングのカスタム列を指定できます。

    • No :_id値はルーティングに使用されます。

    説明

    ターゲットElasticsearchクラスターのバージョンが7. xの場合、[いいえ] を選択する必要があります。

    _routing 列

    ルーティングに使用される列。

    説明

    このパラメーターは、_routing の設定パラメーターがYesに設定されている場合にのみ必要です。

    _id の値

    ドキュメントのIDを格納するために使用される列。

  8. タスク設定を保存し、事前チェックを実行します。

    • 関連するAPI操作を呼び出してDTSタスクを設定するときに指定するパラメーターを表示するには、ポインターを 次:タスク設定の保存と事前チェック に移動し、OpenAPI パラメーターのプレビュー をクリックします。

    • パラメーターを表示または表示する必要がない場合は、ページ下部の 次:タスク設定の保存と事前チェック をクリックします。

    説明
    • データ同期タスクを開始する前に、DTSは事前チェックを実行します。 データ同期タスクは、タスクが事前チェックに合格した後にのみ開始できます。

    • データ同期タスクが事前チェックに失敗した場合は、失敗した各項目の横にある [詳細の表示] をクリックします。 チェック結果に基づいて原因を分析した後、問題のトラブルシューティングを行います。 次に、プレチェックを再実行します。

    • 事前チェック中にアイテムに対してアラートがトリガーされた場合:

      • アラートアイテムを無視できない場合は、失敗したアイテムの横にある [詳細の表示] をクリックして、問題のトラブルシューティングを行います。 次に、もう一度プレチェックを実行します。

      • アラート項目を無視できる場合は、[アラート詳細の確認] をクリックします。 [詳細の表示] ダイアログボックスで、[無視] をクリックします。 表示されたメッセージボックスで、[OK] をクリックします。 次に、[再度事前チェック] をクリックして、事前チェックを再度実行します。 アラート項目を無視すると、データの不整合が発生し、ビジネスが潜在的なリスクにさらされる可能性があります。

  9. 成功率100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。

  10. 購入ページで、データ同期インスタンスの課金方法とインスタンスクラスのパラメーターを設定します。 下表にパラメーターを示します。

    セクション

    パラメーター

    説明

    新しいインスタンスクラス

    Billing Method

    • サブスクリプション: データ同期インスタンスの作成時にサブスクリプションの料金を支払います。 サブスクリプションの課金方法は、長期使用の場合、従量課金の課金方法よりも費用対効果が高くなります。

    • 従量課金: 従量課金インスタンスは1時間ごとに課金されます。 従量課金方法は、短期使用に適しています。 従量課金データ同期インスタンスが不要になった場合は、インスタンスをリリースしてコストを削減できます。

    リソースグループの設定

    データ同期インスタンスが属するリソースグループ。 デフォルト値: Default resource group 詳細については、「リソース管理とは 」をご参照ください。

    インスタンスクラス

    DTSは、同期速度が異なるインスタンスクラスを提供します。 ビジネス要件に基づいてインスタンスクラスを選択できます。 詳細については、「データ同期インスタンスのインスタンスクラス」をご参照ください。

    サブスクリプション期間

    サブスクリプションの課金方法を選択した場合は、サブスクリプション期間と作成するデータ同期インスタンスの数を指定します。 サブスクリプション期間は、1〜9か月、1年、2年、3年、または5年とすることができる。

    説明

    このパラメーターは、サブスクリプション の課金方法を選択した場合にのみ使用できます。

  11. データ伝送サービス (従量課金) サービス規約を読んで選択します。

  12. [購入して開始] をクリックします。 表示されるダイアログボックスで、OK をクリックします。

    タスクリストでタスクの進行状況を確認できます。

  13. 成功率100% になるまで待ちます。 次に、[次へ: インスタンスの購入] をクリックします。