Data Integrationは、Alibaba Cloudが提供する、信頼性が高く、安全で、費用対効果が高く、柔軟でスケーラブルなデータ同期プラットフォームです。 異種システム間のデータストレージをサポートし、20種類以上のデータソースに対して、さまざまなネットワーク環境でオフライン (フルおよび増分) データアクセスチャネルを提供します。 詳細については、サポートされているデータソースタイプ、Readerプラグイン、およびWriterプラグインをご参照ください。
シナリオ
AnalyticDB for PostgreSQLから他のデータソースにデータをエクスポートし、必要に応じてデータを処理します。
処理されたデータを他のデータソースからAnalyticDB for PostgreSQLにインポートします。
上記の両方のシナリオで、Data Integrationで同期タスクを実行できます。 データソースとホワイトリストを含む同期タスクを作成および設定する方法の詳細については、DataWorksドキュメントを参照してください。 次のセクションでは、AnalyticDB for PostgreSQLにデータをインポートおよびエクスポートする方法について詳しく説明します。
準備
Data Integrationの次の準備を完了します。
Alibaba Cloud アカウントを登録します。
MaxComputeを有効化します。 デフォルトのMaxComputeデータソースが生成されたら、Alibaba Cloudアカウントを使用してDataWorksコンソールにログインします。
ワークスペースを作成する. ワークスペースでは、ワークフローを完了し、データとタスクの両方を維持できます。
RAMユーザーの資格情報を使用してData Integrationで同期タスクを作成する場合は、RAMユーザーに必要な権限を付与する必要があります。 詳細については、「RAMユーザーの作成」をご参照ください。
AnalyticDB for PostgreSQLの次の準備を完了します。
データをインポートする場合は、psql CLIクライアントを使用して、AnalyticDB for PostgreSQLインスタンスにターゲットデータベースとテーブルの両方を作成します。
データをエクスポートする場合は、AnalyticDB for PostgreSQLインスタンスのIPアドレスホワイトリストを設定します。 詳細については、ホワイトリストの追加をご参照ください。
MySQL からのデータインポート
DataWorksコンソールでデータソースを追加します。 詳細については、「データソースの設定」をご参照ください。
同期タスクを設定します。
同期タスクは、データソースからAnalyticDB for PostgreSQLにデータを同期するために使用されます。 ウィザードまたはスクリプトモードで同期タスクを設定できます。
ウィザードモードで同期タスクを設定するには、次の手順に従います。
データ同期ノードを作成します。
データソースを指定します。
データの宛先を指定します。 これは、AnalyticDB for PostgreSQLインスタンスである必要があります。
ソーステーブルと宛先テーブルのフィールド間のマッピングを設定します。
最大伝送速度とダーティデータチェックルールを指定します。
スケジューリング属性を設定します。
説明詳細については、「ウィザードモードでの同期タスクの設定」をご参照ください。
スクリプトモードで同期タスクを設定するには、次の手順に従います。
データ同期ノードを作成します。
テンプレートをインポートします。
同期タスクのリーダーを設定します。
同期タスクのライターを設定します。 ライターは、AnalyticDB for PostgreSQLインスタンスである必要があります。
ソーステーブルと宛先テーブルのフィールド間のマッピングを設定します。
最大伝送速度とダーティデータチェックルールを指定します。
スケジューリング属性を設定します。
説明詳細については、「スクリプトモードでの同期タスクの設定」をご参照ください。
データのエクスポート
データのエクスポート手順は、データのインポート手順と似ていますが、データソースとしてAnalyticDB for PostgreSQLを指定する必要があります。 詳細については、「AnalyticDB For PostgreSQL接続の追加」をご参照ください。
関連ドキュメント
詳細については、DataWorksドキュメントをご参照ください。