全部產品
Search
文件中心

ApsaraDB RDS:從Amazon RDS for PostgreSQL增量遷移至阿里雲

更新時間:Feb 28, 2024

本文介紹如何使用Data Transmission Service,將Amazon RDS for PostgreSQL遷移至阿里雲RDS PostgreSQL。DTS支援結構遷移、全量資料移轉以及增量資料移轉,同時使用這三種遷移類型可以實現在自建應用不停服的情況下,平滑地完成資料庫遷移。

前提條件

  • Amazon RDS for PostgreSQL的資料庫版本為10.4或以上版本。
  • 為保障DTS能夠通過公網串連Amazon RDS for PostgreSQL,需要將其Publicly accessible設定為Yes
  • 為保障DTS能夠讀取Amazon RDS for PostgreSQL的增量資料變更資訊,需要將其參數組中rds.logical_replication參數的值修改為1
  • 已建立阿里雲RDS PostgreSQL,詳情請參見建立RDS PostgreSQL
    說明
    • 阿里雲RDS PostgreSQL的資料庫大版本建議與Amazon RDS for PostgreSQL執行個體的大版本保持一致,如需跨版本遷移,請建立一個隨用隨付的執行個體以驗證相容性。
    • 阿里雲RDS PostgreSQL的儲存空間,須大於Amazon RDS for PostgreSQL中待遷移資料庫佔用的儲存空間。

注意事項

  • DTS在執行全量資料移轉時將佔用源庫和目標庫一定的讀寫資源,可能會導致資料庫的負載上升,在資料庫效能較差、規格較低或業務量較大的情況下(例如源庫有大量慢SQL、存在無主鍵表或目標庫存在死結等),可能會加重資料庫壓力,甚至導致資料庫服務不可用。因此您需要在執行資料移轉前評估源庫和目標庫的效能,同時建議您在業務低峰期執行資料移轉(例如源庫和目標庫的CPU負載在30%以下)。

  • 如果待遷移對象沒有主鍵或唯一約束,且所有欄位沒有唯一性,可能會導致目標資料庫中出現重複資料或遷移失敗。
  • 一個資料移轉任務只能遷移一個資料庫,如果有多個資料庫需要遷移,則需要為每個資料庫建立資料移轉任務。
  • 僅支援DML操作(INSERT、DELETE、UPDATE)的同步。
  • 在資料移轉的過程中,DTS會在Amazon RDS for PostgreSQL中建立首碼為dts_sync_的replication slot用於複製資料。DTS會每隔90分鐘自動清理一次歷史replication slot,避免其持續累積佔用磁碟空間。
    說明 當釋放遷移任務或遷移失敗時,DTS會主動清理該replication slot;如果Amazon RDS for PostgreSQL發生了主備切換,則需要您登入備庫來手動清理。
    Amazon slot查詢資訊
  • 如果Amazon RDS for PostgreSQL發生了主備切換,則DTS任務會失敗,且任務可能無法恢複。
  • 對於遷移失敗的任務,DTS會觸發自動回復。在您將業務切換至目標執行個體前,請務必先結束或釋放該任務,避免該任務被自動回復後,導致源端資料覆蓋目標執行個體的資料。

費用說明

遷移類型

鏈路配置費用

公網流量費用

結構遷移和全量資料移轉

不收費。

通過公網將資料移轉出阿里雲時將收費,詳情請參見計費概述

增量資料移轉

收費,詳情請參見計費概述

遷移類型說明

  • 結構遷移
    DTS將遷移對象的結構定義遷移至阿里雲RDS PostgreSQL,支援結構遷移的對象包含TABLE、TRIGGER、VIEW、SEQUENCE、FUNCTION、USER DEFINED TYPE、RULE、DOMAIN、OPERATION、AGGREGATE。
    說明 不支援遷移使用C語言編寫的FUNCTION。
  • 全量資料移轉

    將遷移對象的存量資料全部遷移到阿里雲RDS PostgreSQL資料庫中。

  • 增量資料移轉

    DTS在全量資料移轉的基礎上,將遷移對象的累加式更新遷移到阿里雲RDS PostgreSQL資料庫中。通過增量資料移轉可以實現在應用不停服的情況下,平滑地完成資料移轉。

資料庫帳號的許可權要求

資料庫結構遷移全量遷移增量遷移
Amazon RDS for PostgreSQLpg_catalog的usage許可權遷移對象的select許可權rds_superuser許可權
阿里雲RDS PostgreSQL遷移對象的create、usage許可權schema的owner許可權schema的owner許可權

資料移轉流程

為解決對象間的依賴,提高遷移成功率,DTS對PostgreSQL結構及資料的遷移順序如下。

  1. 執行TABLE、VIEW、SEQUENCE、FUNCTION、USER DEFINED TYPE、RULE、DOMAIN、OPERATION、AGGREGATE的結構遷移。
  2. 執行全量資料移轉。
  3. 執行TRIGGER、FOREIGN KEY的結構遷移。
  4. 執行增量資料移轉。
    說明 在執行增量資料移轉前,請勿對Amazon RDS for PostgreSQL中的遷移對象執行DDL操作,否則可能導致遷移失敗。

準備工作

  1. 登入Amazon RDS控制台。

  2. 在頁面右上方,選擇目標執行個體所屬的地區。
  3. 單擊左側導覽列的資料庫,然後單擊目標資料庫標識符,進入基本資料頁面。
    單擊資料庫標識符
  4. 安全性群組規則地區框,單擊入站規則對應的安全性群組名稱。

    安全性群組規則

  5. 安全性群組設定頁面,將對應地區的DTS伺服器位址添加至入站規則中,IP位址區段詳情請參見遷移、同步或訂閱本機資料庫時需添加的IP白名單

    AWS postgresql入站規則

    說明
    • 您只需添加目標資料庫所在地區對應的DTS IP位址區段。例如,來源資料庫地區為新加坡,目標資料庫地區為杭州,您只需要添加杭州地區的DTS IP位址區段。

    • 在加入IP位址區段時,您可以一次性添加所需的IP地址,無需逐條添加入站規則。

    • 若您有其他疑問,請查看Amazon官方文檔或聯絡Amazon的技術支援人員。

操作步驟

  1. 登入資料轉送控制台

    說明

    若資料轉送控制台自動跳轉至Data Management控制台,您可以在右下角的jiqiren中單擊返回舊版,返回至舊版資料轉送控制台。

  2. 在左側導覽列,單擊資料移轉

  3. 遷移工作清單頁面頂部,選擇遷移的目的地組群所屬地區。

  4. 單擊頁面右上方的建立遷移任務

  5. 配置遷移任務的源庫及目標庫資訊。
    源庫及目標庫配置
    類別配置說明
    任務名稱DTS會自動產生一個任務名稱,建議配置具有業務意義的名稱(無唯一性要求),便於後續識別。
    源執行個體資訊執行個體類型選擇有公網IP的自建資料庫
    執行個體地區源執行個體所在的地區,當執行個體類型選擇為有公網IP的自建資料庫時,該參數無需設定。
    資料庫類型選擇PostgreSQL
    主機名稱或IP地址填入Amazon RDS for PostgreSQL的串連地址。
    說明 您可以在Amazon RDS for PostgreSQL的基本資料頁面,擷取資料庫的串連資訊。
    串連地址
    連接埠填入Amazon RDS for PostgreSQL的服務連接埠,預設為5432
    資料庫名稱填入Amazon RDS for PostgreSQL中的待遷移的資料庫名。
    資料庫帳號填入Amazon RDS for PostgreSQL的資料庫帳號,許可權要求請參見資料庫帳號的許可權要求
    資料庫密碼填入該資料庫帳號的密碼。
    說明

    源庫資訊填寫完畢後,您可以單擊資料庫密碼後的測試連接來驗證填入的資訊是否正確。如果填寫正確則提示測試通過;如果提示測試失敗,單擊測試失敗後的診斷,根據提示調整填寫的源庫資訊。

    目標執行個體資訊執行個體類型選擇RDS執行個體
    執行個體地區選擇阿里雲RDS PostgreSQL執行個體所屬地區。
    RDS執行個體ID選擇阿里雲RDS PostgreSQL執行個體ID。
    資料庫名稱填入阿里雲RDS PostgreSQL中待遷入資料的資料庫名,可以和Amazon RDS for PostgreSQL中待遷移的庫名不同。
    說明 該資料庫須在阿里雲RDS PostgreSQL中存在,如不存在請建立資料庫
    資料庫帳號填入阿里雲RDS PostgreSQL的資料庫帳號,許可權要求請參見資料庫帳號的許可權要求
    資料庫密碼填入該資料庫帳號的密碼。
    說明

    目標庫資訊填寫完畢後,您可以單擊資料庫密碼後的測試連接來驗證填入的資訊是否正確。如果填寫正確則提示測試通過;如果提示測試失敗,單擊測試失敗後的診斷,根據提示調整填寫的目標庫資訊。

  6. 配置完成後,單擊頁面右下角的授權白名單並進入下一步

    如果源或目標資料庫是阿里雲資料庫執行個體(例如RDS MySQLApsaraDB for MongoDB等),DTS會自動將對應地區DTS服務的IP地址添加到阿里雲資料庫執行個體的白名單;如果源或目標資料庫是ECS上的自建資料庫,DTS會自動將對應地區DTS服務的IP地址添到ECS的安全規則中,您還需確保自建資料庫沒有限制ECS的訪問(若資料庫是叢集部署在多個ECS執行個體,您需要手動將DTS服務對應地區的IP地址添到其餘每個ECS的安全規則中);如果源或目標資料庫是IDC自建資料庫或其他雲資料庫,則需要您手動添加對應地區DTS服務的IP地址,以允許來自DTS伺服器的訪問。DTS服務的IP地址,請參見DTS伺服器的IP位址區段

    警告

    DTS自動添加或您手動添加DTS服務的公網IP位址區段可能會存在安全風險,一旦使用本產品代表您已理解和確認其中可能存在的安全風險,並且需要您做好基本的安全防護,包括但不限於加強帳號密碼強度防範、限制各網段開放的連接埠號碼、內部各API使用鑒權方式通訊、定期檢查並限制不需要的網段,或者使用通過內網(專線/VPN網關/智能網關)的方式接入。

  7. 選擇遷移對象和遷移類型。
    選擇遷移類型和對象
    配置說明
    遷移類型同時勾選結構遷移全量資料移轉增量資料移轉
    遷移對象

    遷移對象框中單擊待遷移的對象,然後單擊向右小箭頭將其移動至已選擇對象框。

    說明
    • 遷移對象選擇的粒度為Schema、表、列。
    • 預設情況下,遷移完成後,遷移對象名稱保持不變。如果您需要改變遷移對象在阿里雲RDS PostgreSQL中的名稱,需要使用DTS提供的對象名映射功能。使用方法請參見庫表列映射
    • 如果使用了對象名映射功能,可能會導致依賴這個對象的其他對象遷移失敗。
    映射名稱更改如需更改遷移對象在目標執行個體中的名稱,請使用對象名映射功能,詳情請參見庫表列映射
    源、目標庫無法串連重試時間預設重試12小時,您也可以自訂重試時間。如果DTS在設定的時間內重新串連上源、目標庫,遷移任務將自動回復。否則,遷移任務將失敗。
    說明 由於串連重試期間,DTS將收取任務運行費用,建議您根據業務需要自訂重試時間,或者在源和目標庫執行個體釋放後儘快釋放DTS執行個體。
  8. 上述配置完成後,單擊頁面右下角的預檢查並啟動

    說明
    • 在遷移任務正式啟動之前,會先進行預檢查。只有預檢查通過後,才能成功啟動遷移任務。

    • 如果預檢查失敗,單擊具體檢查項後的提示,查看失敗詳情。

      • 您可以根據提示修複後重新進行預檢查。

      • 如無需修複警示檢測項,您也可以選擇確認屏蔽忽略警示項並重新進行預檢查,跳過警示檢測項重新進行預檢查。

  9. 預檢查通過後,單擊下一步

  10. 在彈出的購買配置確認對話方塊,選擇鏈路規格並選中資料轉送(隨用隨付)服務條款

  11. 單擊購買並啟動,遷移任務正式開始。
    說明 遷移任務不會自動結束,您需要手動結束遷移任務。請選擇合適的時間手動結束遷移任務,例如業務低峰期或準備將業務切換至目標執行個體時。
    1. 觀察遷移任務的進度變更為增量遷移,並顯示為無延遲狀態時,將源庫停寫幾分鐘,此時增量遷移的狀態可能會顯示延遲的時間。
    2. 等待遷移任務的增量遷移再次進入無延遲狀態後,手動結束遷移任務。結束增量遷移任務
  12. 將業務切換至阿里雲RDS PostgreSQL。