保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。
故障切换类型
数据同步后切换
该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步完成后再启动切换。这样可以保证容灾端与生产端数据完全一致,无数据丢失。该切换模式适用于计划内容灾演练,业务迁移等场景。
立即切换
该故障切换会尝试停止保护组中被保护的实例,不会等待所有被保护的实例停止,也不会进行最后一轮数据同步,数据在RPO范围内有部分丢失。该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。
故障恢复类型
数据同步后切换
该故障恢复会停止保护组中被保护的实例,并且一直等到所有被保护的实例停止,再进行最后一轮数据同步,并等待数据同步完成后再启动切换,服务不可用时间会长于“立即切换”的时间,主要用在生产站点正常工作等场景。
立即切换
该故障恢复会尝试停止保护组中被保护的实例,但不会等待所有被保护的实例停止,也不会进行最后一轮数据同步。立即启动恢复,会导致数据有部分丢失,主要用在容灾站点确实发生短期无法恢复的故障,需立即将业务恢复到生产站点的场景。
数据同步后切换
正向保护-故障切换
请参考以下步骤进行正向保护故障切换操作。
在左侧导航栏,选择 。
如果不是云盘异步复制型容灾,请单击切换到云盘异步复制型容灾。
在容灾站点对页签,单击目标容灾站点对,选择保护组。
在保护组页签,在目标保护组的操作列,单击,选择正向保护>故障切换。
在启动故障切换对话框中,选择数据同步后切换,配置实例规格不足时的处理策略,单击确定。
说明当实例为节省模式停机模式时,启动时可能存在规格在可用区内库存不足的情况。选择规格族内升配,系统会优先尝试在规格族内升配,最大规格为当前规格3倍CPU或内存。
自动升配失败或选择手动处理时,请您根据任务失败提示在ECS控制台改配实例规格后,在任务列表中重试任务。
保护组的状态变更为正在切换。
故障切换完成后,保护组状态变更为故障切换成功。
容灾切换完成后,单击保护组对应的管理保护实例,进入保护实例列表页面。
单击容灾站点实例ID/名称下的链接,验证ECS数据与应用。
验证完成后,在保护组的操作列,单击,选择正向保护>完成切换。
保护组状态变更为确认切换完成。此时,生产站点的ECS实例状态为已停止,容灾ECS实例状态为运行中。
启动反向复制
反向复制的目的,是将容灾站点数据复制到生产站点,为故障恢复做准备。
在左侧导航栏,选择 。
如果不是云盘异步复制型容灾,请单击切换到云盘异步复制型容灾。
在容灾站点对页签,单击目标容灾站点对,选择保护组。
在保护组页签,在目标保护组的操作列,单击选择启动反向复制。
在启动反向复制面板,单击确认。
说明生产端恢复正常后启动反向复制,无需创建新的实例和云盘。
保护组状态变更为反向复制中。
反向保护-故障恢复
生产站点故障恢复后,您需要将容灾站点数据恢复到生产站点,完成故障恢复。在保护组状态为反向复制中并且实际RPO符合预期的情况下,您就可以进行故障恢复操作。
请参考以下步骤进行反向保护故障恢复操作。
在左侧导航栏,选择 。
如果不是云盘异步复制型容灾,请单击切换到云盘异步复制型容灾。
在容灾站点对页签,单击目标容灾站点对,选择保护组。
在保护组页签,在目标保护组的操作列,单击,选择反向保护>故障恢复。
在启动故障恢复对话框中,选择数据同步后切换,配置停机模式、实例规格不足时处理策略,单击确定。
保护组的状态变更为故障恢复中。
故障恢复完成后,保护组状态变更为故障恢复完成。此时,生产站点的ECS实例状态为运行中,容灾ECS实例状态为已停止。
确认故障恢复完成后,单击,选择反向保护>完成恢复。
确认完成恢复后,保护组状态变更为初始化。
立即切换
正向保护-故障切换
在左侧导航栏,选择 。
如果不是云盘异步复制型容灾,请单击切换到云盘异步复制型容灾。
在容灾站点对页签,单击目标容灾站点对,选择保护组。
在保护组页签,在目标保护组的操作列,单击,选择正向保护>故障切换。
在启动故障切换对话框中,选择立即切换,配置实例规格不足时处理策略,单击确定。
说明当实例为节省模式停机模式时,启动时可能存在规格在可用区内库存不足的情况。选择规格族内升配,系统会优先尝试在规格族内升配,最大规格为当前规格3倍CPU或内存。
自动升配失败或选择手动处理时,请您根据任务失败提示在ECS控制台改配实例规格后,在任务列表中重试任务。
保护组的状态变更为正在切换。
重要该操作会导致数据有部分丢失,请谨慎评估后操作。
故障切换完成后,保护组状态变更为故障切换成功。
容灾切换完成后,单击保护组对应的管理保护实例,进入保护实例列表页面。
单击容灾站点实例ID/名称下的链接,验证ECS数据与应用。
验证完成后,在保护组的操作列,单击,选择正向保护>完成切换。
保护组状态变更为确认切换完成。此时,生产站点的ECS实例状态为已停止,容灾ECS实例状态为运行中。
启动反向复制
反向复制的目的,是将容灾站点数据复制到生产站点,为故障恢复做准备。
在左侧导航栏,选择 。
如果不是云盘异步复制型容灾,请单击切换到云盘异步复制型容灾。
在容灾站点对页签,单击目标容灾站点对,选择保护组。
在保护组页签,在目标保护组的操作列,单击选择启动反向复制。
在启动反向复制面板,单击确认。
说明生产端恢复正常后启动反向复制,无需创建新的实例和云盘。
保护组状态变更为反向复制中。
反向保护-故障恢复
在左侧导航栏,选择 。
如果不是云盘异步复制型容灾,请单击切换到云盘异步复制型容灾。
在容灾站点对页签,单击目标容灾站点对,选择保护组。
在保护组页签,在目标保护组的操作列,单击,选择反向保护>故障恢复。
在启动故障恢复对话框中,选择立即切换,配置停机模式、实例规格不足时处理策略,单击确定。
重要该操作会导致数据有部分丢失,请谨慎评估后操作。
保护组的状态变更为故障恢复中。
故障恢复完成后,保护组状态变更为故障恢复成功。此时,生产站点的ECS实例状态为运行中,容灾ECS实例状态为已停止。
确认故障恢复完成后,单击,选择反向保护>完成恢复。
确认完成恢复后,保护组状态变更为初始化。