HBase数据同步或迁移到Lindorm - 云原生多模数据库 Lindorm

如果您想要将自建HBase或阿里云HBase中的数据迁移或同步至Lindorm宽表引擎，可以通过LTS服务完成存量数据迁移和实时数据同步。本文介绍HBase数据同步与迁移的使用场景、功能列表、迁移优势、使用限制以及迁移任务等操作。

使用场景

迁移前请确认目标集群的HDFS容量，防止迁移过程中出现容量写满的情况。
如果源集群为自建HBase或阿里云HBase集群，增量同步提交前，建议将源集群的日志保留时间设置为12小时以上，为同步过程中可能出现的异常预留充足的处理恢复时间。修改方式：修改hbase-site.xml文件中hbase.master.logcleaner.ttl参数的值，并在修改后重启HMaster。hbase.master.logcleaner.ttl参数的单位为毫秒（ms），设置时需注意单位转化，例如，hbase.master.logcleaner.ttl=43200000表示设置日志保留时间为12小时。
说明
如果源集群为Lindorm集群，无需修改日志保留时间。
客户无需在目标集群创建表，LTS同步服务会自动创建和源集群一样的表，包括分区的信息。客户自建的目标表可能会和源表分区很不一致，这可能会导致迁移完成之后，目标表会进行频繁的split、compaction，如果表的数据量十分庞大，可能会导致这个过程非常耗时。
如果源表带有coprocessor，在创建目标表的时候需要确保目标集群包含coprocessor对应的JAR包。
开启增量同步后，如果不消费数据，默认日志会保留48小时，超时后订阅关系自动取消，保留的数据自动删除。

登录LTS。具体操作，请参见登录LTS。
在左侧导航栏，选择Lindorm/HBase迁移 > 一键迁移。
单击创建任务。
在任务名（可不填）文本框中，填写任务名称。任务名只支持英文字符、数字。非必填项，未填写情况下默认任务ID为任务名。
根据界面提示，设置源集群和目标集群。
勾选需要的操作。
- 表结构迁移：在目标集群创建表（Schema、分区信息一致），目标集群表已存在会跳过。
- 实时数据复制：同步源集群的实时增量数据。
- 历史数据迁移：文件级别的全量文件物理迁移。
填写同步/迁移的表和高级配置，高级配置为非必填项。
单击创建。

没有终止任务的前提下直接释放LTS集群、同步任务暂停、任务异常阻塞。

导致迁移任务失败的可能原因很多，例如网络不稳定、服务冲突等。LTS自带重试机制，在任务失败后会自动重试。如果重试后依然失败，请联系Lindorm技术支持（钉钉号：s0s3eg3）。