MySQL输入基于Binlog实时订阅的方式,实时读取您配置的MySQL数据库表数据。本文为您介绍,如何配置MySQL输入,以及配置输入之前需要准备的网络环境及账号权限。
前提条件
配置MySQL输入之前,请确保已完成以下规划与准备工作。
已配置同步账号权限,详情请参见配置账号权限。
实时同步通过数据源配置账号访问MySQL,在实时同步场景下,您需要确保此账号拥有数据库的
SELECT
、REPLICATION SLAVE
、REPLICATION CLIENT
权限。已开启MySQL Binlog服务,详情请参见开启MySQL Binlog。
数据集成通过实时订阅MySQL Binlog实现增量数据实时同步,您需要在DataWorks配置同步任务前,先开启MySQL Binlog服务。
已购买合适规格的独享数据集成资源组。详情请参见新增和使用独享数据集成资源组。
已配置数据同步资源组与数据库的网络连通,详情请参见网络连通方案。
使用限制
数据集成不支持同步MySQL只读库实例的数据。
DataWorks的数据集成实时同步MySQL数据是基于实时订阅MySQL实现的,实时同步MySQL数据目前仅支持配置MySQL数据源为RDS的
5.x
或8.x
版本的MySQL,如果需要同步DRDS的MySQL,请不要将DRDS的MySQL配置为MySQL数据源,您可以参考配置DRDS数据源文档直接将其配置为DRDS数据源。不支持Functional index。
配置MySQL输入
进入数据开发页面。
登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的 ,在下拉框中选择对应工作空间后单击进入数据开发。
鼠标悬停至图标,单击 。
您也可以展开业务流程,右键单击目标业务流程,选择
。在新建节点对话框中,选择同步方式为单表(Topic)到单表(Topic)ETL,输入名称,并选择路径。
重要节点名称必须是大小写字母、中文、数字、下划线(_)以及英文句号(.),且不能超过128个字符。
单击确认。
在实时同步节点的编辑页面,单击 并拖拽至编辑面板。
单击MySQL节点,在节点配置对话框中,配置各项参数。
参数
描述
数据源
选择已经配置好的MySQL数据源,此处仅支持MySQL数据源。
如果未配置数据源,请单击右侧的新建数据源,进入
页面进行新建。表
选择当前数据源下需要同步的表名称。您可以单击右侧的数据预览进行确认。
您可以实现分库分表的场景,配置的库和表会在该任务中同时进行实时同步。
重要分库分表中的数据表的Schema请保持一致,以避免执行报错。
输出字段
选择需要同步的字段,包括管理字段和数据字段:
管理字段:为方便进行数据管理、排序和去重等操作,会在同步的目标端自动添加附加字段。
数据字段:显示要同步的原始表中对应的字段。
详情请参见实时同步字段格式。
MySQL节点支持分库分表,您可以单击添加分库分表数据源,从下拉列表中选择相应的数据源和表,添加多个数据源,同时进行同步。
重要所选表的Schema需要保持一致,否则执行会报错。
单击工具栏中的图标。