通过数据同步功能同步SLS至湖仓版（推荐）

SLS同步链路支持从指定时间位点将日志服务LogStore中的数据实时同步至云原生数据仓库 AnalyticDB MySQL 版集群，以满足近实时产出、全量历史归档、弹性分析等需求。本文介绍如何添加SLS数据源，新建SLS同步链路并启动任务，以及数据同步后如何进行数据分析和数据源管理。

前提条件

AnalyticDB for MySQL集群的产品系列为湖仓版。
已在AnalyticDB for MySQL集群中创建Job型资源组。具体操作，请参见新建资源组。
已创建AnalyticDB for MySQL集群的数据库账号。
- 如果是通过阿里云账号访问，只需创建高权限账号。具体操作，请参见创建高权限账号。
- 如果是通过RAM用户访问，需要创建高权限账号和普通账号并且将RAM用户绑定到普通账号上。具体操作，请参见创建数据库账号和绑定或解绑RAM用户与数据库账号。
已开通日志服务，并在AnalyticDB for MySQL集群所在地域，创建日志服务Project和Logstore。详细信息，请参见快速入门。

注意事项

目前AnalyticDB for MySQL集群中的一张表仅支持同步日志服务中的一个LogStore。

计费说明

通过AnalyticDB for MySQL数据迁移功能迁移数据至OSS会产生以下费用。

AnalyticDB for MySQL的ACU弹性资源费用，计费项详情，请参见湖仓版计费项。
OSS的存储费用、GET类请求次数以及PUT类和其他请求次数的费用。计费项详情，请参见计费概述。

使用流程

步骤一（可选）：配置RAM授权。
步骤二：新建数据源。
步骤三：创建同步链路。
步骤四：启动数据同步任务。
步骤五：数据分析。
步骤六（可选）：管理数据源。

配置RAM授权

跨账号同步SLS数据到AnalyticDB for MySQL时，您需要在源端创建RAM角色，并为RAM角色精确授权、修改RAM角色的信任策略。如果您仅同步当前账号下的SLS数据，可跳过该步骤，直接新建数据源，详情请参见新建数据源。

创建RAM角色。具体操作，请参见创建阿里云账号的RAM角色。
说明
配置选择信任的云账号参数时，选择其他云账号，填写AnalyticDB for MySQL集群所属的阿里云账号ID。您可以登录账号中心，在概览页面查看账号ID。
为RAM角色授予AliyunAnalyticDBAccessingLogRolePolicy权限。具体操作，请参见为RAM角色精确授权。

修改RAM角色的信任策略。具体操作，请参见修改RAM角色的信任策略。

{
  "Statement": [
    {
      "Action": "sts:AssumeRole",
      "Effect": "Allow",
      "Principal": {
        "RAM": [
            "acs:ram::<阿里云账号ID>:root"
        ],
        "Service": [
            "<阿里云账号ID>@ads.aliyuncs.com"
        ]
      }
    }
  ],
  "Version": "1"
}

说明

阿里云账号ID为步骤1中填写的阿里云账号ID，配置时无需填写尖括号（<>）。

新建数据源

说明

如果您需要在已有的数据源管理任务中进行数据同步，可跳过该步骤，直接新建同步链路，详情请参见创建同步链路。

登录云原生数据仓库AnalyticDB MySQL控制台，在左上角选择集群所在地域。在左侧导航栏，单击集群列表，在湖仓版页签下，单击目标集群ID。
在左侧导航栏，单击数据接入>数据源管理。
单击右上角新建数据源。

在新建数据源页面进行参数配置。参数说明如下表所示：

参数名称	参数说明

参数名称	参数说明
数据源类型	选择数据源类型SLS。
数据源名称	系统默认按数据源类型与当前时间生成名称，可按需修改。
数据源描述	数据源备注描述，例如湖仓应用场景、应用业务限制等。
部署模式	目前仅支持阿里云实例。
SLS Project所在地域	SLS Project所在地域。
是否跨阿里云主账号	SLS数据源支持跨阿里云账号同步SLS数据到AnalyticDB for MySQL。不跨账号：同步当前账号下的SLS数据到AnalyticDB for MySQL。跨账号：同步非当前账号下的SLS数据到AnalyticDB for MySQL。选择跨账号同步数据时，需要填写跨阿里云主账号和跨阿里云主账号角色名。说明跨阿里云主账号：源端所属的阿里云账号ID。跨阿里云主账号角色名：源端创建的RAM角色名。即步骤一中创建的RAM角色。
SLS Project	源端SLS的Project。重要 SLS Project列表中会展示阿里云账号（主账号）与RAM用户（子账号）下所有的Project。若选择阿里云账号的Project，请确保RAM用户有该Project的权限，否则数据无法同步到中AnalyticDB for MySQL。
SLS Logstore	源端SLS的Logstore。

参数配置完成后，单击创建。

创建同步链路

在左侧导航栏，单击SLS/Kafka数据同步。
在右上角，单击新建同步链路。

在新建同步链路页面，进行数据源的数据源及目标端配置、目标库表配置和同步配置。

数据源及目标端配置的参数说明如下：

参数名称	参数说明

参数名称	参数说明
数据链路名称	数据链路名称。系统默认按数据源类型与当前时间生成名称，可按需修改。
数据源	选择已有的SLS数据源，也可新建数据源。
目标端类型	目前仅支持数据湖-OSS存储。
OSS路径	AnalyticDB for MySQL湖仓数据在OSS中的存储路径。重要展示的Bucket是与AnalyticDB for MySQL集群同地域的所有Bucket，您可以任意选择其中一个。请谨慎规划存储路径，创建后不允许修改。建议选择一个空目录，且不能与其他任务的OSS路径有相互前缀关系，防止数据覆盖。例如，两个数据同步任务的OSS路径分别为oss://adb_demo/test/sls1/和oss://adb_demo/test/，OSS路径有相互前缀关系，数据同步过程中会有数据覆盖。

目标库表配置的参数说明如下：

参数名称	参数说明

参数名称	参数说明
库名	同步到AnalyticDB for MySQL的数据库名称。如果不存在同名数据库，将新建库；如果已存在同名数据库，数据会同步到已存在的数据库中。库名命名规则，详见使用限制。
表名	同步到AnalyticDB for MySQL的表名称。如果库中不存在同名表，将新建表；如果库中已存在同名表，数据同步会失败。表名命名规则，详见使用限制。
Schema字段映射	默认会从日志服务的投递任务配置中获取字段，如LogStore没有配置投递任务，会默认根据最近的日志数据获取字段。支持的数据类型：BOOLEAN、INT、BIGINT、FLOAT、DOUBLE、STRING。支持同步SLS保留字段，详情请参见保留字段。重要暂不支持修改目标端字段名。若任务启动运行过（包含启动运行中和已启动运行完成），不支持修改已有列信息，但支持添加新列。若任务仅创建但未启动运行，则可正常修改。
分区键设置	为目标表设置分区键。建议按日志时间或者业务逻辑配置分区，以保证入湖与查询性能。如不设置，则目标表默认没有分区。目标端分区键的格式处理方法分为：时间格式化和指定分区字段。按日期时间分区，分区字段名请选择一个日期时间字段。格式处理方法选择时间格式化，选择源端字段格式和目标分区格式。AnalyticDB for MySQL会按源端字段格式识别分区字段的值，并将其转换为目标分区格式进行分区。例如，源字段为gmt_created，值为1711358834，源端字段格式为秒级精度时间戳，目标分区格式为yyyyMMdd，则会按20240325进行分区。按字段值分区，格式处理方法请选择指定分区字段。

同步配置的参数说明如下：

参数名称	参数说明

参数名称	参数说明
增量同步起始消费位点	同步任务启动时会从选择的时间点开始消费SLS数据。取值说明：最早位点（begin_cursor）：自动从SLS数据中最开始的时间点消费数据。最近位点（end_cursor）：自动从SLS数据中最近的时间点获取数据。自定义点位：您可以选择任意一个时间点，系统则会从SLS中第一条大于等于该时间点的数据开始消费。
Job型资源组	指定任务运行的Job型资源组。
增量同步所需ACU数	指定任务运行的Job型资源组ACU数。最小ACU数为2，最大ACU数为Job型资源组可用计算最大资源数。建议多指定一些ACU数，可以提升入湖性能及任务稳定性。说明创建数据同步任务时，使用Job型资源组中的弹性资源。数据同步任务会长期占用资源，因此系统会从资源组中扣除该任务占用的资源。例如，Job型资源组的计算最大资源为48 ACU，已创建了一个8 ACU的同步任务，在该资源组中创建另一个同步任务时，可选的最大ACU数为40。
高级配置	高级配置可以让您对同步任务进行个性化的配置。如需进行个性化配置，请联系技术支持。

上述参数配置完成，单击提交。

启动数据同步任务

在SLS/Kafka数据同步页面，选择创建成功的数据同步任务，在操作列单击启动。
单击右上角查询，状态变为正在启动即数据同步任务启动成功。

数据分析

同步任务成功后，您可以通过Spark Jar开发对同步到AnalyticDB MySQL的数据进行分析。Spark开发的相关操作，请参见Spark开发编辑器和Spark离线应用开发。

在左侧导航栏，单击作业开发 > Spark Jar 开发。

在默认模板中输入示例语句，并单击立即执行。

-- Here is just an example of SparkSQL. Modify the content and run your spark program.

conf spark.driver.resourceSpec=medium;
conf spark.executor.instances=2;
conf spark.executor.resourceSpec=medium;
conf spark.app.name=Spark SQL Test;
conf spark.adb.connectors=oss;

-- Here are your sql statements
show tables from lakehouse20220413156_adbTest;

可选：在应用列表页签中，单击操作列的日志，查看Spark SQL运行的日志。

管理数据源

在数据源管理页面，您可以在操作列执行以下操作。

操作按钮	说明

操作按钮	说明
新建链路	快捷跳转到创建此数据源下的数据同步或数据迁移任务。
查看	查看数据源的详细配置。
编辑	编辑数据源属性，如更新数据源名称、描述等。
删除	删除当前数据源。说明当数据源下存在数据同步或数据迁移任务时，此数据源无法直接删除，需先在SLS/Kafka数据同步页面，单击目标同步任务操作列的删除，删除数据同步或数据迁移任务。

前提条件

注意事项

计费说明

使用流程

配置RAM授权

新建数据源

创建同步链路

启动数据同步任务

数据分析

管理数据源

销售支持

客户支持

聆听 & 举报违规

关于阿里云

阿里云全球基础设施

快速入门

全球办事处

2024年巴黎奥运会 New

罗兰加洛斯球场 - 岁月沉淀的辉煌 New

协和广场 - “打破”障碍 New

马恩河畔韦尔水上运动体育场 - 可持续的体育运动 New

国际广播中心 - 优质图像、声音和数据触达数十亿观众 New

客户成功案例 New

阿里云信任中心

合规计划

云合规资源

合规常见问题

云产品快报 New

Cloud Forward

新闻报道

阿里云电子期刊 New

阿里云调研分析报告

公告

阿里云出海业务 New

“橙”云出海服务联盟

Asia Accelerator Hot

信息合规

China Gateway - MLPS 2.0 合规 New

China Gateway - 网络

China Gateway - 全球应用加速 New

China Gateway - 安全

China Gateway - 数据安全 New

ICP支持服务 Hot

China Gateway - 全域数据中台 New

China Gateway - 一方数据中台 New

China Gateway - 业务中台 New

China Gateway - 智能客服解决方案 New

China Gateway - 在线教育

China Gateway - 域名注册

在阿里云工作

经验丰富的专业人士

学生和毕业生

免费试用

定价

优惠中心

降价

花钱更少，部署更多

FinOps

云服务器 ECS

轻量应用服务器 SAS

GPU 云服务器

无影云电脑 EDS

对象存储 OSS

云企业网 CEN

Web 应用防火墙 WAF

域名

容器计算服务 ACS

办公安全平台 SASE

智能媒体服务 IMS

边缘安全加速 ESA（原DCDN）

智能媒体管理 IMM

专属钉钉

宜搭

大模型服务平台（百炼）

Apsara Prime - 轻松选择云产品

阿里云 ECS-满足您所有云主机需求

1TB CDN — 立即获取免费的 1 TB 出站流量套餐

安全 — 受到攻击？ 获取免费安全支持

短信服务 - 现已免费开放测试

云服务器 ECS Hot

云盒

计算巢服务

专有宿主机 Hot

弹性裸金属服务器（神龙）

GPU 云服务器 Featured

轻量应用服务器 SAS Hot

弹性伸缩

无影云手机 Beta

无影云电脑 EDS Featured

批量计算

弹性高性能计算 E-HPC

超级计算集群 SCC

函数计算 FC

安全 — 受到攻击？获取免费安全支持