本文介绍如何通过LOAD DATA将本地数据导入AnalyticDB for MySQL数仓版(3.0)。
语法
LOAD DATA LOCAL
INFILE 'file_name'
[REPLACE | IGNORE]
INTO TABLE table_name
[{FIELDS | COLUMNS}
[TERMINATED BY 'string']
[[OPTIONALLY] ENCLOSED BY 'char']
]
[LINES
[TERMINATED BY 'string']
]
[IGNORE number {LINES | ROWS}]
[(column_name_or_user_var
[, column_name_or_user_var] ...)]
参数
参数 | 说明 |
| 进行本地文件导入操作,支持所有文本文档。 说明
|
| 本地文件的路径,包含文件地址和文件名。 说明 如果 |
| AnalyticDB for MySQL中目标表名。 |
| 导入数据时,遇到主键重复则强制用当前数据覆盖已有数据。 |
| 导入数据时,遇到主键重复或者数据问题时则自动忽略失败行,部分行导入失败但不影响其他行导入。 |
| 定义列分隔符,默认为 |
| 定义每列数据的enclosed符号。 例如,某一列数据为 |
| 定义行分隔符,默认为 |
| 设置导入数据时忽略开始的某几行。 例如 |
| 设置导入的列,如果不设置,默认按照列的顺序来导入数据。
|
注意事项
客户端开启
local-infile
。以mysql-client为例,您需要在
my.cnf
文件中增加以下配置开启local-infile
功能。cat ~/.my.cnf [mysqld] local-infile [mysql] local-infile
更多
my.cnf
文件信息,请参见MySQL官方文档。导入数据时无法保证操作的原子性。
在
IGNORE
模式下,忽略导入失败的数据行。在
REPLACE
模式下,一旦有数据行导入失败,系统将中止后续INSERT
操作,因此可能存在部分行数据导入,部分行数据未导入的情况。
支持通过
SHOW WARNINGS
命令,查看失败行的错误信息。
示例
将本地文件out.bak
中的数据导入AnalyticDB for MySQL的test
表中。out.bak
文件中共有5000行数据,列分隔符为\t
,行分隔符\n
,其中第8行数据存在问题,如下所示。
1 bb
2 bb
3 bb
4 bb
5 bb
6 bb
7 bb
bb 8
9 bb
...
连接AnalyticDB for MySQL集群,通过CREATE DATABASE和CREATE TABLE,在
adb_demo
数据库下创建表test
表,从本地文件导入的数据将存储在test
表中。CREATE TABLE test ( a int NOT NULL DEFAULT '0', b varchar NOT NULL, PRIMARY KEY (a) ) DISTRIBUTED by HASH(a);
在MySQL Client中执行LOAD DATA命令将本地文件
out.bak
中的数据导入AnalyticDB for MySQL的test
表中。在
IGNORE
模式下执行LOAD DATA命令,部分行导入失败但不影响其他行导入。示例如下:LOAD DATA LOCAL INFILE '~/out.bak' IGNORE INTO TABLE test FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' ;
查询导入结果:
SELECT COUNT(1) FROM test;
+----------+ | count(1) | +----------+ | 4999 | +----------+ 1 row in set (0.14 sec)
在
REPLACE
模式下执行LOAD DATA命令,部分行导入失败后立即终止后续导入操作。示例如下:LOAD DATA LOCAL INFILE '~/out.bak' REPLACE INTO TABLE test FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' ;
执行结果如下:
ERROR 1064 (42000): [13000, 2019061210070703000511314203303000266] syntax error :syntax error => IDENTIFIER is not value type pos:34 row: 0 and ceil:0
执行LOAD DATA命令,导入数据时跳过前10条数据。示例如下:
LOAD DATA LOCAL INFILE '~/out.bak' REPLACE INTO TABLE test FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' IGNORE 10 LINES;
返回结果如下:
Query OK, 4990 rows affected (0.37 sec)