问题描述
阿里云云数据库RDS MySQL实例由于临时文件占用磁盘空间较多,导致实例的运行状态为“锁定中”。
问题原因
MySQL实例可能会由于查询语句的排序、分组、关联表产生的临时表文件,或者大事务未提交前产生的binlog cache文件,导致实例磁盘空间满。为避免数据丢失,RDS会将实例锁定,在锁定之后,将无法进行写入操作。
解决方案
在紧急情况下建议扩容实例存储空间,扩容后需要耐心等待一段时间(5分钟左右),方可解锁实例,关于如何升级实例配置,请参见变更配置。
若您无法扩容实例存储空间,可以重启实例,释放临时文件。详情请参见重启实例。
如果重启实例后,仍然不能解锁,请参考以下操作处理:
通过DMS连接实例。
执行以下SQL语句,查看数据库的会话。
show processlist
单击显示结果中的State,进行状态排序,在状态栏查看是否有大量“Copy to tmp table”、“Sending data”等信息,然后记录该会话的ID值。
执行以下SQL语句,终止会话。
kill [$ID];
说明[$ID]为上一步获取的ID值,注意确认终止该会话不会影响业务。
后续维护
若锁定问题已解决,请参考以下步骤,预防再次出现锁定问题:
在资源不足时,实例自动扩容存储空间,详情请参见设置存储空间自动扩容。
针对查询产生的临时文件,应该优化SQL语句,避免频繁使用order by、group by操作,可以适当的将tmp_table_size和max_heap_table_size值调大,但是为了减少磁盘使用而调高tmp_table_size和max_heap_table_size并不明智,因为内存资源远比磁盘资源宝贵。您可以通过explain加SQL语句查看是否使用内部临时表,示例如下,在Extra字段中有“Using temporary”字样,则代表会使用内部临时表。
explain select * from alarm group by created_on order by default;
系统显示类似如下。
针对binlog cache,应该减少执行大事务的情况,尤其应该减少在多个连接同时执行大事务的情况,如果大事务比较多,可以适当将binlog_cache_size值调大,但是同样不建议为了节省磁盘空间调整这个参数,建议使用短连接执行大事务,降低临时空间开销。
建议您监控磁盘使用率,及时清理数据或进行数据拆分,使磁盘使用率不超过80%。
更多信息
若您暂时无法清理临时文件进行解锁,您可以清理其他类型的文件,降低磁盘空间使用率,如下所示:
常见问题
Q:如果实例基本信息页中,重启实例按钮不可用,该如何处理?
A:您可以通过如下方式触发实例重启:
- 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
在左侧导航栏单击参数设置。
在可修改参数标签页,查看是否重启列,找到一个该列取值为是的参数进行修改。