問題描述
阿里雲雲資料庫RDS MySQL執行個體由於臨時檔案佔用磁碟空間較多,導致執行個體的運行狀態為“鎖定中”。
問題原因
MySQL執行個體可能會由於查詢語句的排序、分組、關聯表產生的暫存資料表檔案,或者大事務未提交前產生的binlog cache檔案,導致執行個體磁碟空間滿。為避免資料丟失,RDS會將執行個體鎖定,在鎖定之後,將無法進行寫入操作。
解決方案
在緊急情況下建議擴容執行個體儲存空間,擴容後需要耐心等待一段時間(5分鐘左右),方可解鎖執行個體,關於如何升級執行個體配置,請參見變更配置。
若您無法擴容執行個體儲存空間,可以重啟執行個體,釋放臨時檔案。詳情請參見重啟執行個體。
如果重啟執行個體後,仍然不能解鎖,請參考以下操作處理:
通過DMS串連執行個體。
執行以下SQL語句,查看資料庫的會話。
show processlist
單擊顯示結果中的State,進行狀態排序,在狀態列查看是否有大量“Copy to tmp table”、“Sending data”等資訊,然後記錄該會話的ID值。
執行以下SQL語句,終止會話。
kill [$ID];
說明[$ID]為上一步擷取的ID值,注意確認終止該會話不會影響業務。
後續維護
若鎖定問題已解決,請參考以下步驟,預防再次出現鎖定問題:
在資源不足時,執行個體自動擴容儲存空間,詳情請參見設定儲存空間自動擴容。
針對查詢產生的臨時檔案,應該最佳化SQL語句,避免頻繁使用order by、group by操作,可以適當的將tmp_table_size和max_heap_table_size值調大,但是為了減少磁碟使用而調高tmp_table_size和max_heap_table_size並不明智,因為記憶體資源遠比磁碟資源寶貴。您可以通過explain加SQL語句查看是否使用內部暫存資料表,樣本如下,在Extra欄位中有“Using temporary”字樣,則代表會使用內部暫存資料表。
explain select * from alarm group by created_on order by default;
系統顯示類似如下。
針對binlog cache,應該減少執行大事務的情況,尤其應該減少在多個串連同時執行大事務的情況,如果大事務比較多,可以適當將binlog_cache_size值調大,但是同樣不建議為了節省磁碟空間調整這個參數,建議使用短串連執行大事務,降低臨時空間開銷。
建議您監控磁碟使用率,及時清理資料或進行資料拆分,使磁碟使用率不超過80%。
更多資訊
若您暫時無法清理臨時檔案進行解鎖,您可以清理其他類型的檔案,降低磁碟空間使用率,如下所示:
常見問題
Q:如果執行個體基本資料頁中,重啟執行個體按鈕不可用,該如何處理?
A:您可以通過如下方式觸發執行個體重啟:
- 訪問RDS執行個體列表,在上方選擇地區,然後單擊目標執行個體ID。
在左側導覽列單擊參數設定。
在可修改參數標籤頁,查看是否重啟列,找到一個該列取值為是的參數進行修改。