雲資料庫ClickHouse的營運事件(例如小版本升級、網路升級等)除了通過郵件或站內信通知之外,還會在控制台進行通知。您可以在計劃內事件中,查看具體的叢集ID、事件類型、地區、事件原因和業務影響等,也可以手動修改計劃切換時間。
注意事項
雲資料庫的待處理事件(如版本升級、網路升級等)通常至少在執行前的3天通知您,通知方式為郵件、站內信或控制台等。
緊急風險修複類事件由於需要儘快修複,通常會在執行前的3天或更短的時間內發送通知並修複。
為了確保您及時能收到相應的事件通知訊息,請確認雲資料庫故障或營運通知的通知開關處於開啟狀態並設定了訊息接收人(建議設定為資料庫營運人員)。您可以登入訊息中心查看通知開關和設定訊息接收人。
操作步驟
在頁面左上方,選擇目標地區。
在左側導覽列,單擊事件管理。
說明強制要求預約時間的營運事件會彈窗提醒,請儘快完成預約。
在計劃內事件頁面,可以查看事件的詳細資料。
例如目標執行個體ID、地區、事件類型、事件原因、業務影響、計劃切換時間和運行狀態等資訊。關於事件的產生原因及對業務的影響,請參見事件的原因與影響。
可選:修改切換時間。
重要為規避對叢集可用性影響較大的風險,在某些事件下發時,將附帶預設的切換時間。如未對事件進行任何修改操作,該事件將在預設切換時間內執行。您可以根據業務情況選擇修改該切換時間或取消該事件。
除了系統預設切換時間以外,您可以修改計劃切換時間或配置周期切換時間。系統將按照計劃切換時間 > 周期切換時間 > 系統預設切換時間的優先順序執行切換。
切換時間方式及說明
操作步驟
計劃切換時間
可以根據實際需要,提前或延遲目標事件的計劃切換時間。
在計劃內事件列表中,選擇目標事件(一個或多個)。
單擊計劃內事件列表左下方的計劃時間配置。
在計劃時間配置面板,設定計劃切換時間。
若您需要立即執行切換,請選中設定最早執行時間,確定後叢集將立即開始執行切換準備,若此時已準備完成,將立即切換。
說明計劃切換時間不能晚於最晚操作時間。
確認需要進行切換的任務是否正確。
是:單擊確定儲存。
否:在計劃內事件列表中,選中正確的目標事件,然後重新設定計劃切換時間。
周期切換時間
設定周期切換時間後,會在指定周期切換時間點時,對計劃內所有未執行且未設定計劃切換時間的事件執行切換。
例如設定周期切換時間為周二 00:00:00,計劃內的多個叢集將在相同時間執行切換,降低因切換帶來的影響。
單擊計劃內事件列表右上方的周期時間視窗配置。
在周期時間視窗配置面板,您可以根據業務需要按周或月兩個維度設定周期切換時間。
說明您可以在計劃內事件列表右上方查看設定的周期切換時間。如果您設定的周期時間為無,則不展示。
單擊確定儲存。
可選:取消切換計劃。
在計劃內事件列表中,選擇目標事件(一個或多個)。
單擊頁面左下方的取消計劃配置。
在取消計劃配置面板,仔細閱讀操作取消風險。
單擊確定。
事件的原因與影響
為了規避已知的核心問題,提升您使用叢集的體驗,建議定期升級叢集核心的小版本。不同版本的叢集,事件影響不同。
社區相容版:Zookeeper的核心版本升級和ClickHouse的核心版本升級為不同事件,當營運事件執行後對應服務會被升級為最新版本。社區相容版叢集的小版本升級事件的具體原因,請參見社區相容版。
企業版:小版本營運事件執行後會將Keeper服務和ClickHouse服務一起升級到最新版本。企業版叢集的小版本升級事件的具體原因,請參見企業版。
事件原因 | 影響類型 | 影響說明 |
小版本升級(社區相容版ZooKeeper) |
| 進入計劃切換時間後,整個升級過程大約2~3分鐘。建議您在業務低峰期進行升級,並保證業務有重試機制。具體影響如下: 升級過程中因ZooKeeper節點無法工作,在叢集中針對分布式表、ReplicatedMergeTree引擎表的讀寫操作會無法正常進行(包括查詢、插入以及已經建立的通過Kafka引擎同步分布式表等操作)。 |
小版本升級(社區相容版ClickHouse) |
| 進入計劃切換時間後,整個升級過程大約需要5到8分鐘,具體時間和叢集的庫表數量以及資料量有較大關係,庫表數量和資料量較大時,耗時會更久。建議您在業務低峰期進行升級,並保證業務有重試機制。具體影響如下:
|
小版本升級(企業版) | 叢集閃斷 | 進入計劃切換時間後,整個升級過程大約需要10到15分鐘,具體時間和叢集的庫表數量以及資料量有較大關係,庫表數量和資料量較大時,耗時會更久。建議您在業務低峰期進行升級,並保證業務有重試機制。具體影響如下: 升級過程中會針對Keeper、ClickHouse計算節點進行分批重啟升級,過程中會涉及到請求路由在不同節點中切換的現象,因此叢集會有秒級閃斷。 |
網路升級 | 叢集閃斷 | 進入計劃切換時間後,整個升級過程大約1~2分鐘(其中業務影響為秒級)。建議您在業務低峰期進行升級,並保證業務有重試機制。具體影響如下: 升級過程中叢集會自動進行網路模式的切換,可能導致當前已建立的資料庫連接斷開,重新嘗試即可恢複串連。 |
執行個體節點營運 |
| 進入計劃切換時間後,整個節點營運修複過程大約需要5到10分鐘,具體時間和叢集的庫表數量以及資料量有較大關係,庫表數量和資料量較大時,耗時會更久。建議您在業務低峰期進行節點營運修複操作,並保證業務有重試機制。具體影響如下:
|