您可以通过实例任务列表查看实例变更任务信息,包括实例的变更进度(例如实例的创建、重启、配置变更)和数据迁移进度。
背景信息
实例任务进度仅显示当前正在进行中的变更进度详情,以及最近一次变更完成的任务详情。如果您需要查看更多历史变更情况,请前往变更记录页面,详细信息请参见查看变更记录。
操作步骤
- 登录阿里云Elasticsearch控制台。
- 在左侧导航栏,单击Elasticsearch实例。
- 进入目标实例。
- 在顶部菜单栏处,选择资源组和地域。
- 在左侧导航栏,单击Elasticsearch实例,然后在Elasticsearch实例中单击目标实例ID。
- 单击右上角的图标,在任务列表页面,查看实例变更进度和数据迁移进度。
查看实例变更进度
单击变更进度页签,查看变更任务的进度详情。说明 每次触发实例变更后,变更任务列表会有10秒左右的延迟,请耐心等待。参数/操作 说明 变更开始时间 用户操作触发实例变更的开始时间。 变更类型 用户操作触发集群的变更类型,例如创建实例、重启实例、集群配置变更。 变更角色 触发实例变更的阿里云账号ID或RAM用户ID。 变更状态 支持3种状态:进行中、已完成、变更中断。 单击对应变更任务左侧的图标,可查看变更任务所处阶段及各阶段的进度详情,具体说明如下:- 在每个阶段,系统会展示当前阶段进行的具体进度以及已耗时时间,已完成的变更阶段会展示完成时间。
- 对于变更节点阶段,系统会展示每个节点滚动更新过程中包含的子阶段。子阶段包含:等待集群状态、变更节点规格、准备节点配置拉起服务、等待进程健康。
注意 当集群状态不稳定或不健康时,变更进度可能会在等待集群状态或等待进程健康两个阶段有较长的等待时间,为了提高变更效率,建议尽量降低业务读写,保证变更任务顺利进行。
操作 - 展开详情:单击展开详情,可以查看此次变更操作的具体配置信息。
- 查看日志:单击查看日志,跳转到日志查询页面查看实例的操作日志,详情请参见查询日志。
- 中断变更/恢复变更(仅对变更中实例有效):单击中断变更,可暂停变更任务。变更中断后,可单击恢复变更,继续完成之前的变更任务。
注意
- 实例处于变更中断状态时,可能会导致集群服务受到影响,此时可通过二次变更或手动操作恢复变更 。二次变更支持集群升配和插件管理。
- 触发恢复变更操作后,整个重启流程会重新执行一遍,集群中的节点会再进行一次重启,请耐心等待。
查看变更记录 单击查看变更记录,可跳转至变更记录页面查看更多历史变更记录,详细信息请参见查看变更记录。 刷新 单击刷新,可获取实例变更的实时状态。 查看数据迁移进度
单击数据迁移进度页签,查看实例的迁移任务进度详情。说明- 当前实例中有数据迁移任务时,数据迁移进度页签右上角会有红点标记。
- 只有当集群的配置变更触发了集群rolling,而且rolling过程中包含用户数据迁移任务时,才会显示迁移任务进度详情。
- 控制台中展示的数据迁移进度有延迟,并非实时显示。如果您需要查看精准迁移进度,可通过
GET _cat/recovery
命令查看。
当有迁移任务时,您可以在数据迁移进度页签单击调整迁移进度,调整数据迁移变更参数,具体可调节的参数说明如下。参数 对应的原生配置 说明 适用于shard数量多的场景 同时恢复主分片数 cluster.routing.allocation.node_initial_primaries_recoveries 节点重启时允许同时恢复的主分片个数。如果节点中有多个磁盘且I/O压力不大,可以适当增大该值。 同时运行数据均衡任务数 cluster.routing.allocation.cluster_concurrent_rebalance 集群内同时运行的数据均衡任务个数。适用于在有节点增减且集群负载压力不高的场景下进行调整。 同时运行的数据恢复任务 cluster.routing.allocation.node_concurrent_recoveries 节点除了主分片重启恢复以外的其他情况下,允许同时运行的数据恢复任务个数。 并发传入的碎片恢复数 cluster.routing.allocation.node_concurrent_incoming_recoveries 节点上最大接受的分片恢复并发数。一般指分片从其他节点恢复至本节点。 适用于数据量大的场景 节点数据传输宽带 indices.recovery.max_bytes_per_sec 设置每个节点数据恢复时传输的最大带宽,例如100mb。 注意- 参数调整仅在变更过程中临时生效,为保证集群变更的稳定性,变更过程中后端会根据集群情况恢复默认值设置。
- 以上参数均为Elasticsearch集群的动态参数设置,建议在数据量大、数据恢复慢的情况下适当调整以加快数据迁移进度。请谨慎调整,如果频繁调整或调整超出集群可承受调度的能力,可能对集群节点负载压力造成风险。