本文介绍云备份备份客户端的常见网络问题。
背景信息
在非阿里云VPC的各类线下环境中安装备份客户端时,可能遇到各种未知且复杂的网络环境。例如防火墙会阻拦域名或端口的连接导致备份失败,防火墙会限制网络传输速度导致部分请求超时,网络行为检测工具会检测并修改一些HTTP请求内容,上行带宽过小时会导致请求超时甚至备份失败等。
常见网络问题概览
问题 | 诊断工具检测 | 客户端日志 | 问题分析及排查方法 |
控制台显示打开备份库失败 | 通过诊断工具检测,出现如下问题:
| 客户端日志中出现如下相关描述:
| 备份客户端到对应域名的请求失败。可能原因如下:
具体排查方法,请参见请求失败排查方法。 |
控制台显示打开备份库失败 | 通过诊断工具检测,出现如下问题: This is usually a temporary error during hostname resolution and means that the local server did not receive a response from an authoritative server. | 客户端日志中出现如下相关描述: This is usually a temporary error during hostname resolution and means that the local server did not receive a response from an authoritative server. | 对应域名的DNS解析失败。可能原因如下:
具体排查方法,请参见DNS解析失败排查方法。 |
请求失败排查方法
检查网络和云备份接入点域名及端口的连通性。
执行telnet访问对应接入点及端口,确认当前网络中上行(备份)或下行(恢复)可用带宽。
其中接入点可以为云备份客户端问题诊断工具检测到的管控(通信)网络公网域名。例如telnet访问接入点及端口的命令如下:
telnet post-cn-mp90rcien05.mqtt.aliyuncs.com 80
若存在网络监控,请查看网络流量监控在备份、恢复的时间点对应的网络流量情况。
若使用公网,建议咨询运营商或网络管理员了解网络流量情况。
若使用云企业网或阿里云VPN,请在云企业网或阿里云VPN控制台确认带宽以及查看对应监控数据。
根据带宽以及同时进行的任务数,判断是否当前带宽不足导致。
例如上行带宽有20 MB/s,而可用于备份的可能仅有10 MB/s,这种情况若数据量足够大,会导致类似请求失败问题。
若无法确定带宽(主要上行带宽),建议使用ossutil(oss官方工具) probe进行探测,了解网络流量情况。
获取接入点域名、AccessKey。
可以为云备份客户端问题诊断工具检测到的管控(通信)网络公网域名。
下载及安装ossutil。
具体操作,请参见ossutil下载和安装。
探测上传带宽。
创建一个名称为examplebucket的临时Bucket,并上传一个临时文件到examplebucket,并根据当前设备的硬件配置及上传带宽给出上传并发数的配置建议。执行命令如下:
./ossutil64 probe --probe-item upload-speed --bucketname examplebucket
输出如下:
cpu core count:2 parallel:2,average speed:679.72(KB/s),current speed:1344.00(KB/s),max speed:1440.00(KB/s)) parallel:3,average speed:643.31(KB/s),current speed:704.00(KB/s),max speed:1632.00(KB/s)) parallel:4,average speed:646.62(KB/s),current speed:512.00(KB/s),max speed:1600.00(KB/s)) suggest parallel is 2, max average speed is 679.72(KB/s)
若经过上述检查,确实为可用带宽不足的问题导致,建议进行以下操作。
提升带宽配置。
配置超时重试参数,增加超时重试的间隔以及次数,用时间换取带宽,提高备份成功机率。
具体操作,请参见配置数据备份重试次数及间隔。
调整备份任务执行时间,在网络空闲时再执行备份。
若网络中有多个备份客户端及任务,合理错开不同备份任务的执行时间,充分利用带宽。
DNS解析失败排查方法
检查本机DNS配置。
若未配置私有DNS服务器,建议配置为阿里云公共DNS地址
223.5.5.5
。检查防火墙规则,云备份客户端使用的接入点及端口,必须配置白名单或者放行规则。
咨询网络管理员是否有其他限制。
确保到诊断工具提示的地址可以正确解析后,重新尝试备份。