慢请求引起的连接超时等问题是影响Redis服务质量的常见问题,云数据库Redis的慢日志系统能够帮助您快速找到慢请求问题发生的位置,定位发出请求的客户端IP,为彻底解决超时问题提供可靠的依据。
背景信息
Tair的慢日志会记录执行时间超过指定阈值的请求,慢日志分为数据节点慢日志和代理慢日志。
慢日志类型 | 说明 | 相关参数 |
---|---|---|
数据节点慢日志 |
|
|
代理慢日志 |
| rt_threshold_ms:设置代理慢日志的阈值,默认为500毫秒。建议将该阈值配置为与客户端超时时间近似的值,推荐为200毫秒到500毫秒。 |
慢日志查看方式
慢日志类型 | 查看方式 |
---|---|
数据节点慢日志 |
|
代理慢日志 | 通过Tair管理控制台或调用OpenAPI查看: |
操作步骤
Tair服务超时的原因通常比较复杂,很多情况下与慢请求相关。您可以按照下述步骤来排查超时问题。
- 当Tair服务出现超时问题,首先查看代理慢日志,详情请参见查询慢日志。说明
- 如果实例为标准架构,请跳转至步骤3分析数据节点慢日志。
- 如果代理慢日志内容为空,您可以排查客户端与Redis实例间的网络状况。
- 定位最早的代理慢日志由哪条命令引发。说明 代理慢日志通常是因为数据节点中出现慢请求,引起命令堆积而导致的。
本案例中,最早出现的慢日志是由一条KEYS命令生成的。右侧的IP地址即为使用这些命令的客户端IP地址。
- 查看数据节点慢日志以确认代理慢日志中的哪些日志引起了超时问题。说明 通常情况下,在代理慢日志中最先产生慢日志的命令,也会在数据节点生成慢日志。数据节点的慢日志一般比代理节点慢日志少,这与二者对执行时间的定义以及慢日志阈值不同有关。
本案例中,查看代理慢日志后,再对比数据节点慢日志,发现也存在KEYS命令产生的慢日志,且没有出现代理慢日志中的其它慢日志,说明真正引起超时即为KEYS命令产生的慢日志。
- 在代理慢日志中,根据上一步骤定位到的命令精确搜索,可找到使用这些命令的客户端IP,随后进行优化。