云原生内存数据库Tair的集群架构和读写分离架构中,代理服务器(Proxy)承担着路由转发、负载均衡与故障转移等职责,可以帮助您简化客户端的逻辑,同时支持多数据库(DB)、缓存热点数据等高级功能。通过了解Proxy的路由转发规则和特定命令的处理方式,有助于您设计更高效的业务系统。
Proxy介绍
代理服务器(Proxy)是Tair实例中的一个组件(单节点架构),不会占用数据分片的资源,通过多个Proxy节点实现负载均衡及故障转移。
Proxy能力 | 说明 |
集群版使用模式转换 | Proxy能够实现架构转换,帮助您如同在使用标准架构一样地使用集群架构。Proxy支持对DEL、EXISTS、MGET、MSET、SDIFF与UNLINK等命令进行跨Slot的多Key操作,更多信息请参见代理模式(Proxy)支持的命令列表。 当标准架构无法支撑业务发展时,您无需修改代码即可将标准架构的数据迁移至带有Proxy的集群架构,大幅度降低业务改造成本。 |
负载均衡和路由转发 | Proxy与后端的数据分片建立长连接,负责请求负载均衡和路由转发操作,关于转发规则的介绍,请参见Proxy的路由转发规则。 |
管理只读节点流量 | Proxy会实时探测只读节点的状态,当出现下述情况时,Proxy会执行流量管控动作:
|
缓存热点Key信息 | 开启代理查询缓存功能(Proxy Query Cache)后,Proxy会缓存热点Key对应的请求和返回信息,当在有效时间内收到同样的请求时直接返回结果至客户端,无需和后端的数据分片交互,可更好地改善对热点Key的发起大量读请求导致的访问倾斜。更多信息,请参见通过Proxy Query Cache优化热点Key问题。 说明 仅Tair内存型、持久内存型实例支持该功能。 |
支持多数据库(DB) | 集群模式下,原生Redis和Cluster client均不支持多数据库(DB)功能,只使用默认的 说明 若您使用StackExchange.Redis客户端,请使用StackExchange.Redis 2.7.20及以上版本,否则会产生报错,更多信息请参见StackExchange.Redis升级公告。 |
由于Proxy的演进,Proxy的个数并不完全代表Proxy处理能力,阿里云会保证集群规格中Proxy的配比符合规格说明的要求。
Proxy的路由转发规则
关于各类命令的介绍,请参见Tair命令支持概览。
架构 | 转发规则 | 说明 |
集群架构 | 基础转发规则 |
|
特定命令转发规则 |
| |
读写分离架构 | 基础转发规则 |
|
特定命令转发规则 |
|
连接数使用说明
通常情况下,Proxy通过与数据分片建立长连接来处理请求。当请求中包含以下命令时,Proxy会根据命令的处理需求在相应的数据分片上创建额外的连接,此时连接无法聚合,实例的最大连接数和每秒新建连接数都会受到数据节点单个分片的限制(单个分片的限制请参见具体的实例规格)。您需要合理使用下述命令,避免连接数超限。
代理模式下,Tair实例每个数据分片的连接数上限为30,000。
阻塞类命令:BRPOP、BRPOPLPUSH、BLPOP、BZPOPMAX、BZPOPMIN、BLMOVE、BLMPOP、BZMPOP。
事务类命令:MULTI、EXEC、WATCH。
MONITOR类命令:MONITOR、IMONITOR、RIMONITOR。
订阅命令:SUBSCRIBE、UNSUBSCRIBE、PSUBSCRIBE、PUNSUBSCRIBE、SSUBSCRIBE、SUNSUBSCRIBE。
常见问题
Q:是否支持将只进行读操作的Lua脚本转发至只读节点吗?
Q:代理(Proxy)模式和直连模式有什么区别,推荐使用什么模式?
A:推荐使用代理模式,介绍与区别如下:
代理模式:客户端的请求由代理节点转发至数据分片,可享受代理节点带来的负载均衡、读写分离、故障转移、代理查询缓存、长连接等特性能力。
直连模式:可通过直连地址绕过代理,直接访问后端的数据分片(类似连接原生Redis集群)。相比代理模式,直连模式节约了通过代理处理请求的时间,可以在一定程度上提高Tair服务的响应速度。
Q:如果后端的某个数据分片出现异常,对数据读写有什么影响?
A:数据分片均采用主备高可用架构,当主节点发生故障后,系统会自动进行主备切换保证服务高可用。在特别极端场景下某个数据分片出现异常后,对数据的影响及优化方案如下。
场景
影响与优化方案
影响:
客户端通过4个连接发送4个请求,当数据分片2处于异常状态时,仅有请求1(GET Key1可正常读取到数据),其他请求会访问到数据分片2会返回超时。
优化方案:
降低多Key命令(例如MGET)的使用频率,或降低一次请求中包含的Key的数量,避免因单个数据分片异常导致该请求全部返回失败。
降低事务类命令的使用频率或降低事务大小,避免因某个子事务失败导致整个事务失败。
影响:
客户端通过1个连接分别发送2个请求,当数据分片2处于异常状态时,请求2(GET Key2)将返回超时,同时由于请求1(GET Key1)和请求2共用同一连接,导致请求1也无法正常返回。
优化方案:
避免或降低对pipeline的使用。
避免使用单连接的客户端,推荐使用连接池的客户端,例如Jedis、TairJedis等(需设置合理的超时时间和连接池大小)。