性能度量了系统在单元环境内承载工作负载的效率,系统性能通常可以由 QPS、并发和RT(响应时间)等典型指标来衡量。在传统 IT 环境中,系统的容量评估和规划是系统设计的重要环节,通常会基于系统对峰值负载表现出来的性能承载能力来给系统选择合适的节点数量规划,在双活系统中考虑到 failover 会需要给单节点设计更大的冗余,对于过载的场景也需要有过载控制相关功能模块来避免整体宕机。这个设计的环节是相对固定和长周期的工作,因为往往节点的部署和交付都是相对长周期的工作。
在云的基础设施环境中,灵活的弹性功能很好地解决了传统 IT 环境中的痛点,将容量评估和线上扩容变得相对简单,同时也为高性能设计带来了更多选项和复杂性。除了设计层面的容量评估和灵活弹性,实现层面的性能测试、性能监控和性能优化之外,充分发挥云产品因为技术迭代带来的性能红利同样成为高性能系统需要考量的重要因素。本章节会全面描述基于云基础设施的高性能系统设计、实施和优化等环节,包括如下主要内容:
高性能架构设计:包括高性能架构常见设计准则、业务适应规格和类型、可伸缩和可扩展、性能层面部分架构设计最佳实践和挑战和注意事项等内容。
性能测试:包括性能测试介绍、性能测试的适用场景和性能测试最佳实践等内容。
性能监控:包括为什么需要性能监控、什么是性能监控和性能监控最佳实践等内容。
常见性能优化手段:包括弹性计算优化、网络优化、数据库优化和架构优化等内容。