“云成本管理与优化”不是一蹴而就的项目,是一个涵盖企业上云用云全生命周期,关系到企业内部管理机制的体系化工程,是一个反复迭代和持续运营的过程。
根据FinOps官网《What is FinOps》的描述,“FinOps 是一种不断发展的云财务管理学科和文化实践,通过帮助工程师、财务、技术和业务团队协作制定数据驱动的支出决策,使组织能够获得最大的业务价值。”
FinOps 是“Finance”和“DevOps”的合成词,强调业务团队与工程师团队之间的沟通和协作。
FinOps通过Inform、Optimize、Operate三个生命周期阶段实现云成本的可视、优化与持续运营,鼓励实践6大FinOps原则,将众多FinOps能力划分为6大领域,最终通过Crawl(爬行)、Walk(行走)、Run(奔跑)3个程度来衡量实践的成熟度。
“FinOps”在行业中常见的别名有 “云成本管理(cloud cost management)”、“云成本优化(cloud cost optimization) ”、 “云财务管理(cloud financial management)”等。
阿里云云成本管理与优化框架
阿里云在FinOps核心理念基础上,融合自身实践经验,提出更加细化落地的本土化“云上成本管理实施框架”,供企业客户参考实施。
云上成本管理贯穿上云用云全生命周期
从企业上云及用云的历程看,大致可以分为用云计划、用云执行、监控分析、成本优化等阶段,成本管理贯穿各个阶段,每个阶段的关注点各有不同。
用云计划阶段:场景包括企业首次上云、增量上云、存量复购。
做好组织规划:包括企业上云的组织架构梳理、账号体系规划、权限体系规划、企业权益(如优惠、信控)的规划、资金结算关系的规划。
做好财务规划:包括预算编制与规划、财务资产规划(如现金、代金券)、成本规划(如成本权责、分摊规则)、对云服务商的计费方式进行了解和选型(如按量付费、节省计划、抢占式实例、资源包等)。
做好资源规划:包括标签规划、资源容量规划、资源配额规划。
用云执行阶段:场景包括采购执行、用云管云规则执行(包括财务规则设置、资源配额设置等)、商务履约执行(包括对账、充值、开票等)。在用云执行阶段,从财务管理和资源管理两个视角做好成本管理。
财务管理视角:要做好资金、账单、发票的统一管理,并借助云服务商提供的企业级财务管理能力,实现跨组织多账号的统一结算管理和财务资产管理,为了后续监控分析的成本可看清,要通过财务单元做好成本分账规则的设置。
资源管理视角:选择合适的技术选型和资源规格进行采购,可以借助云服务商提供的资源保障和容量预定等能力确保资源的有效获取,并通过配额设置实现企业云资源采购管控。
监控分析阶段:对应FinOps的Inform阶段,主要解决成本分摊与成本可视化问题。
成本分摊:借助平台能力和前序阶段配置的分摊规则实现成本的有效分摊(包括摊销、分账等),是监控、分析甚至优化的前提。
成本监控:通过多种监控手段对成本和资源数据进行监控,并有效预警通知给相关人员,监控手段通常分为两类,基于业务规则(比如基于预算、成本金额、资源使用率等人为设定阈值的预警)和基于人工智能算法(比如无需人为设定阈值、由算法智能识别的异常检测等)。
成本可视化:通过监控预警感知到成本变化时,借助多种可视化工具进行成本分析,找到问题点或优化机会,常见的可视化分析工具包括各类成本或资源报表、预算与实际的对比分析、多维成本统计分析工具等,也可借助成本预测算法观察未来趋势。
成本优化阶段:对应FinOps的Optimize阶段,主要通过计费方式优化、资源使用优化和架构优化来落地执行。
计费方式优化:云服务商通常提供多种计费方式,通过切换不同的计费方式,可以获取到更低的实际折扣、或提升权益资产的使用效率,从而实现成本节约。常见的如按量付费搭配节省计划,可以通过承诺更长时间的消费,获取更低价格;购买合适的资源包,也可以抵扣按量付费流量,从而节约成本。可以借助平台提供的测算工具,对比已购买和未购买的计费方式,切换为更加合适的计费方式。
资源使用优化:优化云资源的使用率,是实现成本优化的有效手段。常见的方法有释放闲置资源、降配低负载资源、升配高负载资源、弹性扩缩容等,通常借助资源监控工具发现优化机会,并结合业务特性、性能、成本等综合考虑后谨慎执行。更多策略方法详见下文。
持续运营:云上成本管理是一个反复迭代和持续运营的过程,企业应持续循环以上四个阶段,形成长效运作机制,使云上成本可以有效管控、持续优化。
人员、工具和机制是云上成本管理的关键要素
人员是基础,业务、财务和技术须协同运作
云成本管理团队是企业实施云成本管理的基础。云成本管理不是某一个角色或某一个团队需要做的事情,而是需要多个角色共同参与,打破原有各管一段,各自为战的传统 IT 管理方式,各角色长期协作共同努力以达到成本长期治理的目标。云成本管理团队需要宣传云成本管理意识和文化,推动云成本管理最佳实践,确定企业云成本管理的方向,协调企业各部门开展成本管理工作。比如,可以定期举行成本管理会议, 回顾和复盘成本管理中遇到的一些问题,从而推动持续改进。
企业组建云成本管理团队需要满足以下三个条件:
人员构成须跨职能:云成本管理团队应由企业各个部门如财务部门、IT 部门、运营部门和业务部门等利益相关者共同组成。
知识体系须完备:成本管理团队需要具有多学科方法,具备项目管理、数据科学、财务分析和软件/基础设施开发等能力,可以对照成本优化目标来衡量各部门的执行和交付能力。
管理层须认可与支持:管理层要成为云成本管理理念的倡导者,为云成本管理团队提供支持,确保按组织确定的优先级开展成本管理活动,确保企业在有效利用云资源的同时,持续创造业务价值。
工具是抓手,监控、分析与调优是必备能力
云成本优化工具是企业实施云成本管理与优化的抓手。云成本管理是一个复杂而耗时的过程,需要将各项能力沉淀到工具。一方面,由于云成本的可变性和多云环境的复杂性,云成本优化基于分析结果和优化策略之上并非所有操作都适合人工完成,企业通过工具可以有效提升对云成本的管理及优化水平。另一方面,成本优化往往是以项目方式实施,由项目制驱动转为体系化的日常自助优化尤为重要。因此,需要将成本管理的能力沉淀为工具或平台,构建可度量指标,驱动实际各相关组织自助降本。
机制是保障,成本意识和奖罚机制双轮驱动
云成本管理相应的长效运营机制在云成本管控中起到关键作用,面对云成本特殊的支出模式和账单结构,企业需要更新一套更加合适的云成本管理流程制度确保优化工作能够在企业内部精确、高效运转。云成本管理流程制度包含三个方面:
对企业内部云成本进行权限管控,包含支出采购、 分配修改等。
对企业云资源各采购账号进行体系管理,包含账单核算、托管代付等。
对企业各类资源或成本进行统一的配额和预算管理,包含资源开通、支出审批等。
企业可以通过提高成本意识和建立奖惩制度来落实云成本管理制度。 企业内部云成本日常运维的主要动力和保障来源于云成本管理制度,一是云成本管理团队需要宣传云成本管理意识和文化,推动云成本管理最佳实践,确定企业云成本管理的方向,协调企业各部门开展成本管理工作。二是建立 KPI 奖罚制度,云成本管理作为绩效考核的项目覆盖所有相关部门, 根据实际情况合理设置优化目标,如资源闲置率、成本节省额度等,对各部门资源使用进行统一价值量化,按照周期内优化成果进行适当奖罚措施。