上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第4章 服务质量目标
作者:Chris Jones、John Wilkes、Niall Murphy、Cody Smith
编辑:Betsy Beyer
如果不详细了解服务中各种行为的重要程度,并且不去度量这些行为的正确性的话,就无法正确运维这个系统,更不要说可靠地运维了。那么,不管是对外服务,还是内部API,我们都需要制定一个针对用户的服务质量目标,并且努力去达到这个质量目标。
在这个过程中,我们需要利用一些主观判断结合过去的经验以及对服务的理解来定义一些服务质量指标(SLI)、服务质量目标(SLO),以及服务质量协议(SLA)。这三项分别是指该服务最重要的一些基础指标、这些指标的预期值,以及当指标不符合预期时的应对计划。事先选择好合适的指标有助于在故障发生时帮助SRE进行更好地决策,同时也为SRE团队判断系统是否正常工作提供帮助。
本章描述了SRE团队在指标建模、指标选择,以及指标分析上采用的基本框架。我们会采用前文介绍的莎士比亚搜索服务作为示例来展开讨论,具体详见第2章的“莎士比亚搜索服务”。