1.1.1 国外IT运维现状分析
相对而言,国外IT运维管理的理念、方法和技术框架较为先进和体系化,体现在技术工具、管理体系和运维组织等各方面。
1.运维技术维度
在运维技术方面,基于Gartner的《2021基础架构运维管理自动化技术曲线报告》,以管窥豹,进行国外IT运维现状的分析和解读。
1)已经进入实质生产的高峰期的技术:这个时期的技术包括ITIL(Information Technology Infrastructure Library,信息技术基础架构库)、云应用发现、云迁移和云管平台等。
2)正处于稳步爬升的光明期的技术:这个时期的技术包括持续配置自动化、DevSecOps、基础架构管理服务的信息安全、SOAP等。
3)正处于泡沫化的低谷期或者正向低谷期演进的技术:这个时期的技术包括软件资产管理工具、基于意图的网络、不可变基础设施、DevOps(Development & Operations)工具链、网络自动化、超级自动化、可组合的基础架构、持续交付、容器管理、I&O智能自动化、云数据备份等。
4)正处于过高期望的峰值的技术:这个时期的技术包括SRE(Site Reliability Engineering,站点可靠性工程)、基础架构自动化、可观测性、SaaS管理平台、可编程的基础架构、智能运维(Artificial Intelligence for IT Operations,AIOps)平台等。
5)正处于诞生的促动期的技术:这个时期的技术包括平台化运营、持续合规自动化、混沌工程、混合数字化基础设施管理、DevOps服务价值交付平台、DevOps服务价值管理平台、智能化ITSM(Information Technology Service Management,信息技术服务管理)、代码即策略的GitOps等。
对这些技术进行分析发现,国外IT运维呈现明显的三大阶段:
❑以ITIL为指导的IT服务体系和以云管系统为云操作的运维管理体系已经成熟。
❑以自动化运维为目标的各类自动化运维系统和工具已逐步趋向成熟。
❑以数字化和智能化为导向的运维管理和运维方式依然处于上升期。
对于已经成熟的技术,我们可以大胆采用,小心落地;对于正在成熟的技术,则要仔细辨别,选择性落地;而对于处于上升期的技术,最好继续观望,试点性探索。
2.运维服务维度
在运维服务维度,国外的运维服务标准已经进化到ITIL 4阶段,强调以运维价值为中心的敏捷ITSM体系建设。针对敏捷ITSM建设理念,国外的知名厂商虽然理解各有不同,但大体相似。全球排名第一的ITSM厂商ServiceNow对敏捷ITSM的主要理解如下:
1)统一平台与内容整合:实现多来源的流程、数据、基础设施和工作流等的整合,打破竖井。整合之后,对于用户而言,一个运维平台即可搞定所有运维工具。
2)整体能见度:需要实现运维服务的整体能见度高,以及基于数据的决策。
3)敏捷与快速:快速响应业务的变化;通过调整从维护到创新的预算来提高生产力。
4)协作与沟通:全方位、实时地协作与沟通。
5)用户体验:员工体验的消费化与满意度。
6)数字化运营报告:需要实现信息技术管理方式的现代化,以及体现服务管理绩效透明度的报告。
7)IT与企业服务整合:能够实现向用户提供全方位的服务,以及ITSM和ESM(Enterprise Service Management,企业服务管理)的整合。
总体而言,当前国外的运维服务理念强调以稳定的业务系统运行保障和良好的用户体验支撑为价值导向,通过ITSM与ITOM(Information Technology Operation Management,信息技术运营管理)的融合,实现服务管理实践场景、运维数据和运维执行的融合,从而实现外部用户服务请求和业务系统状况响应的敏捷性。
3.运维组织维度
国外的运维组织形式多样,包括敏捷运维组织、SRE运维组织和传统职能运维组织等。当前很多企业从传统职能运维组织向敏捷运维组织和SRE运维组织转变。例如荷兰ING银行从传统职能运维组织往敏捷运维组织转型,Google公司则选择往SRE运维组织形态发展。
传统金融机构荷兰ING银行于2015年6月首次在总部引入敏捷的工作方式,并在一年后将其扩展到极少运用敏捷方法的IT基础设施和运营领域。这一举措不仅让银行IT运营更快速、更稳定,也大大提升了工作效率和员工参与度。
知名互联网公司Google是SRE的提出者和践行者。Google公司通过组建SRE团队,实现工程化的、高效的运维服务。但是,依然有大量的公司使用传统的职能式组织模式来进行日常的运维服务。