智能运维之道:基于AI技术的应用实践
上QQ阅读APP看书,第一时间看更新

1.2 智能运维的发展历程及趋势

1.2.1 推动运维工作发展的内外部力量

运维工作如今已经发展到智能运维阶段(AIOps)。经历了人工运维、自动化运维两个阶段后,推动运维工作发展主要有两种力量:内部驱动力、外部牵引力,如图1-2所示。

图1-2 推动运维向前发展的内部和外部力量

内部驱动力是指随着业务越来越繁杂,传统的人工运维方式逐渐到达其生产力的极限,内部逐渐增加的运维需求越来越得不到满足而产生的矛盾,产生一股强大的倒逼力量,促使运维人员进行创新,通过提高技术水平来增加生产力。业务的繁杂主要表现在运维需求的复杂多变、调用关系的错综复杂、频繁地变更发布、运维数据的剧增、运维专家经验的主观性等5个方面。

外部牵引力是指刺激运维工作向前发展的外部力量,主要有以下3种。

1)国家宏观政策。比如当前国家“十四五”规划正在大力推进企业数字化转型、新基建、人工智能等战略,会指导吸引市场资本进入这些领域,进行人才和技术的产业升级,推动行业的发展。

2)企业战略。企业会紧随国家政策和产业变革不断升级企业IT战略,应用前沿技术,实施企业数字化转型,升级传统运维生产力。

3)技术进步。前两种力量属于宏观非技术力量,它们需要依托第3种技术力量。没有技术力量,或者技术还未发展到可用的程度,前两种力量也无法产生效果。好比没有AI算力的提升,大规模深度模型的训练迭代是不可能在多个领域成熟落地的。

外部牵引力和内部驱动力对传统运维工作均具有正向推动作用,但外部牵引力并不像内部驱动力那样,每时每刻都表现出百分百的正向作用。例如,外部牵引力中的技术进步这一力量中的,在现有的各种运维场景中,并不都适用。但在如今各类技术名词铺天盖地出现一项:人工智能算法时,投资人关心企业是否有前沿技术、企业领导觉得使用高端算法更能体现企业科技含量、研发人员觉得高级算法更能体现自己的技术水平等,这些因素会促使算法人员花费使用深度学习模型解决一些运维问题。

在不考虑模型精度和研发成本的情况下,各类算法模型单就解释性就让运维人员抓狂并逐渐被放弃使用,回到传统运维方法。这阻碍了运维工作的技术创新。这种现象在企业中十分常见,以至于笔者在对企业进行技术指导时,往往会根据企业发展周期和需求做出两套不同的技术升级方案,一份对内一份对外。本书将在异常检测的案例中提到这两种技术升级方案的选择。