构建大型银行开放平台系统智能运维
上QQ阅读APP看书,第一时间看更新

2.1 开放平台基础架构的发展形势分析

银行业务的蓬勃发展,使得信息科技在业务发展中的引领作用越来越凸显,信息系统基础架构在银行业的国际化、综合化发展和业务经营转型过程中发挥了有力的支撑作用。开放平台是银行业信息化基础架构的重要领域之一,大型商业银行总行除少数核心业务系统外,应用系统全部基于开放平台构建,一级分行及以下的系统架构全部基于开放平台构建。因此,对开放系统基础架构建设的研究是开放系统运维工作的重要部分,奠定了运维工作开展的基础。

面对国内外银行业以及跨业竞争日益加剧,监管对信息科技风险管控及业务连续性要求不断加强的外部环境,以及不断推进业务经营转型及精细化管理的内部环境,开放平台基础设施建设领域仍然面临诸多困难和挑战,主要表现在以下几个方面。

(1)业务产品的日益增加与资源投入相对不足的矛盾。目前,大型商业银行开放平台每年在总分行新增投产的项目在数以千计的数量级,资源需要量大,而资源采购流程相对较长,部分设备老旧,基础软件版本滞后;同时随着银行业务发展需要及应用部署模式的进一步调整,新型的处理中心和管理中心的出现及“多地多中心”的建设,数据处理、数据流向、数据流量将发生重大变化,基础设施需要支持图形、图像、音频、视频等多媒体信息的处理及传输,如何更好地适应和支持这些新需求,满足业务的快速上线要求,实现海量数据的分析和处理,是银行业面临的重要挑战。

(2)业务量日益增长和可用性要求日益提高带来的挑战。随着银行各项业务的全面快速发展,银行的业务交易量呈现出不断增长的趋势,对基础架构的可靠性、可用性及可扩展性提出了较高的要求。同时外部监管对信息科技风险管控及业务连续性要求的不断加强,使得当前主要采用的双机热备模式的系统已经不能满足要求,如何逐步地过渡到可用性更高、扩展性更好的集群架构是开放平台面临的新课题。

(3)资源数量庞大,规划、配置、管理和维护的压力日益增加。开放平台基础软硬件平台种类繁多,基础设施数量呈几何式递增,部分资源配置信息更新不及时,因此,统计不全面,缺少有效的硬件资源容量管理和软件生命周期管理是银行业一致面临的问题。同时多种软硬件平台组合的架构复杂,对人员的技术水平深度及广度要求较高,而目前,大型商业银行的总分行架构规划设计和系统运维管理人员尚存在较大缺口,如何提高资源配置和管理的精细化水平,实现系统运维自动化,是银行业迫切需要解决的问题。

所幸,开放平台新技术、新产品层出不穷,为基础架构建设提供了新的思路和手段,同时新技术的快速发展和应用也对基础设施的兼容性和扩展性提出了更高的要求,这必将促进基础架构的调整和优化,加速银行开放平台向绿色、智能型的基础架构转变。银行业必须有效平衡效能与成本的比率,综合考虑技术的先进性和成熟度,保证基础架构的安全、稳定、高效运行和持续发展。开放平台在整个IT系统架构中扮演着越来越多的角色,发挥着越来越大的作用,其中深刻影响开放平台运维体系架构的主要技术发展方向包括:集群技术(应用服务器集群和集群数据库技术)、虚拟化技术、大数据技术等。

2.1.1 集群技术

一般而言,集群(cluster)由一组(两个或两个以上)相互独立的、通过高速网络互联的服务器组成,通过使用多个冗余服务器或者多台低成本应用服务器并行运行方式组成一个应用系统对外提供服务,集群内的服务器配置、管理均通过统一的规范和方式进行,从而获得在整体应用系统上的高可靠性、高性能和高扩展性。集群技术中,核心技术包括:服务器间的切换机制、数据同步机制、应用服务器间的任务调度等。当一个客户/客户端与集群服务器进行交互、请求服务时,集群服务器和集群实现技术、软硬件架构对于客户端/客户而言是完全透明的,是一个独立的服务器。基于集群技术应用的不同的场景和集群的实现技术、目的可以有不同层次的分类。目前大型开放平台运维架构中,采用集群技术的目的主要包括如下几方面。

提高应用系统的可靠性和健壮性。通过使用集群技术(冗余服务器HA方式或集群服务器并行服务方式)均能保证应用服务器在某个节点异常时仍可以继续对外提供服务,或者通过较短的切换时间来恢复服务,将系统对前台业务的影响降低到最低程度。通过集群方式在提高系统可靠性的同时,也大大减少了服务器硬件故障或单个节点异常对于整个应用系统造成的故障损失。

提高应用系统的可扩展性、可维护性。集群技术使得应用系统通过简单增加服务器,从而加强横向扩展处理能力,并大大提高了应用系统的健壮性,不再受限于整体系统中某个节点异常而导致整体服务终止。

提高整体系统性能。对于大数据处理、计算密集型的应用系统,要求服务器具有很强的计算处理能力,在某些情况下,甚至普通的大型机也难以胜任。按照传统方式,必须根据应用系统的需求不断采购高性能的硬件投入生产。在集群方式下,可通过横向增加应用服务器的方式实现应用服务器处理能力的提升,而且整个升级过程可通过在线方式进行。

降低系统总体成本。通过多台低成本服务器并行处理,对外提供服务,较之单纯依靠采购单台高性能硬件服务器或者部署在封闭主机系统的服务模式,在满足同样性能需求的条件下,采用服务器集群技术比采用同等运算能力的大型计算机能获得更高的性价比。

在开放平台架构中,通过不同的技术实现方式,集群技术主要有三种类型。

(1)高可用性HA方式集群。运行于两个或多个节点上,目的是在系统出现某些故障的情况下,仍能继续对外提供服务。这类集群中比较著名的有TurboLinux TurboHA、Heartbeat、Kimberlite等。

高可用HA集群主要实现方式是通过两台(或者多台)服务器组成一个应用系统,对外提供服务,当集群中的一个节点发生故障时,集群软件通过一定的检测机制和调度机制,将该节点的任务切换或者分配到集群中其他正在工作的系统上执行。高可用性集群的设计思想就是要最大限度地减少服务中断时间。

考虑到计算机硬件和软件的易错性,HA方式集群的主要目的是为了应用服务器的高可靠性不受底层硬件或者应用软件的异常影响。如果高可用性集群中的主节点发生了故障或者某种异常,那么这段时间内将由备份节点代替它。次节点通常是主节点的备份节点,当它代替主节点时,可以完全接管其身份,对于使用该系统环境的客户端来说是一致的。目前,银行中最常用的高可用HA方式集群主要包括IBM的HACMP、HP公司的MC、傲冠公司基于SUSE Linux实现的SKYBILITY等。

高可用性集群使服务器系统的运行速度和响应速度较快,可以通过在多台机器上运行的冗余节点和服务,监控节点间的健康状况。如果某个节点失败,备份节点/服务将快速在短时间内接管,因此,在一定程度上对于用户/客户端而言,集群永远不会停机。在实际的使用中,由于高可用HA方式的集群在实现方式和技术上具有一定的局限性,如底层硬件异常时仍需要一定时间的切换,切换成功与否依赖于集群内节点的配置与同步,配置操作较复杂等,因此,基于HA方式的集群方式在一定程度上不能满足应用系统对于保证应用连续性的需求。

(2)负载均衡集群。高可用HA方式集群在一定程度上大大提高了应用系统的可靠性,但单台服务器计算处理能力发展速度远远满足不了快速发展的业务对于应用系统的处理需求,在这种情况下,基于负载均衡模式的集群技术得到了快速的发展和应用。

负载均衡是对负载(工作任务)进行平衡,分摊到多个操作处理单元上进行执行,例如Web服务器、关键应用服务器和普通应用服务器等,从而共同完成业务处理。负载均衡集群是通过搭建多个可独立进行业务处理的应用服务器,并在前端构建负载均衡节点作为应用请求的入口,通过一定的规则将不同的应用请求分散到后端不同的应用服务器上,实现整体应用服务器的高可用性和高性能。

负载均衡一般包括网络流量负载均衡和应用程序处理均衡。前者是传统的负载均衡应用领域,随着负载均衡与集群应用服务器结合,负载均衡应用的领域得到了扩展,负载均衡集群使应用负载可以在计算机集群中尽可能平均地分摊处理,从而大大提高整体应用系统的处理能力和可靠性。

负载均衡集群方式在很大程度上避免了高可用HA集群方式中的不足,这种技术大大提高了应用系统的处理能力和可靠性。在未来很长一段时间内,这种方式将会是业界应用系统架构的首选模式。负载均衡集群方式的不足之处在于负载均衡集群适用于提供相对静态的数据服务,比如HTTP服务,因为负载均衡集群的各节点间通常没有共用的存储介质,用户数据被复制成多份,存放于每一个提供该项服务的节点上。负载均衡集群方式对于更为复杂的动态数据服务能力还有待拓展。

(3)科学计算集群。科学计算集群是并行计算的基础,一般应用于较大规模计算能力需求的领域,比如科研院所、气象预报等。通常科学计算集群均涉及专为集群开发的并行应用程序,以解决复杂的科学问题或者在特定领域内的特定课题。科学集群对外就好像一个超级计算机,这种超级计算机内部由十个至上万个独立处理器组成,并且在公共消息传递层上进行通信以运行并行应用程序。此类集群在银行业的应用较少。

2.1.2 虚拟化技术

随着IT技术的不断发展,虚拟化技术在近年得到了快速的发展,同时也在大型银行数据中心得到了越来越广泛的应用。虚拟化技术具有一对多和多对一的特点,可以将多个物理资源创建成一个虚拟(逻辑)的资源,也可以将一个物理资源创建成多个虚拟(逻辑)的资源,通过合理地利用虚拟化,可以大大提高银行系统资源利用率,同时也能提高部署于系统资源上应用系统的可靠性。针对银行开放平台系统的虚拟化技术主要有小型机虚拟化、PC服务器虚拟化和存储设备虚拟化三个主要方面。

(1)小型机设备虚拟化技术。小型机设备处理能力强,能承担银行开放平台系统核心的、重要的生产应用系统和大部分数据库系统。但是由于硬件资源的限制,单台小型机上部署的分区数有限,通常最多可部署5~6个小型机分区。在应用部署过程中,大部分应用系统均采用应用服务器和数据库服务器互备模式,每类业务至少需要两个小型机分区,由此,在开放平台部署应用持续增长的情况下,必然会遇到小型机分区资源限制的问题。

通过运用小型机虚拟化技术,建立虚拟资源池并在虚拟资源池的基础上建立虚拟分区,从而可以消除小型机分区数受硬件资源限制,能根据各虚拟分区的应用负载压力,同时能充分利用各虚拟分区应用特点和业务高峰时间,在各虚拟分区之间动态调整资源,达到最大限度利用资源的效果。

(2)PC服务器虚拟化技术。开放平台中X86架构下PC服务器在银行数据中心的应用越来越广泛。随着PC服务器技术的发展和采用新架构方式,单台PC服务器的处理能力得到了极大提高,虽然与此同时,应用系统对于PC服务器的需求也越来越大,通过PC服务器虚拟化技术,可以极大地提高设备资源的利用率,改善单台PC服务器硬件设备冗余性不高、单台服务器处理能力不强等不足,并通过集群方式或者大数据技术(如Hadoop)合理分布集群应用在多台物理设备上的负载。

PC服务器虚拟化技术中,主流的技术包括VMVARE平台、微软的HYPER V平台等。这两种平台在各大数据中心已经得到了广泛的应用,目前大型商业银行数据中心已经部署多个大型虚拟机资源池,确保了新项目的顺利投产和已投产项目的稳定运行,实现了资源的最大化利用。

(3)存储设备虚拟化技术。存储设备虚拟化技术是在物理存储系统和服务器之间增加一个虚拟层,用来管理和控制所有存储并对服务器提供存储服务。服务器不直接与存储硬件打交道,存储硬件的递减、调换、分拆、合并对服务器完全透明,从而隐藏了多种存储的复杂性,允许将现有的功能集成使用,摆脱了物理容量的局限性。

2.1.3 大数据技术

大数据是指通过高速捕捉、发现和分析,从海量数据中获取价值的一种新型技术架构。最早关于大数据的案例是美国第二大超市塔吉特利用大数据技术分析女性顾客的消费行为,判断客户是否怀孕,并有针对性地发送孕妇优惠广告,从而成功地提升了销售量。此事令一个蒙在鼓里的父亲意外发现正在上高中的女儿怀孕了,大数据的威力轰动全美。

银行业是数据密集型行业,也是最早运用信息科技技术的行业,大数据的出现对银行业的影响是深刻的、复杂的、多维度的,主要表现在以下几个方面。一是准确把握客户信息。传统客户信息主要来自市场调查、财务统计、信用记录等单一静态渠道,大数据能够通过微博、网络日志、移动电话等现实和虚拟媒介扩大客户数据来源,并跟踪客户的实时行为,如交易结算、语音对话、空间位置等,帮助银行更加准确地了解客户情况。例如,谷歌的小额信贷产品ZestSurf通过增加传感装置,可以有效地区分哪些客户暂时减少信贷是因为外部环境因素,或一直是信用较低,避免了有效客户的流失。二是大数据使银行能够打通内外部数据,获得更完整的客户拼图和行为模式,从而进行精准营销和管理。例如,ING Direct网上银行通过数据分析对客户进行分类,筛选出高回报客户,并为他们提供具有吸引力的利率。

大数据对于信息系统来说,首先带来的问题是挑战,对于金融行业信息系统及数据中心也一样,大数据是规模非常巨大和复杂的数据集,一般来说大数据来源于互联网、多媒体等技术产生的海量数据,但同时还有很多的数据是由传统应用的发展、采集数据源的广度和深度的增加引起的。在面临大数据问题时,传统数据库管理工具、信息系统软件处理起来面临诸多困难,如数据获取方式、存储方式、检索模式、共享、分析模式和可视化展现等在数据量达到PB、EB或ZB的级别时,都会产生很大的变化。大数据的特征可以概括为4V。一是数据容量大(Volume),大数据不再局限于样本数据,而是反映了数据总体和全集的概念,且数据量持续快速增加;二是处理速度快(Velocity),大数据利用云计算等存储技术实现了海量数据的秒级动态处理;三是多样化(Variety)数据类型和来源;四是价值密度低(Value),由于大量有用和没用的数据并存,大数据“遍地是金子,又遍地是沙子”。大数据也引发了一些问题,如对数据库高并发读写要求,对海量数据的高效率存储和访问需求,对数据库高可扩展性和高可用性的需求,传统关系型、SQL类型数据库的处理模式和性能对于大数据处理来说力不从心,运用传统的软件工具、应用系统、数据处理模式等均无法应对大数据。

在大数据技术的发展过程中,由APACHE基金会开发,开源的、基于分布式系统基础架构下的Hadoop得到了快速发展和广泛应用。Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。它主要有以下几个优点。

(1)高可靠性。Hadoop在数据存储和处理方面具有较高的可靠性。

(2)高扩展性。Hadoop是在可用的计算机集群间分配数据并完成计算任务的,这些集群可以方便地扩展到数以千计节点规模。

(3)高性能。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。

(4)高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。

总之,这些高新技术被引入银行信息系统,既是机遇又是挑战,如何利用和发展好技术,并且配备与之发展及变革相适应的管理模式,对于新形势下大型银行开放平台系统的稳定与发展至关重要。