构建大型银行开放平台系统智能运维
上QQ阅读APP看书,第一时间看更新

2.4 开放平台基础架构建设主要内容

在“高效率、高整合、低能耗、易管理、易扩展、前瞻性”的指导思想下,同时基于上述的基础架构设计原则、目标、思路及总体架构策略,大型商业银行开放平台基础架构建设的主要内容包括:通过技术路线完善基础架构设计,工程实施完成基础架构优化和面向用户需求的集中式运维管理平台的搭建。

2.4.1 技术路线

以引入业界先进理念和技术为契机,完善基础架构设计,提升基础架构的弹性、可用性和可管理能力。技术路线的设计包含负载均衡、PC服务器资源池、小型机虚拟化、存储管理、数据备份、虚拟桌面云、集群数据库和数据库服务器。

(1)负载均衡集群试点及推广实施。构建总、分行生产网络、办公网络的负载均衡资源池,通过使用成熟的负载均衡产品建立统一的应用交互平台,为信息系统提供良好的可用性、高处理能力和可扩展性,避免单点失效的风险,并使各个服务器能够均衡处理压力,实现应用层面的优化、安全及应用资源的动态调配。

(2)PC服务器资源池架构优化。在前期PC服务器资源池建设的基础上,对传统机架式服务器、刀片服务器以及PC服务器平台的Intel和AMD两种CPU,对于其虚拟化的支持进行对比研究和分析,进一步对PC服务器硬件架构进行优化,充分发挥虚拟化技术的优势,不断完善PC服务器资源池建设。

(3)小型机虚拟化技术研究及应用。结合小型机虚拟化技术,优化部署架构,提高小型机系统整体的可靠性、可用性、灵活性和吞吐量性能,进一步提高资源利用率,满足业务发展快速增长、灵活多变和系统运行安全稳定的要求。以开发测试环境为切入点,制订适应特定开发测试环境的小型机虚拟化部署方案,在开发测试环境中进行小型机虚拟化的实施、推广工作。

(4)存储管理。建立完整的银行存储管理解决方案,确保所有存储设备能够得到可靠管理、即时监视、自动发现的保障,并引入存储虚拟化管理,充分利用存储所具有的各种特性,优化存储使用性能。与各个主流存储管理软件厂商进行技术交流,了解各厂商产品的技术实现和适用范围。研究和比较业界主要存储管理软件和存储虚拟化技术,结合实际需求对存储管理软件及存储虚拟化技术进行充分测试评估,确定各存储管理软件产品技术和服务需求,启动存储集中管理软件系统的资源配置工作;对存储设备、相关设备的配置和使用现状进行必要的梳理,为管理软件的实施做好必要的准备工作;不断总结存储管理经验,优化存储容量和配置管理,提高存储系统使用效率。

基于存储管理软件和存储虚拟化技术,建立统一的存储管理环境。实现主要存储设备的配置管理、容量管理和性能监控。实现SAN网络拓扑结构的集中展示和定期同步更新,并且优化完善高级功能管理。根据具体的应用及设备情况,对存储设备的性能进行前瞻性分析,以达到应用运行的最佳状态。同时,提供远程数据复制等服务,确保系统快速部署及灾备应用。

(5)海量数据的存储和备份。随着银行各类应用系统数据量的逐年增大,加之数据仓库类型项目的逐渐推广,对于基础数据平台、审计系统等海量数据系统,针对现有的备份和恢复机制存在操作时间窗口不足和重复数据备份等问题,进行海量存储的备份和恢复方案的研究,为银行业生产系统海量数据的备份和恢复提供一个行之有效的方法和手段。

(6)虚拟桌面云的研究与实施。服务器虚拟化技术在银行业已经得到了广泛应用,并取得了明显效益。为了更好地应用虚拟化技术提升银行业的信息技术水平,以新一代的银行核心系统开发及测试环境两个方面为切入点,在梳理对桌面虚拟化及应用虚拟化的需求、适用场景、可行性,以及对业界主流桌面虚拟化产品调研的前提下,研究其在银行业的适用场景并评估推广,以构建快速交付、安全便捷的桌面虚拟化平台,为提供“高效、绿色、智能”的银行云服务做好技术积累。

(7)集群数据库技术研究及应用。进一步深入开展集群数据库技术研究工作,尤其关注高可用性、高并发等方面。在高并发情况下,完成集群数据库的高可用性测试,并研究集群数据库架构与中间件及常用软件之间的兼容性。搭建基于试点项目的集群数据库测试环境,全程跟踪开发、测试阶段,解决开发、测试过程中遇到的环境兼容性及配置性问题,总结一套符合银行开放平台系统动态高可用系统架构的数据库集群部署试行规范,从而搭建生产环境,支持试点项目上线。系统上线运行后重点监控系统运行状况,根据实际生产运行情况及时合理调整数据库集群部署试行规范。在不同开放平台操作系统、不同存储设备环境下,验证集群数据库集群技术部署规范可用性,保证数据库新架构的健壮性。根据研究、测试及试点情况,进行数据库集群技术的推广。

(8)高性能数据库服务器的研究及引入。针对目前大型商业银行开放平台数据库产品存在的不足,深入研究高性能数据库服务器相关技术,寻求适合银行业应用实际的数据库服务高可靠、高并发、高稳定的解决方案,完成相关研究报告。接着引入产品,切实解决部分应用对数据库服务器高并发、高吞吐的要求,寻求在大型商业银行业务量日益增长的背景下,服务器处理能力不足以及数据库并发处理瓶颈的解决方案。

最终建立一套统一标准、安全合规、行之有效的系统技术规范,形成全行基本统一的开放平台架构部署方案,实现软硬件配置标准化。使用全面系统、标准统一的基础设施建设规划和技术规范,集中采购成本降低为原来的30%至50%,为低成本的资源集中采购奠定基础,更重要的是降低了运维管理的复杂度。

2.4.2 工程实施

以工程实施为驱动,推动基础架构升级优化,不断完善系统的基础架构建设,提高基础架构的标准化和可持续发展水平。在大型银行全行范围内大力推广管理信息系统整合、备份系统改造、分行FC SAN存储部署架构整合、影像及档案类应用的系统部署及规范工程等。整合过程中充分应用虚拟化等技术,规划构建共享使用、动态调整、按需分配的系统实体资源池。建立系统资源池新的建设方式,摒弃传统按照业务产品配置资源、建立独立基础环境的思路,可使资源投入仅为原有方式的二分之一左右,大幅提高资源利用率,这也充分证明了开放平台系统资源池方式的高效和可靠。具体的工程实施包含以下内容。

(1)新一代核心银行项目全行推广。新一代核心银行项目作为当前及今后几年科技工作的重中之重,是科技工作的中心。将根据新一代银行核心系统的架构特点,结合系统的建设规划,从开发测试、资源配置、总行投产及分行推广四个方面加强对新一代银行核心系统建设的支持与服务。将积极推动各项资源的采购,配合新一代银行核心项目组完成总分行计算机系统架构设计、总分行应用的改造及全行范围的上线推广。

(2)开放平台灾备系统建设。在前期灾备系统建设的基础上,进一步研究开放平台应用部署的灾难备份模式,并规划实施定期的测试演练,依据分行开放平台前置系统升级推广计划,积极有效地制订开放平台灾备建设方案,并充分利用小型机虚拟化技术等先进技术降低一级分行灾备建设工作的复杂度,提高可行性和管理效率,进一步控制操作风险。

2.4.3 集中式运维管理平台

以实际需求为导向,搭建集中式运维管理平台,提升基础架构管理的精细化和自动化水平。以运维管理平台建设为推手,加强基础设施安全管理。全面推广集中监控系统和用户认证与行为审计系统,有效提高系统的实时报警与风险防范能力,确保系统稳定运行。

(1)开放平台集中监控系统的建设与升级。在前期集中监控系统建设的基础上,优化监控架构,增强系统功能,建立面向全行、自动高效、功能全面、统一集中的总、分行两级监控架构,实现总、分行告警事件的实时发现与性能数据的集中管理,降低系统运行风险,提高系统预警能力。制订并完善集中监控管理规范化工作流程,建立面向全行的、科学有效的集中监控体系架构,实现告警事件、性能数据的集中管理,制订应用开发的接口规范,实现与应用、网络等系统的集成。优化系统运行结构和代码质量,不断提升集中监控系统的运行稳定性和可靠性,提升监控管理水平。

(2)开放平台资源配置管理系统建设。研发开放平台资源配置管理系统,对开放平台资源进行全生命周期管理,提供准确的资源和配置的统计、分析和管理功能,逐步实现全行开放平台系统资源的集中、统一管理。

(3)开放平台用户认证与行为审计系统优化。由原来的一级分行独立部署升级改造为总、分行集中分布式部署模式的优化系统架构,实现总行对分行开放平台用户认证与行为审计系统版本监督、控制和升级管理,增加审计操作日志留存和统计功能,加强审计功能的使用管理,解决目前人工查看审计日志效率不高、难以落实的问题,强化系统访问控制和权限管理,降低偶然或恶意入侵给系统带来的威胁。鉴于分行技术力量和厂商支持能力方面存在的问题,为提高问题分析和处置效率,以“开放平台用户认证与行为审计系统”为基础,建立总行对分行的远程在线支持平台,逐步提高操作系统、数据库、中间件、存储、负载均衡设备等基础软硬件的技术支持能力。

(4)开放平台自动化智能运维系统的建设。实现系统资源部署的自动化、标准化、一体化、智能化管理,提高资源自动化部署和管理水平,加快资源分配响应速度。实现基础设施资源的按需配置和动态调整,改善客户体验,保障系统的安全、稳定与高效运行。

开放平台是银行业信息化基础架构的重要领域之一,大型商业银行总行除少数核心业务系统,应用系统全部都基于开放平台构建,一级分行及以下的系统架构全部基于开放平台构建,中小型商业银行全部基于开放平台构建,因此,高性能和易维护是银行开放系统的关键属性,这直接关系到系统运维的效率。而且,开放平台的基础架构将运维对象以一定的方式呈现在运维体系当中,为运维体系的构建提供了基础支撑,并影响着运维体系运转的效率。