1.2 研究现状
1.2.1 开放平台的优势
开放平台系统是由企业、政府部门和国际标准化组织所共同定义的。基于这种公开的标准协议,来自不同生产厂商的设备之间可以互连为系统,并可以实现设备之间的信息交换。基于开放平台技术,用户可以根据自身的需要集成来自不同供应商的产品,组成具有可扩展性的应用系统。在IT领域,开放平台主要是相对于大型主机系统而言的,一般认为其软件平台是以UNIX、Linux、Windows为核心的运行环境及开发环境。基于开放平台的IT基础设施具有几个方面的特点。
(1)有效降低了商业银行的IT建设成本。开放平台设备由于基于统一的标准协议,来自不同供应商的设备可以相互兼容。更多的生产厂商给商业银行提供了更多选择的余地,通常对于同一类型设备,商业银行可以有两个以上的供应商。相对于传统的大型主机设备,开放平台设备的成本得到了极大的控制。同时开放平台设备能够得到开源社区的支持,以X86服务器为例,仅操作系统授权即可降低很多费用支出。
(2)提高了应用开发的灵活性,缩短了应用的开发周期。开放平台遵守统一的硬件标准,支持标准化的软件接口,提高了软件的可移植性,缩短了应用项目的开发周期。随着摩尔定律的发展,以X86为代表的开放平台服务器性能不断提升,开放平台的软件生态系统日益完善,开放平台技术可以满足越来越多样化的需求。
(3)可扩展性强。统一的硬件标准提高了设备的兼容性,使开放平台设备能够根据应用场景的不同灵活扩展系统资源。同时,集群技术等软件层面的可靠性及扩展性设计,降低了对底层服务器单机可靠性及性能的要求。
(4)技术更新快,具有领先性。由于业界大部分研发人员使用开放平台技术,其本身的技术更新速度快于大型机。以国际领先的技术供应商IBM为例,长期以来,IBM致力于让大型机的技术追赶开放平台的主流技术,但目前IBM正在推广的zLinux战略让TCP/IP协议和Java技术融入大型机。此外,新的软件的开发大部分运行在开放平台上,而不是大型机平台,如大数据技术等。在Web服务技术、Oracle数据库等领域,开放平台的运行也更为成熟有效。
1.2.2 开放平台引领业务作用凸显
伴随着银行业的蓬勃发展,信息科技在业务发展中的引领作用更加凸显,信息系统基础架构在银行国际化、综合化发展和业务经营转型的过程中发挥了有力的支撑作用。而开放平台是银行信息化基础架构的重要领域之一,大型商业银行中除少数核心业务系统,其他的应用系统全部基于开放平台构建,一级分行及以下的系统架构全部基于开放平台构建,开放平台的规模发展迅速。在技术上,采用最新的负载均衡集群技术,开放平台系统可以满足严格的高可用性要求,并且随着业务规模的增长,系统软硬件平台能够无缝扩展,实现平滑升级,有效提升了系统的安全和可靠性,很好地支撑了银行各类业务的快速发展。
各股份制商业银行的实践已证明,开放平台技术日趋成熟,服务器处理能力不断提升,使得其具备满足银行核心业务系统高并发、大交易量需求的能力。基于开放式平台的小型机集群,配合软硬件两方面,存储通信等层面采用负载均衡技术,完全符合银行核心业务系统的大吞吐量、低处理时延的要求,可以支撑超大规模高并发的银行核心业务系统长时间稳定运行。就国内大型商业银行而言,目前开放平台承载着全行数百个应用系统,主要业务系统包括电子银行系统、贷记卡业务系统、第三方存管系统、金融服务平台和私人银行管理系统等。以电子银行为例,其交易量年均增长率超过70%,交易系统完全部署在开放平台的小型机和PC服务器上,通过运用负载均衡技术和存储镜像技术,很好地支撑了电子银行业务的持续快速发展。
1.2.3 银行业开放平台面临的挑战
为了保障业务的顺利进行,大型商业银行已经建成了可用性超过五个九的大型主机并行耦合系统,但仅有稳定、健壮的后台核心业务系统是不够的,任何一笔发往后台的交易,中间均需要经过开放平台系统,这对其可用性、健壮性提出了越来越高的要求,开放平台也面临越来越多的挑战。
(1)新的业务需求层出不穷,交易数量急剧增长。面对国内外同业和跨业竞争日益加剧,各商业银行不断加大产品创新投入,围绕移动互联网金融、微信银行和大数据技术等金融热点,先后推出了以手机银行客户端、微信银行应用等为载体的新产品,业务与管理需求爆发式增长,每年新增开放平台投产项目使用的基础设施数量成几何式递增,交易数量急剧增长。系统建设周期要求越来越短,产品上线时效性要求越来越迫切。资源需要量较大,而资源采购流程相对较长,部分设备需要更新升级,开放平台管理复杂度不断增加。同时,随着业务发展需要及应用部署模式的进一步调整,新型的数据中心、灾备中心及测试中心的出现,使得数据处理、数据流向、数据流量发生重大变化,对现有的开放平台的基础架构提出了新的挑战。
(2)单台开放平台设备可靠性不高,威胁业务连续性,难以满足外部监管要求。相对于大型主机的稳定性,开放平台设备的可靠性明显降低。以开放平台中的X86服务器为例,相关统计显示其年故障率为0.45%~0.55%,一旦发生硬件故障将会导致此台服务器上的业务应用中断。同时,由于金融服务直接面向公众客户,业务连续性敏感性强,外部监管要求更高的业务连续性。银监会等监管部门专门出台了《商业银行业务连续性监管指引》等制度规范,逐步引导我国金融机构建立完备的业务连续性管理体系,要求防范和应对组织内外各种日益频繁的中断威胁。
(3)运维监控工具割裂,缺乏整合监控平台,难以实现主动运维。随着信息化建设的深入,银行的开放系统日趋复杂,急剧扩大的开放平台设备规模与落后的运维手段之间的矛盾日益突出。不同类型的网络设备、服务器、存储设备、带库设备等让运维人员难以从容应对。早期采用外购监控管理工具,有BMC集中监控系统、AME前置交易监控系统、MyAME中间件系统监控软件、NBU集中备份监控软件。每类工具监控一类指标,当监控的项目数量急剧增加时,监控管理的难度加大,难以做到人工管理多个监控工具的报警信息。目前的监控工具虽然能够获取IT设备、服务器、业务流量、数据库的警告信息,但成千上万条警告信息堆积在一起,又缺乏有效的事件监控和诊断工具,因此需要运维人员人工分析和处理问题。这不仅增加了运维成本和难度,而且无法保证快速有效的问题处置。
(4)运维手段单一,自动化程度不高。目前,商业银行IT业务已经实现了从人工操作到计算机管理的转变,但它仅处于半自动化运营维护状态。这种IT运维依旧是等到IT故障出现后,再由运维人员采取相应的措施,所以传统被动的、孤立的、半手动式的IT运维管理模式时常让运维团队疲惫不堪。在IT运维过程中,IT员工被动低效率救火,只有当事件已经发生并已造成业务影响时才能发现和着手处理。为了更好地理解和跟踪生产系统的运行,必须定期采集银行开放平台操作系统、数据库和中间件产品的配置信息、运行数据以及应用系统的运行数据,从而对应用系统的整体运行情况进行针对性的分析和跟踪,以便及时发现可能存在的问题,并采取相应的对策。IT运维管理过程中缺乏自动化的运维管理模式,也没有清晰的角色界定和责任划分,使得问题出现后很难快速、准确地找到根本原因,并及时地找到相应的人员进行修复和处理,或者是在问题找到后缺乏流程化的故障处理机制,而在处理问题时不但缺乏规范化的解决方案,也缺乏全面的跟踪记录。此外,更新管理类工作绝大部分都是手工操作。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手动实施。当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化、智能化已迫在眉睫。
(5)系统异构性强,设备类型与基础软件种类多,不利于统一运维。开放平台由于其接口开放的特征,通常其系统构成的硬件、软件分属不同的厂商。如计算模块可以采用IBM、HP的,存储模块可采用EMC、HDS的,软件可以是Sybase、IBM、Microsoft的,不同供应商基于开放的接口标准,实现系统之间的兼容和集成,形成统一的系统提供对外服务。这种分工方式可以大幅降低供应商的研发和生产成本,也能降低银行的IT投入成本,但同时也带来了一系列的问题,如兼容性、可维护性。此外,由于历史的原因,不同应用项目的架构设计没有统一标准,系统维护依赖于具体的系统管理员,运维人员与应用系统呈现紧耦合的关系。
(6)开放平台技术演进迅速,不断提出新的运维需求。相对于大型主机技术,以X86技术为代表的开放平台技术不断推陈出新,从单核到多核,从单物理机到虚拟资源池,从NAS存储到SAN网络存储,从集群到私有云模式,从单数据库到大数据集群技术,开放平台技术在摩尔定律的影响下,技术不断进步,客观上要求银行的运维团队根据新技术的特点,不断提出科学的运维方法,并整合到现有的监控体系中。同时要求运维团队有前瞻性的眼光,统筹规划好至少五年内的开放平台的建设思路。
大数据时代的来临,对开放平台的存储性能提出了更高的挑战,存储容量、响应速度、稳定性方面都对现有的基础架构提出了新的挑战。如今,大型商业银行开放平台正面临着前所未有的挑战,不仅需要在高密度服务器环境中处理、存储和归档日益增多的数据,而且还需要优化空间、降低功耗和冷却。虚拟化技术应用日益广泛和成熟,从计算资源到存储资源,再到网络资源,通过虚拟化技术的大量应用,为实现随需应变的弹性IT基础架构,建立企业私有云、公共云提供了可能。同时也对如何建立更加灵活、更易于管理、更健壮可靠的基础架构提出了一系列挑战。