构建大型银行开放平台系统智能运维
上QQ阅读APP看书,第一时间看更新

1.3 研究目标及内容

目前大型银行开放平台系统运维工作研究取得一定的成果,但仍面临着巨大挑战,开放平台运维工作呈现出新特点:运维需求多样化、运维对象复杂化、运维模式集中化、运维队伍专业化、运维工作流程化、运维手段系统化。因此,本研究的目标是结合开放平台系统运维特点,通过对系统运维方法和技术革新的研究,建立电子银行系统服务模型,构建适用于电子银行系统服务模型的运维体系,作为开放平台运维体系的典范,从而促进开放平台运维管理的发展,提供稳定、高效的系统服务,为各个应用系统的正常运行提供后台保障。结合研究目标,主要研究内容如下。

(1)推动开放平台基础架构整合与优化,增强基础架构保障支撑能力。基础架构影响整体运维水平。一方面某些项目由于开发时间较久,原有的架构不一定能满足现有业务需求或监管部门的相关要求,因此需要对原有的架构进行优化改造;另一方面对于新投产系统,在立项阶段就需要对基础架构按照高可用、可扩展、高性能、高安全和易维护的原则进行设计,架构标准化的实施可以提升开放平台整体运维水平,基础架构建设为运维体系的构建提供有力支撑。

(2)开放平台运维体系框架设计,明确范围和架构。当前开放平台的运维工作面临着诸多挑战,同时开放平台的技术革新也给运维工作带来了新的机遇,结合运维工作的实际需求,对开放平台运维体系进行整体设计,结合运行维护对象及其特点,设计运行维护系统的总体框架,提出运行维护系统的设计目标、原则和内容。

(3)建立科学合理的治理模型,完善运维管理方法,增强系统运维服务能力。对于大型开放平台,为保证其运维管理的持续发展,在完善优化开放平台基础架构建设的基础上,必须要加强对运维管理方法的研究和探索,寻求合适的治理模型。对于开放平台而言,制度管理、流程管理、配置管理、容量管理及团队管理等均为运维体系构建的核心内容,实现开放平台的任务流程化管理,配置管理信息全面、准确、易于查找,对系统容量进行评估、规划、分析、调整和优化,满足业务需求的同时优化资源配置和使用。

(4)建立应急保障体系,能够快速应对突发情况,提高工作效率,快速处置系统故障。信息系统的风险具有极大的不确定性,银行信息系统服务一旦中断,所带来的危害仅用经济损失来度量远远不够,更涉及银行的企业形象和社会影响,以及监管机构的管理。本着安全生产是运维工作第一目标的原则,针对应急风险管理多主体、多因素、多尺度的特征,需要构建一套应急保障体系,可以有效地应对突发事件,兼顾成本与成效,提升突发事件应急处置效率,加强恢复系统服务的能力,全面提升生产运维管理水平。

(5)建立风险防控体系,被动应对向主动防控转变,有效降低信息系统的运行风险。大型商业银行全国数据大集中实现了应用系统的集中,同时也带来了风险的集中,开放平台所提供的服务与个人、企业利益乃至国民经济息息相关,银行业信息科技风险存在影响面积较大、不确定、风险评估或防范手段不足、难度量、易扩散等特点,按照“预防为主,分级保护,分层负责,持续改进”的基本方针,对开放平台面临的风险进行系统化的梳理,并制订和采取相应的控制防范方案,建立健全安全规章制度及流程建设,完善风险防控体系,为系统的安全运行添加一道保护伞。

(6)理论指导行动,电子银行系统运维工作推动运维体系的实践和完善。一套运维体系的构建,离不开实际运维经验的积累和运维技术、方法的创新,电子银行系统作为开放平台的特殊应用系统群体,规模较大,其业务关联度高,同时直接对公众提供服务,关系到银行的品牌形象。面对电子银行系统运维的内外部压力,运用运维管理科学,实践一体化运维的理念,以“主动运维”为核心,坚持全面的监控,在日常运维上遵循信息技术基础构架库(Information Technology Infrastructure Library,ITIL)的服务标准,采取精细化管理,基础架构建设与运维管理方法实践同步,应急保障体系与风险防控体系结合,全面提升电子银行系统的可用性与连续性。