云端架构:基于云平台的41种可复用的架构最佳实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.6.4 统一运维管理

对资源的纳管仅仅是最基础的功能,还要感知纳管资源的状态,提供统一运维管理。本地环境中的不同平台、不同公有云服务商提供的工单系统不同,监控平台收集的信息格式不同,输出展示界面不同,运维人员在收到告警信息时还需要先辨别是哪个系统,再排查问题,自动化运维也仅限于纳管的单个底层平台内部。

CMP在运维层面首先对资源进行统一的监控和告警,通过API或SDK来将不同底层平台的监控数据统一收集上来,按照CMP定义的标准字段进行适配和展示。将所有监控数据统一之后就可以提供统一监控大屏,运维人员仅需对接一个监控大屏和一套监控系统即可。在触发告警时也是经过CMP处理之后再推送电话、短信、邮件、钉钉、微信等告警信息。CMP不仅有向上拉取资源的能力,还有向下调度资源的能力,根据告警信息将告警响应方式选择为回调函数,再预置一些处理机制,底层异构平台的各种告警事件都可以统一输出到CMP中,触发对应的回调函数,实现对底层纳管的本地环境资源、公有云资源进行开机、关机、重启、增加云主机、删除云主机、对数据进行备份、实现高可用降级等处理,具体的处理能力由回调函数的实现能力来界定。

CMP提供统一的工单系统,对接底层平台的工单系统,如果之前是由工单申请人发起纸质工单、运维清单等方式,CMP则将手动纸质流程优化为线上流程。运维管理人员通过在线工具可以非常方便地创建新的工单流程或审批流程,申请人使用起来也可以减少错误,从而实现运维过程的流程化和规范化。

除了监控、告警、工单系统的统一化,CMP还将能实现的功能通过API的方式提供出来,开发者直接集成或进行二次开发,在上层应用中对资源、服务进行封装。

CMP已经通过API打通了各个公有云平台、虚拟化平台,因此云主机、数据进行备份容灾时可通过CMP来管理。面向应用系统进行运维时需要调度底层资源,如将虚拟化的VMware服务器备份到公有云中,将数据库数据同步备份到云平台,对私有化环境中的应用实现公有云端的容灾,对多云环境中云主机数量此消彼长的调整等。