【2019IT运维十大样板工程】贵州省农村信用社业务性能监测项目

2019-10-17    来源:IT运维网

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

近年来,贵州省农村信用社在信息科技投入上保持了较高的增长,在基础设施、核心银行系统、信息管理系统以及渠道建设等各方面取得长足的进步。
 

但随着业务规模的不断扩大,业务的多样性和复杂性都在逐年增加,业务系统的良好运行直接关系到前端业务的服务质量,因此业务系统的稳定性和连续性变得尤为重要。原有的运维监控更关注于IT基础设施是否健康,是一种离散的监控,无法从业务的视角发现问题,难以全面、准确、及时地掌握业务系统的运行情况。在业务出现问题后,运维人员往往只能被动排查,故障根源定位慢、业务影响分析困难,各监控环节彼此独立,难以联动实现业务系统的自动故障定位,更缺乏对业务系统整体健康状况和运行趋势的把握,无法判定业务系统是否存在运行瓶颈,为决策层提供数据依据。

 

项目意义
 

通过建设业务性能监测平台,从业务视角出发,将被动接收变为主动发现,实现故障及时预警与问题准确定位,有效降低生产业务系统运维难度,提升反应速度与服务质量,促进业务的连贯性与稳定性,进一步提高贵州农信社的科技运维能力,真正实现省农信业务系统零风险管理,为信息系统安全稳定运行奠定基础。

 

项目解决方案
 

1.全面支持灾备、多活数据中心架构,分布式部署,集中展现
 

通过分布式的部署方式在两地三中心均部署网络流量采集、分析、统计节点,网络流量数据在本地完成解析后,将监控数据发送至统一的可视化节点进行集中展示,统一管理。构建的业务性能监测集群全面支持贵州省农信新数据中心建设、数据中心搬迁以及后续灾备或多活数据中心建设。
 

 
2.覆盖传统网络、虚拟化、云环境的全网数据采集
 

采用领先的旁路监控技术,在不改造应用,不影响生产业务的前提下,实现全网业务流量采集。通过真实的过程数据,高精度、低延迟、全量地反映业务行为和过程,全面支持现有复杂的IT网络架构,覆盖传统网络、虚拟化、SDN环境。同时,通过可跨越新(云、容器、微服务)、老(SOA)架构的采集技术,能够保持统一度量标准和使用习惯,为后续业务上云提供全链路业务性能监控保障。
 

3.以业务服务为中心的端到端、全路径业务性能监控
 

基于先进的协议解码技术,充分利用可靠的网络数据资源,建立以业务服务为核心视角的业务交付全链路性能监控。能够自动发现并梳理业务路径,通过对影响业务的关键性能指标和关键网络指标进行实时监测,直观反映系统故障对业务的影响并支持区分交易类型、子交易类型、交易渠道等进行多维度指标统计。现有监控范围已涵盖TOP20+重要业务系统,覆盖端到端的应用服务组件,实现了业务性能的可视化。
 

另外,基于全链路的监控能力,通过多段关联允许对单笔业务进行端到端的交易追踪,能够反映每笔业务实际经过的各个处理环节、各环节的时间消耗、处理结果以及每个环节的原始交易记录,对交易处理流程进行深层解析,找出问题根源所在。
 

4.无需代码编写,即刻落地
 

以智能的业务路径自动发现和强大的协议解码引擎为基础,提供可视化的解码配置,通过对采集的网络数据资源进行智能识别,快速对交易协议进行自动发现、解码配置和解码验证,支持2000多种业务应用协议,不需要二次开发,提供快速部署能力。
 

5.场景化的实时告警与智能故障定位、根因分析
 

针对不同业务自身的关注点不同,预设了五大告警场景,分别应对不同场景下的业务性能问题。同时,通过引入人工智能算法对历史监控数据训练以形成业务性能指标基线,在业务异常时,智能产生告警。智能根因分析能够针对告警事件,在5秒内自动找出导致告警发生的维度层次和维度值,判断触发告警的根源组件、告警原因,一键生成故障成因报告,减少反复的人工查询操作步骤,让一线运维在没有系统知识的情况下也能直接拿到故障关键信息交付二线继续排查或直接启动后续流程。
 

6.互联实时数据引领科技创新
 

在满足运维监控需要的基础上,业务实时数据可用于“双11”交易监控、年终决算、银联驾驶舱等业务支撑场景,以及实时数据湖的打造、运维大数据分析。通过与业务相结合,还可应用于多种业务场景,如网点运营分析、实时头寸、市场营销等,提升运维价值,引领科技创新。

 

项目效果
 

目前,贵州省农村信用社已将TOP20+个重要业务系统纳入业务性能监测平台,包括:核心、企业服务总线、统一支付、柜面等,共覆盖监控节点80余个。自2019年6月业务性能监测平台上线以来,通过及时、准确的业务性能故障告警,大大提升了一、二线运维人员的工作效率,达到了“降低故障恢复时间,保障业务连续性”的运维目标。
 

同时,通过对关键业务系统应用逻辑的梳理,以及构建业务视角的监控视图,贵州省农村信用社实现了面向业务的实时性能监测和管理,提升了应用运维水平。通过智能的多维度告警和业务故障准确定位,充分保障了业务连续性,并为云计算、大数据分析业务创新提供助力。
 

此外,创新的将业务性能指标、网络质量指标相结合,找出业务指标和网络指标的相关性,从而更精准地定位问题,并首次在农信体系实现跨越传统网络、虚拟化、SDN环境,实现了混合架构下全流量网络旁路数据的采集监控,在农信体系信息科技建设中起到了一定的先锋示范作用。


点评:金融行业对业务系统的安全稳定运行要求极高,这也给金融体系的安全运维工作带来了极大挑战,贵州省农村信用社通过采用业务性能监测平台,极大的提升了日常运维工作效率,达到了“降低故障恢复时间,保障业务连续性”的运维目标。

标签: 监测 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:5个适合系统管理员使用的告警可视化工具

下一篇:【2019IT运维十大样板工程】中远海运运维管理项目