IT运维管理“多米诺效应”离你有多远?

2018-06-11    来源:

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

网络对于我们的生活意味着什么,可能并不是每个人都能概括出精辟的说辞,但现在让你从拥有网 络的生活中脱离出来,大多数人都会感到手足无措。可以说网络已经和人们的日常生活、工作息息相关,通过网络我们得到了前所未有的信息量、经济得到了指数级 别的提升,业务得以顺利、快捷地开展,网络管理是否得当直接决定了一切业务开展是否能得到保障。

不过,关于网络管理和业务系统之间是否有紧密地联系,或者依存度到底有多高,相信直 至今日,大多数人还没有客观地理解。从表面上看,网络系统和业务系统貌似是行走在两条毫无交叉的轨道上,分属于不同的部门,实现不同的功能,着眼点也不 同。IT部门管好设备,管好网络就算万事大吉,至于和业务部门有什么关系,是否会影响到业务部门的运作,很少有人会去关心,这就是现行的国内IT部门的普 遍状态。

先不去评价我们是否应该花大力气去扭转这种局面,举一个简单的例子,大家都应该玩过 或见过、听说过多米诺骨牌吧。多米诺骨牌是一种用木制、骨制或塑料制成的长方形骨牌。玩时将骨牌按一定间距排列成行,轻轻碰倒第一枚骨牌,其余的骨牌就会 产生连锁反应,依次倒下。大家在欣赏骨牌坍塌瞬间所带来的震撼和不可思议的同时,是否还注意到一些别的问题?

给第一张牌一个很小的力,后面的牌就会连锁倒下,呈现的结果就是全面坍塌。这一环一环之间你可能看不到有直接的联系,但结果却是令人震撼的。而且这种传递的力的效果越来越强,被放大了。

回到之前我说的IT系统和业务系统的关系,也举一个小例子:有段时间,某一公司的一 个业务系统运行很不稳定,经过彻查,发现不是业务系统本身的问题。无奈之下,决定把整个基础的IT系统也检查一遍。经过排查,发现机房温度过高,技术人员 这才恍然大悟:网络设备跟人一样,温度高,人脑开始发昏。而环境温度高了,CPU负载变大,设备对响应和请求的延时自然加大。这会直接导致连接在网络设备 上的服务器和主机,对外访问或者提供服务时,延时加大,建立在此基础上的业务系统的运行自然难以得到保障。加强机房空调制冷后,设备负载恢复正常,设备响 应加快,网络恢复通畅,业务系统又回到了正常的工作状态。

这不就是个典型的多米诺效应吗?机房环境温度失控导致了设备运行不稳定,设备运行不稳定又造成了网络问题,而网络问题带来的通讯不畅也导致了业务系统的故障……这样的连锁反应使得一个看似不大的问题放大成一个严重的后果。

而我相信,这样的多米诺效应,其实离你并不远。只是更多的人不知道如何才能找到第一 张骨牌,并不让它倒下。在上面的例子中,其实技术人员就是利用了IT运维管理软件发现了机房温度的报警,而报警的时间正好是业务系统出问题的那天,所以他 们找到了第一张骨牌,却没有很好地找出这其中的联系,及时地制止它的倒下。

我想多米诺效应可以离你很远,关键在于你有没有认识到它的危害性,并做好充足地事前准备,规避这种风险,而不是在它到来时,眼睁睁地任凭你的业务系统崩溃下去。

注释:作者孙永杰现为上海北塔软件股份有限公司资深产品总监。

标签: 服务器 机房 机房环境 机房空调 网络 问题

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:透彻分析Windows7系统中强大的网络功能

下一篇:用iostat来对Linux硬盘IO性能进行检测