新概念运维之强迫症会害死系统管理员

2018-06-11    来源:

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

编者按:系统管理员是一个需要细致的工种,其细致程度往往到了一种谨慎强迫症的地步。但是,凡事都有过犹不及。下面这篇文章总结了一些系统管理员们因为强迫症而做过的蠢事儿,证明了一味追求各方面井井有条的做法为什么会适得其反,给广大系统管理员们做个借鉴。本文作者Paul Venezia是Infoworld资深编辑,有着丰富的运维与咨询经验。以下为正文:

有时候,你就是抗拒不了想把事情安排得井井有条的念头,尽管这么做其实没有必要;有时候,你决定处理某个微不足道或者几乎就不存在问题,到头来却平添了一大堆的工作;有时候,你希望在其他方面也能像操作计算机时摁Undo按钮那样可以撤销操作;有时候,系统明明没坏掉,你却决定无论如何要修复系统。 

遗憾的是,我也犯过很多这样的毛病。

蠢事儿一:重新摆弄电源线导致弄坏了交换机

有一次,一条电源线不正确地穿过数据架的背面,使得后面的机箱门无法正常关闭。电源线拉到了一台仅与后端管理链路相连接的交换机上。我为了重新布线,将那台交换机的电源也拔下来了一会儿,因为觉得应该没什么关系。事情就是这样发生的。

当交换机重新接上后,忽然导致电源系统出现故障,这台交换机当场就报废了。幸运的是,这是只“廉价的”24口10/100交换机,只要跑一趟Staples买来一只新的换掉就行。但是,当时是晚上10点后进行深夜维护的时段,所以只好等到第二天才能去买。 

可是,在接下来的维护工作中,我们还需要那几条管理链路。我最后从会议室借来了一只交换机,确保完成当晚剩余的工作。

可以从两个角度来看待这件事。第一个角度是,我本来就不该画蛇添足拔那根线,否则一切都正常。第二个角度是,我加快了那个电源故障的发生,让问题在我们都在场的时候暴露出来,而不是在未来某个也许很不走运的时间点。从第二个角度看来这倒是件好事,不过要是让我从头来过,我肯定不会去动那条电源线。

蠢事儿二:更新强迫症导致系统无法运行

在生产系统上,你偶尔会一时心血来潮,想更新固件以及/或者软件。这种情况下,你对交换机、路由器或服务器进行的是全然不同的操作;你注意到某个软件或交换机固件有了一两个更新版本。随后,你决定采用这个新版本。十之八九,更新软件或固件不会造成任何问题,一切按计划进行(不过实际上,这个固件更新根本不在原本的计划内)。但是也不排除更新后系统反而运行不了的小概率事情。

蠢事儿三:强迫改善某几项配置参数导致搞砸了整个配置

在某个重要项目、应用软件或其他系统的部署阶段,所有必要的部分均已落实到位,概念证明工作也在顺利地开展,部署到生产环境的工作一切看起来很正常。在你决定仔细检查系统、确保一切都尽善尽美之前,系统确实堪称完美。 

在有点强迫症似地力求改进的这个期间,你看到有几个参数似乎没有设置好——比如像辅助NTP(网络时间协议)服务器字段出现拼写错误,或者某个配置参数缺少描述条目,等等这些无关紧要的问题。这些本身其实都不是什么严重问题,只不过还不是很正确,你觉得应该弄弄好。

于是,你屁颠屁颠地改正了NTP地址,或者在文本字段添加了一个简短的描述,随后保存了配置。这时候,你突然认识到自己没有备份之前的配置;而不知什么原因,另一名管理员一直在捣鼓另外一些设置。你保存好了配置,实际上破坏了整个系统之前没什么问题的配置。但是你就是觉得那个辅助NTP服务器字段非改正过来不可。

结论

所有这些强迫症其实基本上是直冒傻气的行为——IT行当的这个现象就相当于,有人看到墙上贴着一张纸,看着不顺眼就一把扯下来,结果在墙纸上留下了一个硕大的洞;或者是看到一根线丝露在羊毛衫外头,忍不住把它扯下来,结果搞得一团糟,真是弄巧成拙。 

其实许多时候,大的方面很容易搞定。事先又没有考虑充分地改动小细节,只会把事情搞砸了。这对于有不同程度强迫症的系统管理员而言,一定要引以为鉴。即使真的无法忍受某些不完美的地方,在进行任何修改之前,一定要按照标准的流程做好备份,确保系统的可回滚性。

你有哪些因强迫症而做过的蠢事?不妨与我们分享一下。

原文:Admin tip: Leave well enough alone, dummy

原文链接:http://os.51cto.com/art/201105/259430.htm

标签: 标准 服务器 计划 网络 问题

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:安全审计打造固若金汤的数据堡垒(二)

下一篇:借机三网融合 IT运营前景无限