IT服务的新探索:精准运维
2018-06-11 来源:
近年来国内IT产业的发展格局始终与我国的经济转型与创新创业的社会大潮息息相关,纵观国内国际形势,IT产业将成为创新经济形势下的支柱产业。IT服务行业作为IT产业的一个关键领域经历了为设备服务、为系统服务和为人服务三个重要的发展阶段。精准运维是在以人为本的基础上,为满足服务对象的业务需求而产生的IT服务新模式,其深刻体现IT服务价值始终以业务需求为导向的理念,是精益管理在IT行业的有效应用。
人物简介
李鹏, 中国信息技术服务标准技术委员会专家,IT运维实验室行业专家,ISO20000国际认证管理师,从事IT安全及运维管理工作近二十年。近年致力于提升中国本土企业IT治理水平,坚持倡导运用国际先进的IT服务管理理念,结合企业实际开展IT系统的安全及运维管理。
一、精准运维的由来
人类从农耕火种到探索太空,科技文明随着斗转星移得到了长足的进展,从十八世纪工业革命到二十一世纪的信息技术蓬勃兴起,我们发明了很多有效的管理手段来提升生产和服务的效率。
精准运维是依托于精益管理的科学理念,将IT服务的效能在既定的资源配置下做到最大化的一种科学方法。精益管理源于精益生产。精益生产(Lean Production)是美国麻省理工学院教授詹姆斯.P.沃麦克等专家提出的,他们认为日本丰田汽车公司的生产方式体现了精益管理的精神,精益管理是最适用于现代制造企业的一种生产组织管理方式。精益管理目前已经逐步延伸到企业的各项管理业务中。它能够通过提高顾客满意度、降低成本、提高质量、加快流程速度和改善资本投入,使股东价值实现最大化。精准运维强调提供的IT运维服务不仅是满足客户的信息系统的服务更是满足客户的业务需求的服务,强调IT服务价值的体现应符合IT服务生命周期。精准运维应从业务的视角考虑资源、安全和效率对企业的价值贡献。
二、精准运维的定义
精准运维是一种IT运维服务方法,它是通过一系列方法掌握服务对象的信息系统的特性以及该信息系统所服务的企业业务特性,找准目标,从而精准的规划服务计划,提供服务建议以及以较小的代价有效展开主动服务和快速响应。
精准运维有别于传统IT运维,它的重点不但着眼于所服务的IT系统本身,更着眼于该系统所服务的企业自身的主营业务。企业事业单位的信息系统从根本上说是为企业自身业务活动而服务的。精准运维不仅是为信息系统服务的,更是通过理解企业业务本身来更好地实施IT运维服务。它通过对企业业务活动规律的信息采集以及系统软硬件特点的采集、建模、加上科学的分析、客观的评估、先进的预测、动态的调优等手段,不但保障了信息系统高效稳定运行,而且使信息系统达到与业务精准匹配的状态。
三、精准运维的方法
1.精准运维能解决什么问题
传统IT运维工作常常遇到一些困惑。一是在进行信息系统架构设计和选型时常常为了保证高可用性和可靠性对IT资源的投资存在一定的设计冗余,而用户往往不能有效的利用信息系统对业务活动的波动及时应对,无法将这部分资源转化为有效的生产力,造成无形中的IT资源浪费并产生抱怨。二是在采纳新的IT技术过程中如何将信息安全尤其是主营业务数据的安全策略应用在IT运维服务中,比如云计算和大数据技术在安全策略如何有效的纳入到日常的IT运维管理中?三是随着信息系统硬件设备逐年折旧和软件系统的升级改造,如何减少支撑主营业务的信息系统产生中断的频次和缩短因中断而需要恢复的时长,并且投入较低的运维成本?
精准运维的核心理念有三点,第一确保IT资源的价值在业务活动中得到充分的发挥;第二确保信息资源的安全系数与企业的安全等级要求相匹配;第三确保IT系统的运行满足主营业务的运营效率要求。精准运维的这三个核心理念将能够因地制宜的解决企业事业单位遇到的这些深层次运维问题。
2.精准运维提供哪些服务
精准运维围绕提升资源使用率、提高系统安全性和改善业务运行效率三个核心理念将为用户提供以下服务。
提供精准运维管理咨询:向企事业单位分享精准运维最佳实践案例,介绍实用且有效的信息化运维流程,诊断现行IT运维中所遇到的瓶颈问题。
提供信息化系统的优化方案:针对企业现行信息系统的资源与具体的业务变动需求提供有效的信息系统优化建议方案。
制订应急预案:帮助企业单位按照关键业务流程梳理关键业务节点,建立健全关键业务流程节点的应急保障预案,实现对故障的快速响应、及时诊断和高效恢复。
协助维护保养:根据企事业单位的需要将精准运维咨询方案中提出的改进举措,协助企事业单位完成需要落地实施的系统维护保养工作。
协助行业对标:助企业开展同行业运维指标的对标活动,从而了解本单位所处的位置,并根据现行的运维绩效指标达成情况设计改善的方向。
3.精准运维的原理
精准运维的原理利用一套精准运维成熟度分析模型,通过对服务企业的系统以及业务的调研、分析找出服务的最佳方案并实施。
精准运维成熟度分析模型是假设某IT系统服务的企业业务是Y,影响Y在不同时期的最佳效果的四个关键因素是人员为X1,环境为X2,软件为X3,硬件为X4。在此我们可借用函数式来理解,即Y(t)=f(X1、X2、X3、X4)。模型是通过Y的需求和系统的特性以及IT最佳实践经验倒推出X1、X2、X3、X4应具备的相应要求范围,同时通过调研分析企业的实际四个因素的情况进行比较分析找出差距,找到重点要服务的事项与方法。由于企业发展的,其服务它的IT系统也要适应它而变化发展,特别随时间推移硬件设备还在老化,因此,还要用发展的眼光来看待运维服务工作,精准运维必须考虑企业可见的发展预测四大因素的要求,从而及早应对。当然精准运维也用到了统计学的数据分析方法包括数据描述性分析、线性回归分析、方差分析、相关性分析等。
业务相关性分析法
业务相关性分析法主要是将信息系统安全、稳定、可靠运行的关键影响因素:人员、环境、硬件、软件等与现行业务进行相关性分析,从而找出管理中的优势与不足,让优势得以巩固形成长效机制,让短板得以改善补足竞争中的差距。
关键节点因果分析法
关键节点因果分析法是一种发现问题“根本原因”的方法,从分析业务流程与运维流程各节点之间的关系入手,梳理哪些运维流程节点是影响业务正常运行的重要因素?首先对常见故障中的问题点进行分类(如人员、环境、软件、硬件、网络、接口因素等),其次对找出的各要素进行归类、整理,明确其从属关系,分析选取重要因素,明确这些重要因素是否有前置影响因素。在通过重要因素帕累托分析法判断哪些运维流程节点投入什么资源可以有效保障主营业务的顺畅执行,从而确保业务得以顺利开展。
重要因素帕累托分析法
我们将运用二八原则,使用帕累托分析法在众多的关键运维流程节点中进行数据分析,判断哪些关键节点属于重要因素影响80%的业务达到安全、可靠、稳定运行,从而为制定优先的运维服务应急预案提供科学的分析依据。
设备贬值分析法
设备贬值指设备由于运行中的磨损和暴露在自然环境中的侵蚀,造成设备实体形态的损耗,引起的贬值。 设备贬值分析法可以帮助我们合理的估算设备的损耗带来的潜在故障风险,从而帮助企事业单位进行有计划、有步骤地进行设备更新评估和采购预算。设备贬值分析法通常有两种方式,一种是年限法,即从设备的使用寿命角度来估算贬值,它假设机器设备有一定的使用寿命,所评估的机器设备的贬值率是与其已使用年限成正比的,并且是线性关系。 贬值率=已使用年限/(已使用年限+尚可使用年限);另一种是修复费用法,这种方法的使用前提是设备的实体性损耗是可补偿性的,那么用于修复实体性损耗的费用就是设备的实体性贬值。比如,一台服务器的主板损坏,如要修复该主板,必需更换主板,更换主板的费用即为服务器本次的实体性贬值。
绩效指标行业对标法
绩效指标行业对标法是将目前我们所采用的衡量IT系统运维状况的绩效指标与行业内其他企事业单位的绩效指标进行对比,了解我们所处在的位置,计划我们努力和改进的方向。通常,选择的对标对象有两条路径,一是对标对象可以是行业内具有直接竞争关系的,二是对标对象可以是行业内不同市场区域内没有直接竞争关系的。同时行业对标还需要与业界普遍认同的标准进行对比,通过规范、连续的比较分析,帮助企事业单位寻找、确认、跟踪、学习并超越自己的竞争目标,它是对标杆管理的内部工作结果指标的应用管理,管理的过程主要是把本企业的运行情况同标准对比,并比照标准持续改进。
4.精准运维由谁来做
精准运维的项目主导方应该是企事业单位中既了解业务又了解IT架构的信息管理人员,他们将主导和推动精准运维服务提供商开展一系列有价值的运维服务工作。精准运维服务提供商需要充分理解企事业单位的业务流程与信息系统之间的协作关系、业务绩效指标要求与信息系统绩效指标的联动关系。他们能够根据对业务的理解进行有效的精准运维咨询和实施方案的规划设计。当涉及的信息系统对企事业单位的主营业务具有重要的影响时,精准运维项目的推动将需要企事业单位的一把手给予相应的支持和推动。
5.精准运维的实施流程
精准运维的实施流程主要包括四个阶段,如图3所示。
6.精准运维的时间要求
精准运维服务不是一蹴而就的面子工程,它需要按照科学严谨的态度进行精准的数据采集、数据分析、业务跟踪、方案设计等阶段,方案成型后仍需要进行试点运行、方案调优及常态化实施等一系列的步骤。因此精准运维项目从立项到见到成效必将经历少则三个月,多则一年的项目周期,这需要视业务与系统的复杂程度而确定。
7.精准运维的执行地点
精准运维的实施地点将在企事业单位的工作现场和精准运维服务提供商的工作场所共同展开。在项目前期,项目双方将在企事业单位的工作现场进行调研和部署相应数据采集工具。在项目中期服务提供商将在自己的工作场所进行定期的远程监控和数据分析工作,期间双方成员将定期交流项目进度和阶段性成果以确保项目的进展符合最初的预期。项目后期服务提供商将结合企业的实际要求提交咨询和设计方案。如双方确认了精准运维服务的维护保养服务仍然有精准运维服务提供商承担,则需要根据实际情况确认是否安排驻场运维及后续的相关工作。
四、精准运维的实践
经过实践的检验才有可能发现真理,精准运维服务是否确实如笔者所描述的那么有利于企事业单位的IT运维工作需要实践的检验。下面是笔者亲历的精准运维咨询案例,期望能够抛砖引玉,与业内同行共同探讨精准运维的发展前景。
企业背景:某企业,从事生产制造业务。其IT信息化技术主要应用于:销售部门根据客户需求,通过交互平台,提交订单,生产部门在交互平台中根据订单数量,制定生产计划并投入生产。目前销售部与其零售终端用户使用交互平台用户已有1100人左右,生产部门使用交互平用户有70人左右;此信息交互平台使用WebSphere、Oracle数据库,硬件设备包括:7台服务器、3台存储阵列、2台光纤交换机,作为底层硬件支撑,硬件设备使用年限均为3年。
目前企业销售部门反映两大节日前交互系统页面运行缓慢,经常需要经过漫长的等待才能进入所需要的页面模块,对系统进行操作时,也需要耐心等待系统才能进行响应。由于此问题严重影响了该企业的工作效率、导致正常业务无法按时完成、并使用人员工作热情降低、维护人员处理后问题却又频繁发生,相关部门主管为此头疼不已。而精准运维服务提供商可以按照精准运维的理论方法加以解决。
首先针对企业关键的业务数据相关信息进行采集,包括:生产或销售特点、业务操作高峰时段、业务流程等进行采集;另外,通过现场、远程、访谈等方式,全面采集信息系统软件集的各类数据信息,找到突出的性能和特性。包括原始数据流、网络拓扑结构、系统流程架构、数据加工方式等。通过分析找到了问题的核心包括服务器的部署不合理以及生产企业提前安排生产任务不规范对系统的影响等,最后设计出解决方案。
标签: 安全 标准 大数据 大数据技术 服务器 计划 美国 企业 数据分析 数据库 网络 问题 信息安全 信息化 信息技术 行业 选择 用户 云计算 云计算和大数据 转
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。