深蓝海域KMPRO

6西格玛考核ITSM

2008-04-01 17:18

实施DMAIC模型的7个步骤

“你说什么?网络平均响应时间已经达到了服务水平?!可我在系统里查订单怎么越来越慢!”

“你提交的报告确实显示你们缩短了故障响应时间,可我的问题解决了没有?你们实施ITIL也一年了吧?我承认IT部门的态度是好了不少,可问题解决不了,各业务部门的意见还是很大……”

这种责备是IT部门最常见不过的了。IT系统速度越来越慢,不可预期的宕机,对纵向业务的服务可用性管理依然困扰着IT部门。

面对业务部门日渐增加的需求,CIO们的一个疑惑是:我已经全部或部分实施了IT服务的支持流程,却还是有内部用户不满意,我应该如何考核我现在的IT服务系统呢?如果要改善服务流程,我该从何入手呢?

“面向业务,提高服务”在企业IT部门中已经成为老生常谈的话题。如今,国内大部分IT应用较为成熟的企业,均建立了面向服务的IT组织架构。相当一部分的IT投资被用来提高服务,IT管理部门大量采购与IT服务管理相关的工具,如系统、网络、数据库的监控工具和平台软件;同时派遣众多IT从业人员通过ITIL认证考试。可以说,IT服务管理的成熟度已经从初始的混乱状态向反应式管理(Reactive)或主动式管理(Proactive)迈进。但是业务用户的对IT的期望也在向前发展。

把6西格玛引入ITSM

什么是6西格玛?直白的解释是在统计学中,σ是希腊字符,代表标准差,用来对变异进行测量。对于任何企业来说,过程变异是他们最大的敌人之一,因为过多的过程变异会导致产品和服务无法满足客户要求,为企业带来损失。大多数企业的运作过程保持在3至4个西格马的水平,也就是说在100万个造成缺陷机会中,存在6200至68000个缺陷。相对而言,保持6西格玛运作的企业,在100万个造成缺陷的机会中,只有不到3.4个缺陷。

这里要注意两点。第一,6西格玛不仅研究平均,而且关注波动 (散布)。比如,在ITIL的事件管理流程中,KPI是事件响应时间。在衡量这个指标时,是使用最长时间呢,还是最短时间?在笔者接触的IT服务管理人员中,大部分使用平均时间为考核点。但在统计学中,这并不能反映真实的质量情况。6西格玛追求的是精密度高和正确度高并重,目标是减小波动目标。在IT服务管理中引入6西格玛是要关注被考核指标的分布情况。

应该注意的第二点是,6西格玛方法是关于一种持续改进过程的方法论,而不是一套度量体系。6西格玛可通过DMAIC系统方法来完成。6西格玛DMAIC过程(D-定义、M-测量、A-分析、I-改善和C-控制)主要针对不能满足要求的过程,对其进行突破性改善。

以客为尊 流程为重

6西格玛把顾客放在第一位。例如在衡量部门或员工绩效时,必须站在顾客的角度思考。先了解顾客的需求是什么,再针对这些需求来设定企业目标、衡量绩效。在DMAIC流程中的定义阶段和管理阶段的一项重要技术就是VOC(Voice of Customer,客户的声音)。

在定义阶段,IT部门可通过对客户的调查及访问来识别哪些质量要素是关键的,哪些环节需要改进。在管理阶段,也正是通过客户的反馈来衡量改进的成效。对于IT服务管理而言,除了部署大量工具监控我们的基础架构和建设服务台外,加强对业务用户的体验管理(End User Experience Management)也应提到战略高度予以重视。

无论是设计产品,还是提升顾客满意度,6西格玛都把流程当作是通往成功的工具,是一种提供顾客价值与竞争优势的方法。6西格玛改进和评估的对象以流程为单位。在制造业中,6西格玛以原料→输入→加工→输出→客户为流程,按照人(态度与技能)、机(设备)、料(原材料)、测(测量)、法(工艺流程)、环(场地与环境)用鱼骨图法进行质量要因分析。在不断深入挖掘问题的过程中,定位问题所在。

在IT服务管理中,IT部门可以参照类似的方式,不同的是改进和评估的对象变成了不同级别的服务或流程。比如电子邮件服务,它的CTQ(关键质量要素)可能因客户的需求定义为与电子邮件服务相关的服务水平协议,在流程活动层也可以是一个IT服务流程中的KPI。

ITIL建立了一致性的流程,6西格玛通过消除缺陷来提高服务质量。ITIL告诉我们做什么,6西格玛解决如何做。此外,6西格玛还为IT提供了一种建立服务质量水准的方法,来专注那些对客户重要的事情。6西格玛在各行各业都取得了显著成功,ITIL在IT行业有着广泛的应用。二者的结合将帮助IT更加有效地提升业务。

持续服务改进是IT服务管理生命周期中的重要环节。由于业务的不断发展和变化,保持满足业务和客户的期望的能力也变得十分重要。

ITIL v3的持续改进的七个步骤包括定义你要测量的、定义你可以测量的、收集数据、处理数据、分析数据、展现/评估数据和实施改进行为。这7个步骤与6西格玛的DMAIC完全吻合。

识别服务考评指标

如何通过6西格玛方法建立考评体系?其实,6西格玛的方法不提供指标,但是有助于消除衡量指标的缺陷,那如何确定指标呢?在DMAIC的定义阶段,通过了解VOC来选定关键质量要素(CTQ)。IT部门还可以通过整合VOC和CTQ的信息建立矩阵,做质量功能展开(Quality Function Deployment,QFD),用以鉴别需求,将其量化并排序,并体现到产品、服务及流程设计中。

对于今天的IT系统而言,有着各个层面的CTQ,它可以是一个业务应用的可用性,也可以是该应用中一个用户登录的场景的响应时间,甚至可以是支撑这个应用的某个路由器的丢包率。那它们之间的关系和影响如何?IT部门可以运用6西格玛流程图(Process Map)建立服务、流程和其他IT基础架构之间的关系。通过柏拉图描述各种因素对IT服务质量的影响程度。

在以上这一小段描述涉及了VOC、QFD、Process Map和柏拉图四种6西格玛工具,它们对于建立IT服务管理考核指标会有很大帮助。如果已经建立了以ITIL作为参照的IT服务管理流程,那境遇就更加令人羡慕了。在各个流程中所给出的KPI和CSF为QFD提供了丰富的输入。要知道,其他行业的质量改进人员,通常需要运用头脑风暴法为QFD进行输入准备。

链接:6西格玛管理方法的常用工具

柏拉图(Pareto Chart)

根据意大利经济学家Pareto的理论命名的,著名的80/20法则就是他提出的。对于6西格玛而言,在流程中大部分的缺陷经常是由相对较少的原因造成的。在DMIC中测量和分析阶段,我们经常要用到Pareto Chart,以分析造成关键质量缺陷的主要原因。
鱼骨图(Cause and Effect Matrix)

对效果根源进行鉴别,分类及排序的方法。使用步骤主要包括:1.确认主要原因类型;2.利用头脑风暴法对每类原因进行细分;3.对每个原因的重要性加以权重评定。

流程图(Process Map)

它和ITIL里提到的流程图不同,它用来表达人、流程和技术之间的关系。在IT服务管理中,它描述了IT服务如何支持流程以及那些IT基础架构如何被IT服务所使用。这些信息基本相当于在业务服务管理实施中服务建模的工作。

控制图(Control Chart)

控制图表示了流程或服务的质量水平在设定的范围内波动的情况,以确定服务质量是否已经反常。

控制图是IT管理人员日常最为熟悉的一种图表。对于控制图的观察,要注意以下异动:离群值(Outliers)——控制界限外的任何一点;趋势——持续上升或下降的点;移动或流动——持续高于或低于平均的点;周期——一系列的点上上下下或像波状趋势的上下;倾向——各点持续落在中线附近或控制界线内外的情形。

链接:ITSM实施6西格玛的几条建议

以客户为中心

在6西格玛的世界中,任何活动都是以客户为中心的。在开展提高服务质量的活动之前,最好建立起一套行之有效的最终用户体验管理系统,那将有效地建立质量基线。

根源分析

在IT服务管理中实施6西格玛的主要活动就是分析,企业可以发现6西格玛在分析阶段具有最多的技术和工具。6西格玛是基于事实和数据的方法。幸运的是,IT系统有着丰富而翔实的基础数据,企业可以通过流程图来将其组织起来,但依然不要忘记,要基于业务场景和用户体验来组织信息。

迭代法实施

一个完整服务模型的建立是艰苦而长期的工作,经常会成为质量活动的瓶颈。建议大家可以用迭代法逐步实施,可以按CI(配置项目)种类分别实施,也可以业务场景分别实施。可能有人担心会破坏数据的完整性,其实只要在CI分类时具有一定的前瞻性,对于CI的属性和CI之间的关系都可以逐步完善。

案例:为了可用性提高6%的三次投资

某金融企业,聘请了一个国际IT外包服务商运用业务服务管理(BSM)软件作为相应的评估工具,进行了一次IT服务质量的评估及改进,设定了十分简单的质量目标——将业务应用的可用性由94%提高到99%。这个企业的CIO已经在过去的几年里为实现这个目标进行了三次投资。

第一次投资:服务器应用性能分析

第一次投资的目的是应用性能分析,他们采购了应用服务器监控分析软件。这些软件可以在生产环境中监控应用软件的运行,可以告诉运维人员应用程序之间的调用关系以及他们对系统资源的占用情况,并可有效地监测内存泄漏问题。这个方案上线后,部分解决了应用维护部门与应用开发部门之间的推委扯皮现象,应用问题解决周期缩短了。但是,系统整体运行情况仍不乐观,甚至出现过对外服务的网上应用中断服务的严重事件。

第二次投资:网络应用分析

对外服务的网上应用是以网络为基础的,于是第二次投资的重点聚焦到了网络部门。网络部门是该企业应用自动化管理手段最早的部门,已经部署过网络管理产品。这次投资部署的是网络应用分析软件,对网络里的各种应用的流量和流向进行跟踪测量,并从响应时间的角度建立服务水平的基线。一次,某一条链路的网络流量激增,网络部门通过工具定位到是哪一种应用导致,该应用在做什么操作。应用维护部门的人通过应用性能分析工具发现该应用是在进行数据操作,但明显不够优化,该应用为了类似的数据操作反复建立数据库连接,使用网络负载恶化。到了这里,球又回到了开发部门手里。

读者们可能认为,该企业已经够幸运了,他们至少有办法找到问题所在。但CIO的感受并非如此。上述例子中的应用都是近年来新开发的。作为一家历史悠久的金融企业,他们有着许多无法部署各种时下流行的监控手段的应用,而且这些老应用恰恰是该企业的核心价值所在。

此外,业务部门也不关心IT部门内部的官司,他们只知道业务受影响了、客户受影响了。“我感谢IT部门这些年作出的卓越努力,但我们来自网上业务的数字正在降低,我相信系统的稳定性是问题之一。”在一次董事会上,主管业务的高级副总裁如是说。

第三次投资:终端用户体验管理

CIO开始反思,过去的IT管理投资大部分集中在帮助IT人员寻找适合的工具,而忽视了客户的感受,这其实是有违常识的。多年来,企业一直是面向业务的系统花大钱,面向内部的OA系统花小钱,怎么在面对IT部门的客户——业务部门的问题,反而本末倒置了呢!

于是,这位CIO决定重视客户的声音,第三次投资建立了终端用户体验管理系统(End User Experience Management),通过网络包侦听和模拟用户行为,来感知用户在使用该企业系统时的真实感受,建立起基于用户体验的服务质量基线。同年,这位CIO决定为自己庞大的IT系统作一次全面体检,理清其间千丝万缕的联系及他们对业务的影响,于是邀请前文提到的服务商为自己进行提高IT服务质量的咨询服务。

该服务商在了解了客户的基本需求后,将自己提供的方案定位为:使用服务管理软件建立面向业务的IT服务模型;提供一个考评指标驱动的持续改进体系;以最小的成本与风险实施6西格玛方法;在短期内提供一个可供长期服务质量提高的基础。

该服务商没有遵从6西格玛的每一个步骤,而是采取了跳跃式的方法,分为评估和部署实施两个步骤进行。在评估阶段,先定义业务服务,通过客户访谈罗列出该公司的业务;然后评估数据的有效性,收集整理客户现有IT服务管理的数据,包括ITIL流程系统的报表和各种监控手段收集的数据;接着,评估ITSM流程的成熟度,依据ITIL成熟度评估的工具表格进行客户访谈,并评估其流程的成熟度;最后将收集到的数据导入6西格玛工具并生成输出,在这一阶段主要用到柏拉图和鱼骨图,并初步建立质量功能展开。这时,流程图尚未建立,无法得到详细的质量功能展开,关键质量要素在完成客户访谈后予以确认。

在部署与实施阶段,该服务商先应用服务管理软件建立IT基础架构,组建和IT服务的关系,将IT基础架构与业务映射,然后与企业已有的监控手段集成,收集IT服务的运行数据,接着获得与关键质量要素相关的服务质量控制图(Control Chart),最后判断故障根源和业务影响。

该服务商遵循了一个原则,希望对大家有所启示。CI(配置项目)的粒度根据业务和企业的IT运维能力决定,清晰及相对稳定的CI分类,以迭代法实施建模工作。在此案例中,服务商并未完成该企业全部IT系统的服务管理建模,仅选取了几个高等级关键质量要素的应用。由于他们所采用的业务服务管理软件内置了6西格玛的一些工具,因此轻松地建立了为客户提供持续服务改进——DMAIC的技术手段。

记者手记:ITSM 借绩效考核东风前行

管理大师彼得·德鲁克在其关于管理实践的论述中明确指出,如何衡量一个企业或组织是否真正创造了客户价值,即如何管理与衡量绩效,成为管理学上的一个重要课题。

高效运行与维护IT系统,对持续支持企业业务与战略发展日益重要。IT运维已成为企业普遍关注且不堪重负的问题。运维工作本身的困难和艰辛也让运维人员成为业界揶揄调侃的对象。

那么,怎样才能更有条理地展开IT运维工作,怎样才能让运维人员的工作有据可查、奖惩有据,怎样才能让IT运维对IT系统和业务发展体现出更大价值呢?

对于IT服务的提供者,无论是企业IT部门还是外包服务提供商,对他们工作的绩效考核成为当今企业管理乃至产业发展的一个重要课题。

但ITSM为何成为考核管理的死角?ITSM的绩效考核该考核谁,如何考核,怎样才能不流于形式,从而真正地促进IT服务管理发展,是业内人士应该关注并不断努力实践的。展露ITSM考核现状,提出问题,引起共鸣,通过对考核方法与案例实践的探讨分析,推动ITSM更加规范化、标准化,是本报组织本次专题的初衷所在。

希冀ITSM能借绩效考核的东风继续前行!

来源:中计在线

相关推荐