2001-12-03 01:30
(杂志刊期:2000年03月)
向你介绍建造数据仓库的五个重要步骤。
Barbara C. Gaskin 著
在这个信息时代,速度、灵活性以及前瞻性是一个成功组织有别于其它组织的主要标志。因此,当今企业必须有一个行之有效的管理机制,使之既能有效监控组织运作,又能下放决策权以回应竞争形势的变化,有效利用意外的机会。如何才能保持控制和灵活之间的平衡呢?一个最核心的要素就是共享知识。
如果说知识及智力资本正在成为竞争优势的主要驱动力,那么智能化组织就是一个能够模块化、标准化并在组织内部及外部广泛共享知识的组织。正是这些公司在不断地根据商业计划的变化而转变他们的知识库。
信息系统扮演了一个创造和发布知识的角色。具体地讲,数据仓库就是一个重要的信息系统。它是一个以主题为导向、源于公司事务系统和外部数据源的中央知识库。数据仓库的成功实施会对培育一种知识共享文化产生重大影响。
数据仓库如果使用得当,会为顾客行为、产品或商业活动的效果、利润及成本结构等的深入研究提供工具。然而,象任何有充分根据的研究努力一样,收集和组织起来的数据必须和你想要获得的知识领域相关。许多公司忽视了这一点。虽然数据仓库的建设与公司的整体战略息息相关,它们却没有为此设立一个明确的目标。
在“智力资本:组织的新财富”(Intellectual Capital: The New Wealth of
Organizations)一文中,Thomas A.
Stewart(斯图特)抓住了当今数据仓库存在问题的精髓。他写道:“知识资产,就象资金或者设备一样是存在的,在战略上来说是很值得开发的。但是你又不能明确定义和管理知识资产,除非你知道你想用它们来做什么。”
以下是一个数据仓库建设走入歧途的典型例子。一家高速增长、每个月增加三个电话销售服务中心的公司,想测算这些服务中心的生产率,评估它们的服务质量。在花了9个月时间和800,000美元之后,没有得到任何看得见的利益,于是该项目停了下来。一检查,才发现出了这么多问题:所需要的数据没有收集或者收集不到,最初的数据库范围太广——试图在很短的时间里包括太多的信息。没有花费足够的时间深入了解公司的真正需求。除了最初批准项目外,高级管理层没有就项目实施的优先次序给以充分指导,结果导致了在所需数据与所收集的数据之间出现了断点。
成功的组织应该采用制造业的模式来管理他们的信息资产。数据仓库的覆盖范围取决于你对“适时”(JIT)信息的需求。
孤立的数据就象存货一样,维护起来价值昂贵。存货过多会导致效率低下、成本高昂。孤立的数据与其类似。只有将其转变成能传递给用户使用的知识,这些数据才有用。
在制造业,人们是头脑中先有了最终产品才开始设计。同样,人们必须经过调研才能确定哪种原材料会生产出最好的产品。然后,人们将这些原材料(数据元)制成部件(主题数据仓库)。部件再被装配成产品(数据中心),这些产品会通过各种途径(互联网、内部网、报告、计算机程序等)分发出去。最后,这些产品被不停地调用、增强、升级或者废弃。
建造数据仓库有五个重要步骤:
让数据仓库和商业目标一致
用明确的需求驱动数据仓库。最成功的数据仓库往往产生于正经历重要变革的行业,一个很好的例子就是公用事业。在公用事业行业,长途、市话、蜂窝电话及电报服务正在融合。在许多这类公司里,重大的商业变革在所难免。一开始,这个数据仓库就拥有一群身份明确的用户和一套具体的商业问题,设计数据仓库就是为了回答这些问题。
一个公用事业公司,可以通过增加现有的内部成本数据和竞争对手的成本数据以及制订收入计划书,显著地提升它的数据仓库。它创立了一个按设备类别及使用年限进行成本分析及利润分析的典范。过去,设备管理人员不需要对利润负责;如今,他们有了根据潜在的价格变数采取可潜在降低成本措施的知识,从而使他们在支持资本投资决策方面变得更主动,因为这些决策会使他们的设备比竞争对手更高效。
具竞争力的数据及样本分析是公司制定战略方向的直接依据。这些重要知识在公司上下广泛共享,不仅提高了公司的整体知识水平,而且使公司为快速应变做好了准备。
创立商业驱动型信息结构
在创建数据仓库的过程中,一个重要的步骤就是创立一个信息架构方案,使公司的商业目标与所需要的数据保持一致。考虑一下制定架构方案的三个基本要素:基于商业目标的数据仓库将包括什么样的数据?要支持数据仓库,必须对基础设施做怎样的改变?采用怎样的信息传递机制?
通过建立模型,检测数据仓库中包含的数据能否有效支持目标,可以证明其包含的数据是否得当,还缺少哪些数据或哪些数据难以得到。在此,建模是否恰当是关键。
例如,在典型的营销数据仓库中,通常假设包括所有人口统计学资料。然而,开发数据仓库的一个更有效的方法,是使用建模工具对数据样本进行分析,从而确定出那些最可能影响给定商业目标的参数。这些参数,应该是第一阶段最重要的内容。这种方法简化了数据仓库的结构,并大大减小了数据仓库最初的尺寸。这样,数据仓库的效果很快就会显现,而且不会抑制其性能,其它特性则可以在以后需要时再加入。
然而,企业往往急于在实施数据仓库的初期,就囊括所有可能的数据,这是不必要的。通常,历史数据可以以高度概括的形式保存,具体细节可能并不那么重要。通过创建信息架构方案,就可以权衡必须要包含哪些数据了。
接下来,要对修改或增强基础构造方面的提议进行评估并做出决策,更换那些正在阻碍企业发展、不再收集相关或有效数据的过时处理系统。
最后,要保证该信息架构方案成为从数据仓库获取信息的应用软件的基础。一般来说,需要多种应用软件才能满足广泛用户的需求。分析人员需要功能强大的工具为数据建模,可能会需要一些专用的工具软件。而其他人,如经理和行政人员,只需要一个网络浏览界面,能随时随地获取基本信息就行了。
注意为模块化奠定基础
盖房子的人不会为支撑3000平方英尺的房子而打20000平方英尺的地基。也不会在一开始就打好所有的地基,然后再一座座去盖。他们先设计出方案,标出一块块用地和住宅的位置,然后决定基础设施要求,再建造房子。
这也是建造数据仓库的正确方法。如果你想一蹴而就,一下子就建成能满足所有用户需求的企业数据仓库,是注定要失败的。建造和维护一个企业数据仓库,是一项耗时、费力而又没有终点的任务。你应该先设计一个信息架构(一个企业数据仓库的总体设计),然后逐步实施,重点放在高度重要的商业事件所需要的数据中心或数据传递机制上。用户很快会衍生出商业价值,从而推动数据仓库的发展。
假如有这样一家公司,它的战略是成为最低成本服务供应商。那么,它首先要弄明白公司目前的成本结构,从而找到一种能够在价值链的每个环节削减这些费用的方法。
然而,在一个典型的数据仓库里,信息是以表格形式按照不同的主题分组保存的。这些数据表要组合起来并不容易。可能销售收入或订单信息包含在一组数据表中,而费用信息却在另一组数据表里。从这些信息里产生出按客户或按产品分类的利润分析表,至关重要。可是,大多数企业将这项工作留给了用户,让他们花费大量时间下载这些数据表,自己尝试从中得到所需要的分析。这些数据表通常都非常大,会让用户感到很失望,并觉得数据仓库的价值不大。
创建动态数据中心
数据中心是为企业关注的问题而设计的应用程序。应用程序应用一套丰富的商业规则,对数据仓库的一组信息子集进行修饰、加工,从而产生一个目标分析结果。一个数据中心不必只供一个部门专用。电讯业常见的应用——用户跳槽分析,就不只用于营销部门,而且还用在顾客服务、销售及财务等部门。企业需要确定造成用户跳槽的原因是什么,对公司财务有多大的冲击,销售和顾客服务部门应如何避免用户跳槽的发生。商业变化很快,数据中心应用的根本商业规则也必须不断更新以继续提供价值。
例如一家印刷公司,其产品15年来一直创造高利润,但如今却面临一个重大转折——它的产品过时了,正被它自己的电脑激光出版能力所淘汰。在努力向市场提供新产品时,重要的业绩度量方法就是新产品的销售量在总销售量中所占的百分比,以及这些新产品销售量的增长率。此时,对企业来说,建造一个监控这些度量值的数据中心很重要。如果该企业成功实现了新旧产品的转变,这个数据中心很快就会过时并遭抛弃。而新的关键业务问题将是产品质量、顾客服务或销售渠道的效率问题。此时,其数据中心必须转而关注新的问题。
数据中心应该是一系列不断变化着的目标分析程序,这些应用程序建立于坚实的数据仓库基础之上,并随着商业的变化不断演进。对其成本则应基于这样的考虑,即它们需要不断地改进和维护,否则就会失去价值。
对不完整数据的管理及折中使用
试设想这样一个典型情景。一名行政经理,因为要和一个重要客户的行政总裁会面,他必需掌握大量关于这个客户的知识:这个客户和我们做了多少生意?购买了些什么产品?我们拥有他全部生意的百分之多少?这些基本问题应该很容易回答,但又似乎不可能。
这家公司已通过兼并扩大了很多,对这个具体客户的销售可能涉及20个不同系统。每个系统的不同帐号模式,使轻易得出该客户的跨系统销售额这件事几乎变得不可能。另外,该客户刚刚收购了一家大公司,这件事在分析时也应当一并考虑在内。
另外,复杂的折扣结构使事情更复杂。实际记帐的资金分布在据订单产生的不同的会计系统中。对于这些表面上看来很显然的信息,要信息系统小组在短时间内拿出来似乎是不可能的。
然而,并非一定要完全精确的信息才有价值。往往信息的一个抽样就足以使人们透视一个用户了——有根据的推测总比没有的好。在上述分析中,更有用的是知道在20个系统中,其中17个销售给该客户的是什么,并对这一结果进行评估,从而衍生出一个总销售额的估计值。
对不完整、不全面的数据,应该研究如何使用,清理出有用数据并预测哪些数据需要清理。管理层也应该在一开始就简明地知道可得到什么数据,其不足之处在哪里。建立原型可能是个极有价值的工具,能协助我们形成观点,解释数据完整性问题,达成共识,并且制定出分期实施计划。
通过遵循这些规则,成功建立数据仓库的公司已获得了巨额的投资回报。数据仓库在企业获取和分发知识方面处于中心地位,决策得以支持和加强,组织处于良性状态。基于对潜在商业机会更深入的理解,企业组织可做出快速反应。
原文摘自DM Review杂志(网址:www.dmreview.com)1998年10月号。Decision Support
Technology/Condor Technology Solutions公司1998年登记版权。
作者Barbara C.
Gaskin在设计和开发企业信息系统方面有丰富的经验,是决策支持系统/经济信息系统软件方面的专家,也是评估商业信息需求和管理设计实施问题方面的专家。赵鹏译。