2003-09-23 10:49
ECM——一个被忽视的机会
by AMT 唐晓辉 编译
在未来10年内,企业内容管理(Enterprise Content Management-ECM)可能变的和关系数据库的应用一样普遍,它也将成为提高企业运作效率的一个关键因素。然而,现有的ECM供应商相对与其潜在的市场而言,还只是占了其很小的一部分。在内容管理方面,ECM系统将是关系数据库管理系统(RDBMS)的一个有效的补充,它们一起将为企业提供完备的内容和信息管理的各项功能。
一、问题的规模
各种资料充分显示,信息容量正在以惊人的速度增长,年增长率到达了200%。位于美国加州的伯克利大学的一项研究估计,世界每年存储的信息在1~2千兆兆(1018)比特之间。
如此巨大的数据,必然需要一个有效的管理。最有效的方法就是使用内容管理系统。有些组织一些信息管理的工具,但是这些特殊的工具只能解决一些特定的问题。它们远没有达到企业真正需要的管理水平――企业内容管理(ECM)。人们日常所产生的数据不仅仅是结构化的数据,也有大量非结构化的数据。关系数据库可以用来管理和有效利用那些结构化的数据,ECM则正是用来管理那些非结构化的数据的。
二、相关技术
基本功能
关系数据库已经在结构化数据存储领域居于主要地位达20年了。RDBMS的功能也在过去的20年中有了长足的发展,不仅仅是用来存储和检索大量的数据。有些现在的RDBMS能够提供各种商务分析工具,有些甚至能够提供较为完善的数据挖掘(Data Mining-DM)功能。
同样,ECM软件也将提供存储和检索内容的体系结构,以及最重要的相关功能――通过录入和检验来管理内容、大量载入数据(可能是从扫描的图片中)、从网站上导入企业组合在一起的内容、以及为使用者输出合适的内容等等。当然在实现这些功能的同时,也可以同时提供存储、管理和检索这些非结构化的数据。
存储模型
人们已经普遍接受了由关系模型发展而来的事务处理系统。能为分析性资料查询提供基础结构的星型结构被广泛应用。在数据库结构和商务模型结构之间有一定程度的相互映射,这就为结构化的数据提供了一个规范的结构。同样,也有非常明确和具体的数据库设计模式。但是对于非结构化的数据则没有相应的方法。
存储非结构化的数据有2种方法――较小的非结构化数据存储在数据库中;较大的则存储在文件系统中。最终就变成如何执行的问题了。在2种情况下,元数据总是转换到RDBMS中去以有效的进行检索。一些供应商,比如Oracle,也有规律的把较大的非结构化数据以大型二进制对象(Binary Large Objects-BLOBs)的形式存储在数据库中,而不采用文件系统。人们对使用什么样的体系最好有很大争论,但是大多数供应商都采取了一种混合的方式。
分类法
对于ECM而言,和传统的存储模型最接近的是分类法。它为内容管理中的搜索和检索提供了一个体系结构。这一方法对分类结构和商务模型结构之间的关系的描述也更为贴切。
内容的存储和分类结构是相对应的,比如,某一特定的分类项目存储在一个特殊的目录下。但是,当分类有所改变的时候,这种方法就变的非常复杂,实际上也常常是这样的。不过非结构化的内容存储也可以大大的简化――至少从逻辑上是可以的――如果存储的内容是无序的,那么用分类结构对其存储地址做索引。这也正是现在很多ECM供应商所采用的方法。
人们都知道,关系数据库设计中,不同的设计者都应该设计出类似的数据存储结构。但是在分类法的设计中则不是这样的。对存储内容的使用方法将决定分类法的体系结构;而不像在RDBMS中那样的,其结构是由数据本身决定的。存储内容的前后关系也是非常重要的。所存储内容的使用决定了其存储结构,即相同的内容在分类时可以采用不同的结构。
传统的数据库索引和分类法的另外一个区别是,传统数据库中大多数数据结构都是静态的,而分类法则必须是动态的以便能够很好的适应商务环境的变化并展开相应的商务活动。比如,技术的定义及其含义会根据市场需求和行业对它的理解而有所变化。就内容管理来说,10年前开始的时候叫“文档管理”,然后是“综合文档管理”,随后则出现了“网络内容管理”,这些综合到一起,就变成了“内容管理”,而现在则叫做“企业内容管理”。分类方法应该能够反应出这些变化,以便能够提供有效的搜索。一个不够灵活的分类方法将带来搜索和检索等问题。
分类法的开发和传统的IT技术不一样。ECM系统的开发者(以及软件供应商)要和有这些技能的专业人员密切合作――包括资料管理员和信息专家等等。这是开发一个能在企业范围内有效应用的内容管理系统的最大挑战。正如关系理论和数据仓库模型是关系数据库的最关键的基础,其发展需要多年的逐步发展一样,分类理论的建立也是有效实施内容管理的关键。
三、ECM的市场需求
为了真正的大量生产、应用ECM系统,其功能必须扩展到组织的各个部门。而现目前的大多数的解决方案都是部门性的。在过去的几年中,网络的大量使用意味着,内容管理已经超越了传统的文件管理。这一趋势还将继续发展。
市场上的高端内容管理系统――比如Documentum、FileNET、Vignette以及Interwoven等――相对于全球的市场而言还只是很小的一部分。全球性的大型企业当然会采用这些系统,有些企业已经在部门中应用了;而很多小型企业也会采用大而复杂的内容管理系统,因为它们的业务主要依赖于对非结构化信息的有效管理。不过对高端系统的需求还只限于大型企业。
不过每个人都能从低端的管理中受益。基本的控制也能提供诸如录入/检出的安全性、在企业局域网内搜索存储的非结构化信息等服务。基于这一点,相对简单的软件也会很受欢迎。这对诸如Microsoft这样的公司有很大的潜在机会。
把高端的内容管理系统和低端的普遍使用的桌面系统结合起来将带来极大的商机,其用户甚至会和现在的数据库使用者一样多。
四、销售商
高端解决方案
内容管理领域现在居于主要地位的是一些独立的销售商,如:Documentum、FileNET以及Vignette等。它们主要集中于市场的顶端部分,其产品价格也比较高。这些供应商对管理复杂的非结构化信息中的问题有很深的了解,它们在未来的市场中也必然占有一席之地。只有数据库销售商-IBM-提供了较为完善的内容管理方案,但是其方案是和数据库方案完全独立的。
IBM、Oracle这样的公司,基于它们在数据库领域的广泛的用户(它们共占有了RDBMS约60%的市场),它们也很容易把其主导地位引入非结构化信息管理领域。尽管在过去的10多年中,这些数据库销售商总尝试把非结构化信息管理整合到数据库管理中去,但效果一直不尽人意。一般情况下,数据库销售商都没有很好的理解非结构化信息的相关问题。由于这些方面的不同,似乎在未来几年中,RDBMS市场不会和高端内容管理市场有什么冲突。
低端解决方案
低端解决方案能够提供相对合适的功能,但是其潜在销售量会大很多。不过,它们的价格必须较低以得到广泛的市场应用。高端解决方案供应商还没有涉足该市场,但是它们也很有可能把简化的软件投入该市场。
目前,只有一家数据库销售商有一套完整的适合低端内容管理的解决方案-Oracle。它的iFS产品提供了存储等基本的非结构化内容管理功能,并把它和其数据库管理软件整合到一起。Oracle正处在一个把内容管理市场和RDBMS市场合并到一起的良好位置。不过Oracle并不打算涉入低端内容管理市场,好像是没有认识到该市场的巨大潜力。Microsoft也正想在未来几年中把所有的内容存储功能整合到其SQL服务器中去,不过它会在文件系统和内容存储之间有所取舍。这很有可能是Microsoft跨入桌面内容管理领域的第一步。
作者联系方式:tangxh99@mails.tsinghua.edu.cn