深蓝海域KMPRO

管理结构性的、半结构性的以及非结构性的数据类型(by AMT 邢华编译)

2002-06-19 11:15

摘要:信息的持续增长和XML数据以及其他类新数据的出现,增加了企业必须管理和使用的半结构性和非结构性数据的数量。因此每个应用程序都要求有自己的数据存储渠道,从而提高获取数据和管理数据的能力,并降低成本。

META Group的新闻分析--来自内容方面的不满:
管理结构性的、半结构性的以及非结构性的数据类型

by AMT 邢华编译

信息的持续增长(在数量上、速度上和种类上)和XML数据以及其他类新数据的出现,增加了企业必须管理和使用的半结构性(比如像XML)和非结构性数据的数量。同时,许多公司正从狭隘的数据水平的基础结构中走出来,——因此要求每一个应用程序都有它自己的数据存储渠道,从而提高获取数据和管理数据的能力,并降低成本(例如,管理、开发等)。

尽管我们不期望大的组织机构达到理想化的状况:即在任何时候,为所有的数据(结构化的、半结构化的合非结构化的)建立一个单一的数据库标准和结构,但是,我们相信企业应该不能够容忍为半结构化的和非结构化的数据准备特殊类型的数据库。“在数据库结构上的战争已经被关系型数据库的卖主赢得了胜利,”META Group的分析师Doug Laney说,“因此,除非用户有对一些特殊的数据类型及其获取的需要,否则他们应该拒绝使用目标导向的和纯XML数据库,以便更好地支持扩展它们的RDBMS管理,从而将这些非结构性的数据类型纳入到其管理之中。

RDBMS管理已经提供了强大的诸如复制、安全、故障切换和负载平衡、广泛的应用程序支持等功能。数据库的提供商们也正在开发更复杂的数据缓存机制来支持更快速地获取这些信息。

延伸部分已经在带有e-mail的RDBMS下开始出现。微软和IBM公司也已经分别开始将Exchange和Notes移入到SQL服务器和DB2上来了。尽管这意味着一个使用Exchange 的Oracle工作站在它的基础结构中,将继续拥有一个非标准的数据库(SQL服务器以及以后的Yukon)(这也是我们不希望公司太早地去获得一个单一数据库标准的原因之一),但是它至少是一个能够对文件进行数据库管理的关系型的数据库。

RDBMS环境也正在扩展到将半结构性数据(例如,XML、catalog、orders)和非结构性的数据(例如文件、影像、声音、录像)融入进来。目前有两项战略正在被执行。Oracle和Microsoft(包括Yukon)正在扩展它们数据库的基础功能,以便将这些数据类型包括在它们自己的数据库中去。与此同时,IBM正在向它的DB2中增加优化的延伸部分,来管理它的核心数据库之外的数据,但只是通过一个共同的管理层而已。小的增值销售商也出于节约成本和提高开发能力的需要(相对于发展他们自己的或是尝试传统的非结构性数据库的供应商而言),在Oracle的9i DB(iFS)上和微软的SharePoint Portal服务器(在2003年中期贮藏库将被SQL服务器所替换)上实施建设。

Oracle和微软公司的这种方法的不好的一方面就在于,它使得用户更多地依赖于这些供应商,并且因此而无法承受注册“误解”带来的种种问题,一个这样的例子涉及到最近在Oracle和一些它的客户之间的争吵。这一争吵是关于“命名使用者”含义的,由于对命名使用者的定义而迫使这些客户不得不支付额外的注册费用给Oracle公司。这种问题潜在的也将会在任何供应商身上发生。

同时,一些第三方供应商(例如像Venetica [VeniceBridge], BEA [Liquid Data])的专家正在试图提供位于数据库层之上的中间件,它把一个单一的管理系统附加在了多样的数据类型之上。现有的内容管理供应商们(例如像FileNET, Vignette, Interwoven, Documentum),也都在通过扩展超过自身数据库的管理能力的途径,向这一领域进军。这种中间件的方法给用户提供了更多的独立性,使它们能够脱离于原来对任何一个单一的内容处理供应商的依赖。由于商业逻辑与管理处于中间件层,所以用户可以(至少在理论上)在该层下运行任何结构性的、半结构性的或是非结构性的数据库,而且更换供应商也要比通常的这样一个大的举动所引起的痛苦要小得多。然而,中间件也容易导致一些运营性的问题。此外,用户会变得依赖于中间件的供应商们,这使得中间件的供应商们面临到不断增加的营销压力。因此,它们中的大多数将会在4到6年内被挤出该市场。

以上这两种方法都还不够成熟。在未来的两年内,随着第三方供应商与占统治地位的数据库供应商们更加紧密的合作,和供应商们对扩展自身的数据库管理能力的不断努力,我们期待着在该市场中能够有一个逐渐的转变。

现有的内容管理供应商们必须意识到,半结构性的和非结构性的数据库市场将会被RDBMS所商品化,这是由现有的产品和成本所决定的。用户们将会不断要求在大型的供应商的解决方案(IBM、Oracle、Microsoft或者是一个更低层次的Sybase)上实现标准化。而这些内容管理的供应商们也必须在元数据的基础上,开始支持这些数据库作为内容存贮的解决方案。

内容管理供应商们所面临的问题之一就是,尽管它们现在拥有一个市场,但是仍将会在未来4到7年内面临被挤出这一市场。这是因为大型的数据库供应商们会将它们数据库的能力不断地向更高的方向发展,与此同时,大型应用程序服务器的供应商们( 例如像Microsoft和IBM,以及其他类似的公司)也会不断扩展它们的应用服务器的能力——这些服务器将能够越来越多地支持显示层(例如像门户)或其下层次,从而可以提供更多的跨数据仓库的管理。随着这一情况的发生,内容管理供应商们将不得不把注意力集中在它们的平台建设上,从而支持纵向的解决方案和横向的应用程序。

尽管RDBMS技术已经演化到容纳结构性的和非结构性的数据、适应其他的基础性的组件(例如像数据集成、元数据、数据质量、数据获取/询问/报告)并因此使信息结构保持其独立的特色,但是那些企图跨越“数据结构连续统”来合并信息管理基础构件和结构的公司将注定会失败。当然,通过索引在结构性的和非结构性的数据中,也是可以建立起交叉的参照关系的。然而,在2005年到2006年之间,企业应该有计划地去维护独立的信息供应链,以便成功地进行跨越信息连续统的管理。

用户行为:很多用户应该意识到在企业范围内,对半结构性和非结构性的数据以及信息基础构件和结构的不统一的管理,在未来的2到3年之内会显得非常的不可行。同时,不管用户使用的是何种特殊的信息管理战略和策略,它们都应该即刻在它们的数据库许可合同中,更加严格的考虑它们所使用的术语、条件和定义,以便使它们在许可证更新的过程中,尽可能的清楚和无异意。当开创一个新项目时,它们也应该仔细衡量一下关系型的DBMS工具、专业化的基础构件和不同的数据结构。

作者联系方式:nazzyxh@sina.com

相关推荐