深蓝海域KMPRO

数据管理:电子商务数据的存储问题

2004-07-20 10:12

数据管理:电子商务数据的存储问题

R.A1an Hodgett  徐国华  译   

[摘要]件多情况说明,用于组织中数据存储的消费已经成爆炸状态。产生这种镇况的主要因素是电子邮件和电子商务对数据的质量和数量的要求提高了,并互这种数据大却分是分散的、非结构性的i靶就增加了对组织中数据管理的要求。本文是在溴夫利亚进行的一次调查的基地上做出的.储调查是关于组织中如何处理数据增长和由于数据增长所带来的问题。调查的结果盅示人仍对访问耀表现出蔫度的关注,同时显示出一种乐观的趋势,即技术将对未来出现的各种各样的问题提供解决方案

[关键字]数据管理 政策 存储  存档  访问  备份  法规   

一.简单介绍

2003年初,Butler Gmup作了一篇关于数据管理的深度报告,该报告涵盖了一定范围内数据管理的问题,并将问题分为两方面:商业问题和可用的技术。每一方面包括的主题在表1中列出。   

   

报告中还包括一些主题的结论。我们不能忽略这样一个事实:数据的增长是巨大的。Ganner的服务器和存储研究负责人Phil Sargent,认为:“如果我在任何地方都能看到爆炸性增长,那一定是存储消费。存储需求正以每年50%的速度增加。”[2]而“分析家和销售商达成了一个稀有的共识,这一领域的增长数字在300%到800%之间有规律的变化。”[3],不但数量上增长,而且存储种类和易用性也在变化。“非常感谢Intenet,数据的类型已经发生了变化。今天,如%的数据以非结构化方式存在。”,并且“数据在许多方面增加的速度非常快,一些组织正努力整合信息,提供贯穿企业内部和供应联的数据访问”[4]。面对这些增长,观察组织如何处理数据容量和安全性正是Butler GMup所作报告的重点,并且在这篇报告中还包括了数据安全、数据存储和数据恢复。   

澳大利亚也进行了一项调查来研究组织是如何处理数据的增长及由其所产生的问题。这次调查考察了如下问题:数据管理、数据控制、数据存储及伴随着这些方面所发展起来的技术。在这里,本文就此次调查探讨一下数据存储的安全性。   

二、研究方法   

通过邮寄的方法把调查表邮寄到在澳大利亚选定的企业信息系统管理部门。这次调查所收集到的信息估计了数据存储的要求、数据存储前和过程中所进行筛选的程度、以及伴随着未来数据量的增加,在组织中是否会改变数据存储的形式及由其所产生的问题。这次调查的回复串非常低,只有3%。因此,本文的研究是建立在邮寄调查和面谈调查的基础上的。   

三、研究结果   

在过去的五年里,每个组织的数据容量都发生了增长。尽管所有回复调查的人都同意数据是组织中的重要资源并且数据量的增加非常迅速,但所有回复调查的人中仅有27%能够估计出所持有的数据量。这也能说明为什么通过邮寄调查的回复串较低。   

造成数据爆炸的一种因素可能是在数据存储前和数据存储过程中缺乏数据编辑和数据筛选。我们将被调查的组织所采用的数据编辑和数据筛选方式及每种方式所占被调查对象的比例在表2中列出。   

   

从表2中可以看出约9%的组织对存储产生的所有数据进行大规模的数据筛选是发生在数据有法定或强制性的保留期中。这是因为可能所要求的保留期对数据存储而言是已知的。另外,有两个占18.2%的选项对数据的筛选有很大的自由性,但仅国有18.2%的组织选择定期筛选所有数据,只有9.1%的组织声称对数据进行全面的管理。通过这些数字,我们对在组织中为什么会出现数据量快速增长以至难以控制的状况就不会感到奇怪。在组织中应有意识地对数据进行分类并对那些需要长期存储的数据进行筛选。   

通过邮件调查及面谈,我们可以得知各种组织中是否拥有某种良好的数据管理政策,调查结果如表3所示。

  

从表3我们可以看出,经过几十年的数据丢失和系统崩溃的情况后,许多组织仍旧没有良好的数据备份及恢复的措施和程序。目前,大约有82%的组织没有证明他们的数据保护措施和方针的有效性和在多大程度上有效,但相当多的人仍保持着乐观的态度。约9%的组织公开宣称他们没有关于这方面的良好措施。作为备份和数据恢复的一部分,也只有约73%的组织提供了离线数据存储。看来,需要再经过几十年的数据丢失,优良数据管理措施才可能形成。   

尽管组织中的数据在增加,但也仅有约18%的组织执行了一些限制数据存储的措施。潜在的推断似乎是这样的:技术进步将继续提高存储容量和速度,每字节存储的费用将继续下降,所以就能很容易增加存储容量来存储任何东西,以满足将来可能出现的任何问题。   

几乎没有公司会在措施中说:由于机器作废、软件不能用、过去用于收集和存储数据的软件版本陈旧等原因,导致出现磁性存储的数据消失了或不能打开数据等问题。因此,我们认为应该设法编辑、处理已经归档的资料,其可行的方法是在常规基础上进行系统升级。当我们抛弃无用数据的同时应把相关有用数据导进新的系统。   

伴随着公司不断产生和存储的数据的大量增加,决定什么样的数据库目前正在被组织使用是至关重要的,其对应的资料如表4中所示。令人吃惊的是,尽管要求存储数据在增加,但所有被调查的公司都依赖网络服务器的数据库和用磁带备份的主干计算机数据库,网络上都没有安装任何存储区域或者是拥有数据库的网络。

   

除上述问题外,回答者还被要求确认组织未来五到十年所预见的数据存储问题,以及做出有关电子数据的增加意义的评论。这些回答如表5所示:   

调查显示,净增长速度被认为是一个重要的考虑因素,但许多人表示有许多伴随问题产生。大家都意识到,数据容量的增加将会影响人们存取数据的速度,加大人们提取可用数据的难度。而数据是怎样被管理的、公司怎样才能获取他所拥有的数据也成为人们的一种考虑。   

 随着数据容量的增加,备份资料所花的时间也在增加。因此人们会进一步考虑:在系统出现故障的情况下,用来恢复数据和恢复系统的时间也会跟着增加。这时我们需要更好的存档和恢复系统。然而,还有一个问题需要确定,即与单一的备份不同的是,当需要多重冗余备份时,伴随着控制的复杂性,备份时间和恢复时间也会进一步增加,但估计存储成本会继续下降。这就进一步强调了数据拥有的无法控制地增加的问题。   

在调查中,有关法律与电子数据关系的问题经常被评论。一方面这个问题可以表述为,需求使得组织成为与拥有数据相关的新的、不断增加的立法的产物。另一方面,组织也关系到法律能否迅速变化以适应数据拥有的新形式和增加的多样性。这里给出两个特定的例子:需要修改系统从而在个人使用自己的数据时,出于保密的目的给私人数据提供保护;在许多合法的情况下,需要生产首要文档和磁盘硬拷贝,而不是电子数据。   

此外,调查中还提到大量的其它问题,其中一个是有关数据在工作站和服务器的分配领域。它产生有关安全、控制和总量数据有效性的问题,更进一步的是当出现硬件过时,而现行版本的软件不能读出数据时,储存数据的可用性问题。   

四、结论   

这些结果显示出人们都很清楚地意识到了问题,但几乎不知应如何控制这些问题,普通存在着一种乐观主义,即技术将继续提供更多、更快和更廉价的存储,技术上解决方案将被发现并能够处理未来可能会出现的与数据使用有关的其它问题。在很多例子上,商业决策驱动着政策需求。考虑到这种当需要时就能得到技术解决方案的乐观主义,其现在行动的成本远大于任何利益。他们都是当问题产生了才去解决问题,而不是通过解决方案的预期和准备来预先控制问题。

相关推荐