深蓝海域KMPRO

跨越信息访问的鸿沟!(by AMT 方厚政)

2003-06-17 13:34

摘要: 智能化访问所有的信息--你需要弄清楚寻找什么信息,已知什么信息和如何利用信息。

跨越信息访问的鸿沟!

by AMT方厚政 编译

什么是“非结构化数据”,为什么把非结构化数据“结构化”的呼声越来越高it?非结构化数据大量存在,一般公司80%-90%的信息是非结构化数据。例如Word和PowerPoint文件,电子邮件和公司内部网的时事通讯等都是非结构化数据。员工们常常抱怨当开始一个新项目时总得再次从头开始,以及抱怨要花费大量时间来查找相关文件。现在,信息技术部门正努力帮助用户获取和利用组织里的更多的数据,并把数据同广泛的组织业务活动联系起来。

本文主要讨论如何跨越企业当前于已有的保存在关系数据库里的面向记录的数据和存放在电子文档和文件集里的多如牛毛的网络非结构化数据之间的鸿沟 。最主要目标是帮助企业如何充分利用可获得的信息,从而使企业行为更为明智:最根本的一点,公司想弄清楚自己已经知道了的信息!但是正如许多公司所发现的那样,这并不是件容易的事。

首先,要把大量的原始数据整理的有条有理是件十分困难的事情。但由于特定的用户或工作并不需要所有的信息,所以IT部门开始时一般关注那些尽管只涉及公司信息存储空间较易处理部分但有很大特定价值的应用,更糟糕的是,他们为这类应用所设计的信息访问方法并不适合访问所有信息这一更大目标。这些倾向会破坏公司在信息访问方面长期努力的成果。

可访问公司所有信息的“智能信息访问方法”大目标要求该方法支持访问大量不同任务,方面和项目的信息。知识员工没有时间或不愿意去熟悉许多不同的访问界面或到不同的地方去收集他们不同业务活动所需的信息。这是我们需要首先解决的问题,不是吗?

这成为门户概念和实施发展的驱动力。但是,光有门户是不够的。这不只是让所有的文档通过一个访问渠道获得。这一点,我们在通过网络浏览器访问网站就做到了。

“在所有文档搜索”及其效率低下的单调的逐页浏览方式很难支持公司的即时需求。其他许多功能包括分类,信息可视化,内容挖掘和分析等功能都需要安装以优化原始搜索。当这个更为丰富的交互式内容访问工具集安装后,用户能以统一的渠道访问所有的内容就显得尤为重要了。

但是,公司必须首先搞清楚自己在寻找什么信息,已经有了什么信息和如何利用信息。

一组需要区分的概念

为了实现更好的信息访问,许多相关概念应加以区分。当然,区分原来的结构化数据(关系数据库)VS.非结构化数据(文本)很重要,但是,公司也需要处理好内部(公司)VS.和外部(网站)的需要。通常项目需求分析说明了知识管理系统集成了这些信息分块。

结构化/非结构化:无疑用户想通过门户从关系数据库获取数据和从内容存储集里获取文档,但是,如果只是提供多页的链接是不够的。用户需要内容分析技术来揭示和利用有意义的知识。单纯搜索的意义并不大,知识员工需要通过搜索后的“发现”,即获悉搜索到的信息所蕴含的意义。

内部/外部:显然,组织都需要从外部网站上获取有价值的内容。更难的挑战在于允许用户和组织通过公司内部渠道获取外部信息。例如,某一制药公司的一个研究人员可能很想通过技术词汇如医药主题的标题来了解市场消息,或者根据内部的与该制药公司独特视角相关的分类法来了解相关市场信息。

内容/上下文:人们普遍认为一篇文档的各种相关上下文线索有助于帮助用户确定特定资源是否能为其需要服务。但是由于搜索软件作为基于内容的访问工具的流行,基于内容的元数据概念趋向于被局限为“文档所包含的词句”的搜索引擎方法。然而,文档一般以各种关系和结构涉及多个主题,受到多个方面的影响。基于内容的特征包括语言,语调,流派,多个和两个同时发生的主题,提及的各种项目(人物,地点,组织)等等。这些基于内容衍生的元数据当然能帮助用户更好地挑选文档,但是随着时间的推移,这些元数据可用于开发利用大型文档存储集也变得同样重要。

运作/战略:存储的内容常用来支持特定运营目标(例如,制药公司的药品报告文档)。一旦马上使用后,这些文档被保留下来和根据相关规定或别的原因加以严格控制。通常,这种面向未来的知识管理会丧失与遗留文档相关的机遇。因为“打开”这些营运资料的风险性和许多困难,许多项目只是关注那些容易获得的信息。这是错误的。寻找释放这些被“封存”起来的信息的功用的方法,从而满足支持获取完整知识的要求是很重要的。

对许多公司来说,进行出售其大型IT项目的决策时感到很为难,而且关注象统一信息访问方法这样的最终目标似乎有一定风险。但是,我们都知道“知识就是力量”。大部分的CIO和CEO对那些生成后对组织就没有用的信息十分反感,这将导致竞争性优势的丧失和生产率的下降。

对于有目光长远的组织,解决办法是迭代的实施方法。把智能信息访问方法用于一个接一个的特定项目,充分利用被广泛使用的工具来访问和使用各种来自企业各个部门的信息。

作者联系方式:houzheng.fang@amteam.org

相关推荐