深蓝海域KMPRO

网格技术与知识管理革命(AMT研究院 袁磊)

2005-05-19 10:46

正在兴起的网格技术,为人们对知识信息的需求由文本单元向知识单元深度发展提供了实现的可能性,同时也要求人类采用新的知识组织方式来建立知识管理的大平台。它将改变人类知识生产、知识传播、知识创新、知识分配的传统方式。传统的图书馆学、情报学已难以完成新的历史任务,网格技术将会对知识管理带来革命,并将引发知识管理学的诞生。

人类从工业社会向知识社会演进时,政治经济中心正从“生产”转向“发现、发明和创新”。知识正在成为创新的核心。网格技术将带来知识管理的革命,知识网格将成为知识创新服务的大平台。网格(Grid)这一名字,第一次出现在90年代中期,为高级科学工程所描述的分布式计算永久性基础所用术语。Lan Foster和Carl Kessman的著作《The Grid:Blueprint for New Computing Infrastructure》中第一次对网格作了解释。他预见到未来的网格将是全部计算资源,而目前WWW只是包含信息的文献。网格用户能在他们的分布式高性能计算机上访问和处理存储装有TB数据的全球数据库,通过适当工具来控制资源。

目前,Grid在美国引起革命。加里福尼亚州最近投资3亿多美元在圣地亚哥附近成立了“加州通信与信息技术研究所”,研究所的所长是“国家高性能计算应用中心”(NCSA)的前主任,元计算(Meta Computing)的发明者Larry Smarr。NCSA在历史上曾参与了因特网、Mosaic测览器、计算可视化等多项重要发明,也是目前美国网格项目的一个重要中心。该研究所的主要研究方向之一是开发新型的信息网格技术来构造一个“智能交通基础设施”。很多通过因特网互联为一体的服务器将与公路上的传感器和汽车中的电脑无线地联为一体,从而更有效地控制交通。

美国目前的民用计算网格已含有一百余个结点,每个结点有几十亿到几千亿次的计算能力。最近,美国开始了STAR TAP计划,试图将网格扩展到全世界。目前加入STAR TAP计划的有加拿大、新加坡、日本和中国台湾;即将加入的包括巴西、俄罗斯、北欧、法国和亚太一些国家。信息网格(Information Grid)是中国21世纪的战略性基础设施,它对国民经济和社会发展的作用不亚于电网、交通网,对国家安全的影响不亚于两弹一星。

说到网格为大家带来的好处,我们不能不了解网格的基本组成。

1、 网格的构成与功能

网格是因特网的后继,它是一组一体化的共享资源,将计算机、网络、软件、数据库、仪器和人通过公共的分布式服务连起来。网格实现统一软件标准,互操作环境(COE);服务层能提供无缝的基础设施,形成用户希望的问题求解环境;网格像电力网一样向用户提供计算和服务能力;网格提供巨大的合作机会。网格体现出4大特点:自优化、自组织、自修复、自保护。

网格由6个部分组成,即网格结点、数据库、贵重仪器和设备、可视化设备、宽带网和网格软件。主干网将所有网格结点联成一体,其带宽可达GBPS量级。网格软件提供单一系统映像、透明胜、负载平衡和资源共享等功能。网络系统中的网格操作系统层提供网格的底层管理功能;为编程和使用环境提供用户接口,使一般应用和专门为网格开发的应用能方便和有效地利用网格资源。网格结点、数据库、设备、主干网和网格系统软件构成了一个网格平台。

国家计算网格可提供下列功能:

① 广域的高性能计算环境,不仅支持远端的高性能计算浞掷酶咝阅芗扑阕试矗欢铱山魍窠岬愕淖试葱鞴钩闪霞扑慊肪场?lt;BR>
② 在Internet/Web上,数据和计算资源零散地分布在各个网络站点。而网格中,资源得到统一管理和使用。用户可以通过网格门户(Portal)之类的技术透明地使用整个网格上的资源。他们看到的是一个逻辑门户上的若干与自己相关的频道,而不必在成千上万个网站中去搜索自己想要的信息。

③ 网格操作系统提供目录和缓存等技术,可以大大提高网格信息查询和浏览速度,减少网络流量。

④ 用户、管理员和系统软件协同将零散的原始数据组织成一体化的信息和知识。

⑤ 网格结点是地理上独立的计算和信息中心,根据计算能力和使用方向分为两类:以科学计算为主的结点和以海量信息处理和服务为主的结点。以科学计算为主的网格结点配备有不低于每秒100亿次的计算能力。以海量信息处理为主的网格结点配备有可扩展到TB级容量数据存储设备,以及与之相匹配的信息查询和计算能力。

2、 网格技术对知识管理的挑战

实现网格应用的关键在于网格管理软件。网格的服务包括文件消息、计算、信息内容、事务处理和知识服务等,因此网格可大致分为计算网格、信息网格与知识网格。

网格管理软件在操作系统之上,可以看成是一种中间件。网格管理软件实际上是更高层次的网格操作系统,其核心技术饕且惶寤男畔⑵教ǎǖヒ幌低秤诚螅⒂镆逋荆⊿emantic Web)、智能代理(Agent)和知识本体(Ontology)技术等。

·计算网格:提供原始计算能力,高速宽带和数据处理。完成上述功能,必须是与网络连接和具有浮点计算和逻辑数据处理能力。

·信息网格:采用接口连接主要的信息资源,允许同质对非同质分布信息进行访问。信息网格也需要高级分析以减少得到各种形式的信息所带来的技术的复杂性。

·知识网格:使用基于知识的方法学和技术学。包括知识工程工具,智能软件代理,数学建模,模拟,计划等。知识网格也应对决策制定(从控制室到目标思想者)和假设产生提供智能指南。存储在知识网格中的信息资源应允许支持低层信息和数据的挖掘。

传统知识管理模式的缺陷

传统的信息管理经历了五个发展阶段:20世纪50年代,是将文献与科技结合;60年代,重点研究信息处理基本技术,提高传统图书馆和信息服务工作效能;70年代,重点研究信息处理自动化,图书馆管理自动化、联合编目,计算机检索系统;80年代,重点开发联机检索系统、区域网络化、现代情报分析研究与决策支持;90年代,重点发展互联网信息服务、电子出版、内容开发技术、竞争情报和全球网络化。

传统文献管理方法或是对文献的外部特征进行标引,以提供检索点,或是按文献的学科性质进行分类管理——分类法,或是按文献内容的主要对象选取主题词——主题法。这些方法,在以手工方式为主来组织文献的年代,起到了较好的作用。在运用计算机进行文献管理的最近几十年中,应该说也还是在继续应用图书情报学的这些传统的成果与方法。但是,国内外的许多有识之士,早就对这种以文献为单元的管理方法提出了质疑,而把目标定位在知识管理上。传统的情报学的发展已经到了一个新的转折点,应该突破传统的专业角色和视野来总结和发展情报学,并提出了建立“知识体系科学”的建议。

“知识组织”这个概念早在1929年英国著名的分类法专家H·E·布利斯就曾使用过。1989年,在德国法兰克福成立了国际性学术机构“国际知识组织学会”(ISKO);1996年,ISKO华盛顿年会决定将ISKO秘书处移至哥本哈根皇家图书馆学院。此外,自1993年1月1日起,历史悠久、影响广泛的国际性学术刊物《国际分类法》(IC)更名为《知识组织》(KO),由ISKO主办。时至今日有关研究的注意力大多集中在方法的改进上。但方法毕竟只是工具,不断改进工具不能作为某一学科的目标和研究领域。

80年代初,著名的情报学家布鲁克斯提出绘制“认知地图”的任务。他尖锐地批评了当前在图书馆界和情报界流行的分类法和主题法,认为这两种传统方法组织的不是知识,而是知识的载体——文献,以此组建的检索系统只能提供文献线索,而不能提供情报用户真正需要的知识。美国情报科学研究所研究人员斯摩尔(H·Small)提出用思想“网络图”揭示重大发现。用学术思想“网络图”来表述重大发现的来龙去脉。

“情报组织”往往被局限在情报存贮与检索系统领域,从信息、知识和情报三者之间的关系以及信息污染和知识存贮无序化的角度来看,“情报组织”有很大的局限性,不能适应信息社会乃至知识社会的发展,也不能适应情报科学的发展。布鲁克斯指出:“情报学的任务就是探索和组织客观知识。”而现有的组织知识方式(如题录、索引、文摘、文献数据库等)有两大缺陷:其一,组织的是知识载体——文献,而不是知识本身;其二,检出的文献只含已有的知识,未能揭示其间的内在联系,为产生新知识提供营养土壤。

如果说在手工操作时代,要想对海量的文献信息管理深化到“知识单元”层次只是一种无法实现的理想的话,那么,网格技术的发展,已经从技术手段上为人类的这一梦想提供了实现的可能性。现在的障碍在于,传统的图书情报学理论与方法能否对人类迄今的全部知识成果进行全面的梳理与组织,构建起“知识体系”的框架,并确定各个知识单元之间的逻辑关系。因此,我们认为,图书情报学的发展已经到了一个新的转折点,应该突破传统的专业角色和视野来总结和发展情报学,朝着建立“知识体系科学”的目标发展。

知识网格对知识管理的革命

知识存在生产、管理、利用过程,要采用知识链标引与检索。信息管理向知识管理转变,要解决信息与知识变换。知识网络将由哪些要素构成?一般的,知识网格是知识链路组成的知识网络图。知识网格是由“知识结构”、“知识单元”、“知识元”采用关联和链技术组成的层次知识链网状知识关系图。“知识元”构成了知识网络的最小单位,是求解问题的证据,是知识网络的核心。知识元具有独立性,封装性,继承性,被消息通讯性等特点。知识网络通过网格计算实现知识动态调用,达到知识动态利用。知识管理的重要途径,是知识元的抽取与知识元的对象化关联。

·知识的组织排列:把文本中的知识点看成“知识元”,一个文本中的“知识元”不是孤立的,“知识元”之间必存在一定的联系,这种联系体现“知识元”之间的逻辑依存关系,把这种关系用“知识链”表示。分析“知识链”的构成规则,由知识链构成一个文本的“知识单元”。建立“知识元”与“知识单元”之间的对象关联关系。

·知识检索:利用知识单元和知识元的对象关联关系,建立检索系统的“知识结构”框架。“知识单元”对象与“知识结构”对象存在部分与整体关系,同时知识元对象与知识结构对象存在继承性关系。

·以对象理论建立知识链对象关系模型。解决知识利用的自然性和有效性。

对于知识管理而言,借助知识网格,我们可以预见到:

·对知识管理技术的要求:应用网格技术建立知识链与知识网络结构,达到对单元知识的任意存取。

·在此基础上引入用户因素,变对用户提供间接模糊的文献服务为直接的专指知识服务。

·建立知识网格:知识网格的建立远远比计算网格和信息网格困难,决不能只靠计算机专家来实现,而必须由情报管理专家、科学管理专家以及各学科的专家通力合作,才有可能实现。

网格知识平台是一个集人类当前全部知识为一体的、合理组织的、表述和谐的、动态生长的网络知识集成系统,利用计算机网格通过信息集成和知识集成来实现知识的合理组织和动态生长,从而实现知识产生、传播和应用的总体最优化。这一目标的实现将会把单个人直接与整个人类知识成果连接起来。它会使知识的创新以无法预料的速度迅猛地增长。



 

相关推荐