知识发现与知识服务的关系
2015-04-24 10:36
(一)知识发现
知识发现这个词是1989年8月美国底特律的第一届KDD国际学术会议上正式形成的①。1995年,在加拿大召开了第一届KDD和DM国际学术会议并对KDD做了确切的定义。目前,普遍接受知识发现的定义是1996年由Fayyad等提出的:从数据中鉴别出有效模式的非平凡过程,该模式是新的、可能有用的和最终可理解的②。文献3则认为知识发现是指在积累了大量数据后,利用各种数据挖掘算法来分析数据库中存储的数据,从中识别出有效的、新颖的、潜在有用的及最终可以理解的知识③。简单地说,知识发现就是从数据库中发现有用知识的整个过程,即把数据转化为知识、把知识转化为决策的一个多次循环反复的高级处理过程。
目前,描述知识发现与数据挖掘的关系有三种观点。一种观点认为数据挖掘仅仅是知识发现过程中的一个特定步骤。持该观点的学者认为知识发现是从数据库中发现有用知识的整个过程,包括数据清理、数据集成、数据选择、数据转换、数据挖掘、模式评估、知识表示等七个基本步骤。这一观点把知识发现与数据挖掘明确的区分开来,指出了数据挖掘是知识发现过程中的重要组成部分,把数据挖掘作为知识发现的核心内容之一。另一种观点认为知识发现与数据挖掘是一个概念,可混同使用,如文献4认为数据挖掘有时也称作数据库中的知识发现④。第三种观点认为知识发现是数据挖掘的特例⑤,即把用于挖掘的数据集限制在数据库这种数据组织形式上,因此数据挖掘可以看作是知识发现在挖掘对象上的延伸和扩展。
笔者认为,知识发现是一个高级的处理过程,即应用数据挖掘算法和评价解释模式的一个循环反复过程,它们之间相互影响、反复调整,形成一种螺旋式的上升态势。而数据挖掘只是知识发现整个过程中的一个特定步骤,它用专门算法从数据中抽取模式,是知识发现过程中重要的环节。知识发现的内涵和外延意义更广,而数据挖掘更具体、更深入,更注重挖掘算法等。
(二)知识服务
知识服务最早由任俊为先生在1999年第1期的《图书情报知识》杂志发表题为《知识经济与图书馆的知识服务》的论文中提出的⑥。知识服务是面向知识内容的服务,它的前提条件是以丰富、大量的信息资源为基础,对其进行深入挖掘开发,从中识别出有效、新颖、潜在有用的知识信息,并利用先进的知识技术和智能技术实现信息服务,因此,可以把知识服务看作是以资源建设为基础的高级阶段的信息服务,是信息服务的延伸和发展方向。这也是数字档案管理中得以开展知识服务的重要依据。
目前对知识服务的定义众说不一,较常见的有两种定义方式。第一种是提供知识内容服务。如文献7认为知识服务是面向用户解决问题的全过程提供,经过析取、重组、创新和集成而形成符合用户需要的知识产品,按知识概念体系组织的内容信息而提供的服务⑦。文献8则认为知识服务是指从各种显性和隐性信息资源中,针对人们的需要将知识提炼出来、传输出去的过程⑧。第二种是提供一种知识应用服务。如文献9认为知识服务是以信息的搜索、组织、分析、重组的知识和能力为基础,根据用户的问题和环境,融入用户解决问题的过程,提供能够有效支持知识应用和知识创新的服务⑨。文献10提出知识服务是向用户提供知识信息、知识挖掘手段及问题解决方案的服务⑩。
综上所述,可以认为知识服务是指以信息的搜集、组织、分析、重组为基础,通过对用户知识的需求和问题环境的分析,动态地、连续地向用户提供满足知识内容和知识应用要求的知识产品的一种深层次智力服务。