深蓝海域KMPRO

数据挖掘与知识发现

2017-02-25 09:40

数据挖掘与知识发现
        知识发现的目的是从数据中发现知识,而数据挖掘则是知识发现中的一个特定步骤,其都是从数据中发现知识。但是,知识发现是更广义一个概念,而数据挖掘则是更具体、更深入的概念,其关系体现在知识发现的过程中。
       北京深蓝海域为发展提高企业知识管理服务,致力于数据挖掘和知识发现的研究,总结出其过程为:将原始数据经过相应的处理,形成过程数据,再将过程数据转化成数据,再通过相应算法,对数据进行挖掘,形成有规律的一种模式,利用这种模式,经过相应的解释,形成有用知识.
      1 数据准备阶段
      知识发现所处理的对象数据是原始数据,不适合在这些数据上进行知识挖掘,需要进行相应的处理,如数据的选择、净化(消除噪音、冗余数据)等。使其生成过程数据,之后进行转换,包括离散值数据与连续值数据之间的相互转换、数据值得分组分类、数据项之间的计算组合等,为后面的数据挖掘准备好正确的数据。
      2 数据挖掘阶段
数据挖掘阶段是知识发现最为关键的步骤,是技术的难点所在。该阶段也就是根据知识发现的目标,选取相应的算法,分析数据,搜索或者产生相应的模式和特定数据集。
      3 解释评价阶段
      经过数据挖据得到的模式,有些可能是不准确的或不真实的,所以需要对所得模式进行评估,确定有效的、有用的模式,从而得到知识。评价可以根据用户多年的经验,也可以直接用数据检验其准确性。
     从以上知识发现过程中可以看出,数据挖掘技术直接影响着知识发现的结果。但是,数据挖掘过程作为知识发现的关键环节注重于处理过程及处理过程中算法的选取,知识发现则注重目的与结果。但是二者的本质是一致的,都是对原始数据进行分析处理,并提取出隐含在大量数据背后的反映数据内在特性的关系模式的过程。

相关推荐