深蓝海域KMPRO

知识发现过程的几个步骤

2014-06-12 10:23

知识发现是从数据中发现有用知识的整个过程;数据开采知识发现过程中的一个特定步骤,它用专门算法从数据中抽取模式(patterns)。1996年,FayyadPiatetskyShapirorSmyth知识发现过程定义为:从数据中鉴别出有效模式的非平凡过程,该模式是新的、可能有用的和最终可理解的。

知识发现过程是多个步骤相互连接、反复进行人机交互的过程。具体包括以下步骤:
     
1.学习某个应用领域:包括应用中的预先知识和目标。
     
2.建立目标数据集:选择一个数据集或在多数据集的子集上聚焦。
      3.
数据预处理:去除噪声或无关数据,去除空白数据域,考虑时间顺序和数据变化等。
      4.
数据转换:找到数据的特征表示,用维变换或转换方法减少有效变量的数目或找到数据的不变式。
      
5.选定数据挖掘功能:决定数据挖掘的目的。
      6.
选定数据挖掘算法:用知识发现过程中的准则,选择某个特定数据挖掘算法(如汇总、分类、回归、聚类等)用于搜索数据中的模式。
      
7.数据挖掘:搜索或产生一个特定的感兴趣的模式或一个特定的数据集。
      8.
解释:解释某个发现的模式,去掉多余的不切题意的模式,转换某个有用的模式,以使用户明白。
     
9.发现知识:把这些知识结合到知识管理系统中,获得这些知识的作用或证明这些知识。用预先、可信的知识检查和解决知识中可能的矛盾。

相关推荐