深蓝海域KMPRO

数据挖掘的几个过程

2013-05-24 18:03

数据准备。对来自各数据源的数据进行集成,包括数据抽取、清理、转换、装载等工作。

数据的净化。清除数据源中不正确、不完整的或其他方面不能达到数据挖掘质量要求的数据,如消除重复记录等,从而提高数据的质量。

数据的集成。在数据挖掘所应用的数据来自多个数据源的情况下,将数据进行统一的存储,并消除其中的不一致性。

数据的应用变换。就是为了使数据适用于计算的需要而进行的一种数据转换。如异常值、噪声、处理、采取的方法有回归方法、聚类方法和装箱方法。

数据的精简。是采用一定的方法对数据的数量进行缩减,从而提高数据挖掘算饭的效率和质量。如属性子集选择、主成分分析、离散小波转换等。

数据挖掘。综合应用各种数据挖掘方法和工具分析数据库中的数据,得到各种描述模型和预测模型。

结果的表达与评价。利用可视化工具将数据挖掘的结果直观地呈现给用户,方便用户的理解和观察,并对结果进行评价。

结果利用。对结果进行解释,依据此结果采取相应的决策措施。

 

相关推荐