2011-09-25 16:37
1.数据总结
进行数据总结旨在使数据进行精简,并且给出对这些数据的紧凑性描述。数据挖掘主要注重从数据泛化的角度来讨论数据总结。数据泛化指的是一种把数据库中的相关数据从较低层次抽象到较高层次上的一系列过程。
2.数据分类
进行数据分类的目的就要是学会一个分类函数或者分类模型(也称作分类器),这样的分类模型可以把数据库的数据项映射到给定类别中的某一个。
3.数据聚类
数据聚类指的是把一组个体按照一定的相似性划分成若干个类别,也就是所谓的"物以类聚"。数据聚类的目的是将属于同一类型的个体之间的距离尽可能地拉小,并且使得不同类别的个体之间的距离尽可能地拉大。
4.关联规则
关联规则指的是像下面提到的一种规则,如"在购买面包和黄油的消费者当中,有90%的人同时也买了牛奶"(面包+黄油?牛奶)。关联规则所发现的思路还可以应用到序列模式的发现中。顾客在购买商品时,除了具有以上关联规律之外,还会有时间或者序列上的规律。利用数据挖掘工具,企业可以在冗杂的数据中,找到有价值的知识。