|
1、数据挖掘常用的算法和规则有哪些?
我把数据挖掘常用的算法做了个归类,大致是:
1)分类方面
代表性的算法有:C4.5算法、CART算法、K Nearest Neighbours(KNN)算法、Naive Bayes算法
2)统计学习方面
代表性的算法有:SVM算法、EM算法
3)关联分析方面
代表性的算法有:Apriori算法、FP-Tree算法
4)链接挖掘方面
代表性的算法有:PageRank算法、HITS算法
5)聚类方面
代表性的算法有:K-Means算法、BIRCH算法
6)装袋与推进方面
代表性的算法有:AdaBoost算法
7)序列模式方面
代表性的算法有:GSP算法、PrefixSpan算法
8)集成挖掘方面
代表性的算法有:CBA算法
9)粗糙集算法
代表性的算法有:Finding Reduct算法
10)图挖掘方面
代表性的算法有:gSpan算法
2、数据挖掘的核心是什么?
说到数据挖掘的核心,不同的人有不同的看法。基本上,我认为算法和数据都是数据挖掘的核心,两者都非常重要。因为数据挖掘的核心阶段是建立模型,要建立模型,就离不开算法和数据。
3、试读图书章节后谈谈您的感想?
书很不错,试读章节包含了图书的前三章,主要是介绍性的内容。我个人很喜欢实战类的书籍,对此书充满了期待。 |
|