|
本帖最后由 pastime_Wang 于 2013-7-11 11:27 编辑
占位,更新!
很少去网上搜索,下面是自己的个人体会,如有雷同,纯属巧合!
1、数据挖掘常用的技巧和工具有哪些?
我曾经使用和接触过的工具:
Sqlserver ~ SSAS: 通过聚集运算 建立CUBE, 再进行多维分析;
IBM ~ Cognos SPSS: 采用数据挖掘标准流程,包括封转好的数据挖掘算法,
如: 神经网络、决策树分析、回归分析等,方便开发者调用
Weka : 开源数据挖掘工具中算不错的,尤其是其数据分布式的集群处理能力
/******************************************************************************************************/
2、数据挖掘的意思何在?
目前数据挖掘 = 机器学习 + 统计技术 + 数据 (仓) 库技术
未来数据挖掘 = 机器学习 + 统计技术 + 大数据技术 + 数据可视化技术
/******************************************************************************************************/
3、试读图书章节后谈谈您的感想?
我觉得数据挖掘的关注点在于:
1.数据挖掘往往涉及非常多的知识领域,如数据库与数据仓库、统计学理论、机器学习、数据可视化等。在这些技术的支持下,
必须深入分析业务,结合业务特点,从而得出有益结论。
2.在模型算法的选择中(目前主要是对结构化的关系型数据进行分析),从现有的指标体系中, 找出与挖掘主题相适应的指标或指标组合,
这是一个很耗时的 、不断探索的过程。往往首先采用相关性检测,来验证各个指标对模型的显著性关系。
3.数据挖掘要结合实际业务特点,从有监督或无监督的算法中进行选择,还需要考虑各种算法的处理效率和扩展性
4.数据挖掘结果指导业务的效果,往往短期内很难用是否"好"来进行判断,需要后期通过对产生更多的数据,不断的进行模型效果的检测,
来证明模型算法的合理性和有效性
很想看看卢大师的这本书,据说口碑不错!
|
|