|
针对讨论主题,我的个人理解:
1.数据挖掘的方法有哪些
个人理解:利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。在自己的实际项目中主要有,利用主成分分析、Kmeans算法进行客户分类;利用决策树进行流失分析等。当然个人认为,所谓数据挖掘最大的核心价值在于利用数据发现未知信息和规律,起到为业务发展、精细化服务提供支持或者牵引。也就是,一个在技术上可能很简单的统计分析结果,能对决策或者服务提供帮助,它可能也是一个有效的挖掘成果。
2. R在数据挖掘中的优势有哪些
讨论:1)R是一个免费的开源软件,它提供了首屈一指的统计计算和绘图功能,尤其是大量的数据挖掘方面的算法包,使得它成为一款优秀的、不可多得的数据挖掘工具软件;2)提供强大的函数库,你只需要知道参数的形式就行了,有时候即使参数形式不对,R也能“智能地”帮你适应,这种简单的软件适合想要专注于业务的人;3)强大的可视化功能,对于分析人员而言可不必苦恼于复杂的图形化编码;4)R是一个全面的统计研究平台,提供了各式各样的数据分析技术,几乎任何类型的数据分析工作都可以在R中完成;5)R可交互性强;6)R提供了先进的、丰富的统计计算历程,并且更新速度是以周来计算;7)R可运行在多个平台上,方便挖掘人员在不同的设备环境下不间断工作。
3.说说读完试读章节后您的感想
讨论:一个完整的数据挖掘项目通常数据收集和清晰阶段要占用很大比例的项目资源,试读章节主要介绍了数据预处理,阅读之后的感觉是:“专业”,其实在数据挖掘中,首先必须假设数据是脏的,那么,在分析之前,第一个重要步骤是预处理,这决定了分析模型的质量,在试读章节对这个重要的部分详细描述,R在数据加载、清理、缺失值处理、噪声处理等方面如此的灵活、轻松。希望能得到此书,对我在R的学习中给予帮助。
以上纯属个人观点,请大家吐槽。 |
|