楼主: hwayw

《数据挖掘:R语言实战》有奖试读活动(获奖结果已公布)

[复制链接]
论坛徽章:
3
马上有对象
日期:2014-06-12 16:32:07蓝色妖姬
日期:2014-08-28 15:17:25秀才
日期:2015-10-08 17:57:58
41#
发表于 2014-6-11 11:12 | 只看该作者
xgghxkhuang 发表于 2014-6-10 21:37
能谈谈你的实际项目的过程吗?借鉴一下,我和同事做了一下,没成,聚类客户分群,决策树客户流失

主要是挖掘目标确定、原始数据分析、算法选择、训练与检验、结果分析这些步骤,举个具体案例,例如我在进行客户产品偏好分析模型建模中,首先确定了挖掘的主题是分析客户对产品的偏好,即客户喜欢什么产品多一些,那么我们积累了客户的数据如持仓、买卖等数据,并且对产品有了分类,在原始数据基础上,我们需要做一些预处理,比如单纯的统计绝对值可能在这个模型中没有意义,需要转换,于是设计了例如 某产品的累计价值/客户累计资产比等,在业务分析的过程中我们会和有经验的业务专家去剖析这些变量设计的合理性,于是就得到了初始的变量,但是这些变量中可能某几个变量存在高度相关性,通常可以利用相关性、主成分分析等手段去掉一些变量,在这次的项目中我们最后选择了采用主成分分析的方法进行降维,上面描述了这么多,基本上完成了数据清洗、变量设计、变量转换这些步骤,接下来,我们选择了Kmeans聚类算法进行分群(当然最后选择Kmeans也不是一步到位的,过程中也选择了其他的方法比如系统聚类法等),后面就不再嗷述了。。。不知道上述回答能不能帮助到你。

使用道具 举报

回复
招聘 : 多个岗位招聘
论坛徽章:
33
2010广州亚运会纪念徽章:跆拳道
日期:2010-11-22 15:42:39灰彻蛋
日期:2012-05-16 13:17:56参与WIN7挑战赛纪念
日期:2012-05-24 10:37:35茶鸡蛋
日期:2012-05-28 17:27:32灰彻蛋
日期:2012-06-13 18:48:14双黄蛋
日期:2012-06-14 14:32:02奥运会纪念徽章:帆船
日期:2012-07-10 09:43:29奥运会纪念徽章:足球
日期:2012-08-17 09:17:32奥运会纪念徽章:帆船
日期:2012-07-26 15:46:49奥运会纪念徽章:赛艇
日期:2012-08-20 16:23:58
42#
发表于 2014-6-11 11:24 | 只看该作者
本期讨论话题:
1.数据挖掘的方法有哪些?
   主要就是聚类和分类两大类。
2. R在数据挖掘中的优势有哪些
    R的优势就是有各种统计包,free。缺点是兼容性差点,大数据量分析有点问题。
3.说说读完试读章节后您的感想
   试读章节,讲了数据预处理。对于使用R进行分析,首先要保证数据的合法性。而这正是预处理的必要性。



期待阅读全书~~~

使用道具 举报

回复
论坛徽章:
0
43#
发表于 2014-6-12 10:15 | 只看该作者
R语言在生物统计方面已用了很长时间了,各种统计包都比较全,包的编写对统计学解释的比较清楚,很好用的。灵活性很高

使用道具 举报

回复
论坛徽章:
86
秀才
日期:2015-09-21 09:46:16目光如炬
日期:2014-07-28 06:00:03马上有钱
日期:2014-06-16 15:55:42马上有房
日期:2014-06-16 15:55:422014年世界杯参赛球队: 伊朗
日期:2014-06-13 11:29:242014年世界杯参赛球队:巴西
日期:2014-06-06 14:36:14马上有钱
日期:2014-04-04 13:51:21马上加薪
日期:2014-04-04 13:35:40马上有房
日期:2014-02-18 16:42:022014年新春福章
日期:2014-02-18 16:42:02
44#
发表于 2014-6-12 11:08 | 只看该作者
呵呵,稍后整理

使用道具 举报

回复
论坛徽章:
25
迷宫蛋
日期:2011-08-18 14:39:10马上有钱
日期:2014-07-25 16:07:56马上有车
日期:2014-07-25 15:41:34马上有钱
日期:2014-07-29 10:14:33马上有房
日期:2014-08-07 15:22:58祖国65周年纪念徽章
日期:2014-10-08 10:10:07马上加薪
日期:2014-10-22 15:39:30天蝎座
日期:2015-08-06 16:46:39天蝎座
日期:2015-12-04 11:25:44巨蟹座
日期:2016-02-17 17:28:36
45#
发表于 2014-6-12 17:34 | 只看该作者
看完样章后,感觉有很大的兴趣啊。

使用道具 举报

回复
论坛徽章:
18
奥迪
日期:2014-01-23 17:13:08喜羊羊
日期:2015-05-29 07:20:492015年新春福章
日期:2015-03-06 11:59:472015年新春福章
日期:2015-03-04 14:55:13马上加薪
日期:2014-10-22 11:08:29itpub13周年纪念徽章
日期:2014-10-10 07:09:53生肖徽章:蛇
日期:2014-06-19 17:10:12生肖徽章:龙
日期:2014-06-19 17:10:12 2014年世界杯参赛球队: 德国
日期:2014-06-13 10:14:37优秀写手
日期:2014-05-14 06:00:20
46#
发表于 2014-6-12 21:41 | 只看该作者
sunny1889 发表于 2014-6-12 05:02
1.数据挖掘的方法有哪些?
分类方法有K近邻、Logistic回归、朴素贝叶斯和贝叶斯网络、决策树(ID3/C4.5/CA ...

Nice post.

Used employed R in data mining couple of years ago, majority on NN ( Neural Network), it's awesome.

使用道具 举报

回复
求职 : 数据分析/ETL
论坛徽章:
1
2014年世界杯参赛球队: 葡萄牙
日期:2014-07-24 11:03:54
47#
发表于 2014-6-12 22:55 | 只看该作者
YuBinTAMU 发表于 2014-6-12 21:41
Nice post.

Used employed R in data mining couple of years ago, majority on NN ( Neural Network) ...

Thank you !

使用道具 举报

回复
论坛徽章:
39
2014年世界杯参赛球队: 英格兰
日期:2014-06-13 14:40:022013数据库大会纪念章
日期:2015-03-18 10:16:212014数据库大会纪念章
日期:2015-03-18 10:16:21秀才
日期:2015-06-24 13:05:36秀才
日期:2015-07-30 16:18:26秀才
日期:2015-08-06 13:55:21秀才
日期:2015-08-13 13:38:45知识
日期:2015-08-13 14:08:10秀才
日期:2015-08-24 09:48:07秀才
日期:2015-09-10 17:13:35
48#
发表于 2014-6-13 11:30 | 只看该作者
本帖最后由 陌路巨额投入 于 2014-6-13 11:32 编辑

1.掘的方法有
   利用据分析常用的方法主要有分、回分析、聚关联规则、特征、化和偏差分析、Web页挖掘等,它们别从不同的角度对数掘。在自己的实际项目中主要有,利用主成分分析、Kmeans算法行客;利用树进行流失分析等。认为,所谓数掘最大的核心价在于利用发现未知信息和律,起到为业务发展、精化服提供支持或者

2. R在
掘中的优势
  R最大优势,就是可以根据需求操作。活,但首先需要掌握基
1)R是一
件,提供了首屈一指的统计计算和绘图功能,尤其是大量的掘方面的算法包,使得一款秀的、不可多得的掘工具
2)提供强大的函
数库
3)强大的可
化功能
4)R是一
全面的统计研究平台,提供了各式各据分析技,几乎任何型的据分析工作都可以在R中完成;
5)R可交互性强;
6)R提供了先
的、丰富的统计计程,且更新速度是以周来计
7)R可
行在多平台上,可以使用其他的工具提取据;将数据加R中;使用R建模分析;在生产环境中使用c++或者python实现结果模型
3.
说说读试读的感
   
   这个人感就是很激,其一是于有我自己的R图书了。以前的都是人翻的,是有些小缺陷。。这个现在就充完整
从试读的第5章预处看,理、集成、转换面面俱到,在实际应用中每方法都有通用性和专业性,文字简洁且有深度,可能需要者有一定的R言基。另录来看,算法到高算法,用,几乎包括了掘所有的算法,很完整很好,很希望能得到。。嘿嘿。

使用道具 举报

回复
论坛徽章:
0
49#
发表于 2014-6-13 14:55 | 只看该作者
只知道一些招聘有要求R语言。。。。。

使用道具 举报

回复
论坛徽章:
0
50#
发表于 2014-6-13 22:49 | 只看该作者
样章读毕,觉得新意不够,属于R语言打点数据类项目擦边球,建议落地性再强一点,数据类项目内容再融合多一些。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表