楼主: 440活在梦里

【专家问答】张丹与您探讨R语言核心技术

[复制链接]
论坛徽章:
0
51#
发表于 2015-9-23 12:17 | 只看该作者
xgghxkhuang 发表于 2015-9-22 20:31
张丹老师好,看过你的工具篇,很期待高级开发篇。
能谈谈你是如何转行r和数据分析的吗?想了解一下你是如何 ...

其实,转R也是一个偶然的机会。

要做推荐系统和用户行为的分析,我开始是用Mahout的,但是Mahout的上手门槛非常高,而且用起来大部分的经历,都花在了程序设计上面,以致于忽略了业务本身。

后来才改用R的,R很灵活,方便开发,代码量特别少;我可以全部精力投入到数据处理,不用再考虑程序设计的问题了。所以就这样,我用R来代替JAVA,代替Excel,慢慢地R就变成了,最顺手的数据处理的工具。

当然,R也不是万能的,要根据场景来选择最适合的语言来完成。


使用道具 举报

回复
论坛徽章:
0
52#
发表于 2015-9-23 12:21 | 只看该作者
xgghxkhuang 发表于 2015-9-22 20:34
你如何看待r的内存溢出和精度问题,如何看待r和phython的竞争,哪些r的包是应该且必须掌握的,r的类型转换有 ...

1. 对于R来说,我们并不需要花精力考虑"内存溢出和精度",当然R也会溢出,控制数据规模,或增加内容就好了。因为大数据R本身是处理不了的,需要借助其他的大数据工具。

2. R是面向数据的,不需要有程序员思维,目标非常明确;Python是程序员语言,你除了要数据处理,还要考虑 程序性能,代码结构等一些IT细节,有可能会导致迷失原始的需求。

3. 基本的工具包是必须,另外你的业务需要哪些,再去学其他的R包。

使用道具 举报

回复
论坛徽章:
0
53#
发表于 2015-9-23 12:27 | 只看该作者
xgghxkhuang 发表于 2015-9-22 20:38
能分享一下r和数据分析实际使用的思路,面对一堆在oracle中的数据,如何分析并提出建议?该如何用数据,如 ...

1. 实际使用的思路,对于R来说,先了解业务需求,找到数据,确定算法,进行建模,可视化。
2. 如何分析数据,要看业务本身。
3. 当数据明显偏离业务的预期时,这是非常好的信号,你可以从数据的角度提出,预期是有问题的;另外,还可以通过算法模拟出如果要达到预期,是多少概率,成本结构是否合理等。有数据,有解释,有证明,这些是体现数据分析价值的地方。
4. 统计建模,有很多的书,《统计方法学》是不错的,但需要统计基础。

使用道具 举报

回复
论坛徽章:
0
54#
发表于 2015-9-23 12:28 | 只看该作者
xgghxkhuang 发表于 2015-9-22 20:40
如果想学分析思路和建模的技术,有什么好推荐的,往高手指路。

《数据挖掘 概念与技术(原书第3版)》,《统计方法学》等

使用道具 举报

回复
论坛徽章:
0
55#
发表于 2015-9-23 12:30 | 只看该作者
佚名是译名 发表于 2015-9-23 12:07
学习了R语言后找工作好找么?
应该找哪方面的工作?

R语言本身并不难,竞争力也不在R本身,而在于你对业务的理解和数学\统计基础。

工作可以是数据分析师,数据科学家,量化研究员,咨询师,精算师....

使用道具 举报

回复
论坛徽章:
0
56#
发表于 2015-9-23 12:30 | 只看该作者
佚名是译名 发表于 2015-9-23 12:08
还有前景怎么样?

面向数据的思维,如果养成了,前景大好。

使用道具 举报

回复
论坛徽章:
59
2013年新春福章
日期:2013-02-25 11:02:12双鱼座
日期:2015-07-31 08:13:07秀才
日期:2015-08-24 09:44:20秀才
日期:2015-08-24 09:51:48秀才
日期:2015-10-19 15:50:39ITPUB14周年纪念章
日期:2015-10-26 17:23:44秀才
日期:2015-11-30 09:59:23秀才
日期:2015-12-14 15:02:13秀才
日期:2015-12-21 09:48:11秀才
日期:2016-01-21 13:37:04
57#
发表于 2015-9-23 13:17 | 只看该作者
只是听说过,完全没用过啊

使用道具 举报

回复
招聘 : 系统架构师
论坛徽章:
142
摩羯座
日期:2016-03-30 23:01:17秀才
日期:2015-07-31 14:17:16秀才
日期:2015-07-31 09:12:09秀才
日期:2015-07-28 10:22:54秀才
日期:2015-07-24 09:00:17秀才
日期:2015-07-20 08:54:46秀才
日期:2015-07-15 12:49:25秀才
日期:2015-07-09 09:23:47秀才
日期:2015-07-06 10:44:32秀才
日期:2015-07-06 10:34:54
58#
发表于 2015-9-23 17:18 | 只看该作者
看过楼主的博客, 很不错,技术人员成长的楷模。赞

1. 如何更好的建模和选择合适的算法做数据分析,R语言底层实现的算法比较复杂的。

2.除了RStudo外,还有那些更好的R语言开发工具

谢谢

使用道具 举报

回复
论坛徽章:
0
59#
发表于 2015-9-23 19:08 | 只看该作者
helonten 发表于 2015-9-23 13:17
只是听说过,完全没用过啊

今天听说了,就试试吧。

使用道具 举报

回复
论坛徽章:
0
60#
发表于 2015-9-23 19:12 | 只看该作者
elathen 发表于 2015-9-23 17:18
看过楼主的博客, 很不错,技术人员成长的楷模。赞

1. 如何更好的建模和选择合适的算法做数据分析,R语言 ...

1. 要看你个人的经验积累,做的多了,自然就知道了,哪些模型适用于哪些场景了。

2. 目前,RStudio是最好的。
我也在开发一款针对金融领域的R工具,希望能做到RStudio的水平。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表