楼主: pipihappy8888

【大话IT】R语言:是什么困扰了你?

[复制链接]
论坛徽章:
277
马上加薪
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有车
日期:2014-02-19 11:55:14马上有车
日期:2014-02-18 16:41:112014年新春福章
日期:2014-02-18 16:41:11版主9段
日期:2012-11-25 02:21:03ITPUB年度最佳版主
日期:2014-02-19 10:05:27现任管理团队成员
日期:2011-05-07 01:45:08
21#
发表于 2015-3-16 22:05 | 只看该作者
1. 大家觉得R语言难学吗?困扰你的主要是什么?
R语言非常易于入门,它的函数的使用很简单,开发IDE的使用也很简单。
我们最爱使用的是RStudio开发工具。
但是,精通R语言也有一些难点或者说是困扰,主要表现在:
1)R语言的包/库极其庞大,有数千个,很多时候你并不知道该使用什么包/库来解决问题。
2)正如第一点所说,库太多,并不是所有的包/库都是高质量的,使用某些库分析数据得出的结果有可能是相互矛盾的。
3)R语言跟概率论和数理统计结合紧密,数学功底不深的话,难以精通R语言。

2. R可以实现数据分析中的哪些工作?
R语言可以实现数据分析中的绝大多数工作。
可以进行数学运算;
可以进行 统计和分析;
可以做快速傅里叶变换;
可以进行平滑和滤波;
可以做基线和峰值分析。
- 数据传递及服务(RHive、Rserve、rJava)
- 清洗及预处理(sqldf、stringr、XML)
- 抽样、分类、关联觃则、特征选择、稀疏矩阵运算、矩阵分解、社交网络
- 高性能计算(rhdfs、rmr2、Rcpp)
等等

3. 你曾经使用或编写过R软件包吗?
曾经在某个项目中频繁使用。后来用Python的数据分析包更多一些。
一句话,不限于R语言,快速解决问题是根本。

4. 说说您读完试读样章后的启发
样章提供了第四章“随机数与抽样模拟”的内容,从这章的内容来看,书籍描述比较浅显易懂,并没有长篇大论的理论分析,而是以例子为主,伴随讲述了很多函数。不错的书,渴望一读。

使用道具 举报

回复
论坛徽章:
54
ITPUB15周年纪念
日期:2017-02-19 21:29:36双子座
日期:2015-11-26 23:31:18天蝎座
日期:2015-11-23 18:37:14天枰座
日期:2015-11-23 10:05:24秀才
日期:2015-11-11 09:48:44摩羯座
日期:2015-11-05 17:21:49射手座
日期:2015-10-26 15:35:30狮子座
日期:2015-10-09 09:25:42双子座
日期:2015-08-26 10:23:172015年新春福章
日期:2015-06-02 14:55:00
22#
发表于 2015-3-17 11:38 | 只看该作者
xgghxkhuang 发表于 2015-3-16 20:00
不过,小数据量时候,r的优势很显著
免费,算法多,使用包就行,新的算法只有r可能有,作图优美。

可尝试RHadoop、SparkR,在Spark/Hadoop集群上运行R程序~~

使用道具 举报

回复
论坛徽章:
2
秀才
日期:2015-09-06 10:32:56秀才
日期:2016-02-18 10:06:46
23#
发表于 2015-3-17 12:44 | 只看该作者
1. 大家觉得R语言难学吗?困扰你的主要是什么?
貌似不很难吧,初级的需要技术命令行指令,中级的需要导入相应的类,高级的功能还没用到

2. R可以实现数据分析中的哪些工作?
好像只要类库支持的话,什么都可以哦。

3. 你曾经使用或编写过R软件包吗?
没有

4. 说说您读完试读样章后的启发
从统计学本身来说,R与其他的软件都是可以大大地增加生产力的辅助工具。并且R与商用软件相比,着实有些寒碜。从样章来看,不太喜欢这样罗列各种功能的结构,如果能够以一个案例的形式讲解如何应用的具体场景,效果会更好些。

使用道具 举报

回复
论坛徽章:
0
24#
发表于 2015-3-17 13:39 | 只看该作者
谢谢分享

使用道具 举报

回复
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
25#
 楼主| 发表于 2015-3-17 15:27 | 只看该作者
fangkn 发表于 2015-3-16 15:26
大家好,我是《R数据分析——方法与案例详解》一书的作者,欢迎大家一起交流

可以和我们分享下R语言用来数据分析的案例哈

使用道具 举报

回复
论坛徽章:
78
ITPUB15周年纪念
日期:2020-08-28 17:23:53双鱼座
日期:2016-03-19 19:38:31秀才
日期:2016-02-18 09:31:52秀才
日期:2016-01-25 15:02:04双子座
日期:2016-01-19 20:35:54秀才
日期:2016-01-13 12:14:26秀才
日期:2015-12-25 15:31:10秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:56:09秀才
日期:2015-12-14 14:51:16
26#
发表于 2015-3-17 20:04 | 只看该作者
主要还是太不稳定,不同版本包兼容性有很大问题。
然后R的可扩展性也有很大问题

使用道具 举报

回复
论坛徽章:
0
27#
发表于 2015-3-17 20:19 | 只看该作者
R倒不难,难的(应该说内容多的)是统计学的内容

使用道具 举报

回复
论坛徽章:
4
优秀写手
日期:2014-08-15 06:00:132015年新春福章
日期:2015-03-04 14:55:132015年新春福章
日期:2015-03-06 11:59:47慢羊羊
日期:2015-04-08 13:42:29
28#
发表于 2015-3-18 07:59 | 只看该作者
困扰我的就是我不懂R语言,但是我正好要学习我想得到这本书,可是我知道PP不会把这本书给我

使用道具 举报

回复
论坛徽章:
20
会员2006贡献徽章
日期:2006-04-17 13:46:34迷宫蛋
日期:2011-07-03 15:22:28茶鸡蛋
日期:2011-08-03 10:02:49ITPUB十周年纪念徽章
日期:2011-11-01 16:19:412014年新春福章
日期:2014-02-18 16:41:11马上有车
日期:2014-02-18 16:41:112014年世界杯参赛球队: 韩国
日期:2014-06-30 10:35:10沸羊羊
日期:2015-03-04 14:43:432015年新春福章
日期:2015-03-06 11:57:312011新春纪念徽章
日期:2011-02-18 11:42:47
29#
发表于 2015-3-18 09:37 | 只看该作者

1. 大家觉得R语言难学吗?困扰你的主要是什么?
目前看,比较难学。

2. R可以实现数据分析中的哪些工作?
目前是帮助做图和简单的数据处理。

3. 你曾经使用或编写过R软件包吗?
使用过,但是是套用,没什么收获。

4. 说说您读完试读样章后的启发
数学基础不够,应该配套一个详细的说明可能会更好

使用道具 举报

回复
论坛徽章:
0
30#
发表于 2015-3-18 11:15 | 只看该作者
xgghxkhuang 发表于 2015-3-16 20:08
楼主,我问几个问题,求高手指教
1如何掌握r
2实际数据分析中r使用有什么可以分享的经验

1如何掌握r
答:要想快速掌握R的最好方法是选择一本叫好的参考书,跟着参考书学一遍即基本上学会R了,当然如果要想熟练使用,还是需要自己在实际的数据分析中多用多思考。
2实际数据分析中r使用有什么可以分享的经验
答:实际分析中R的使用要具体问题具体分析。一般来讲:(1)在读入数据之前,先看一下每个变量的类型,是连续的还是离散的?往往离散的变量需要转换成虚拟变量;(2)写code过程中,勤加注释,因为可能过几个几天都不认识自己写的code了;(3)写程序时尽量少用循环,能用矩阵运算尽量用矩阵运算。

3内存溢出如何办
答:内存问题始终是限制R的一个问题之一。一般来讲,加大内存是最好的方法,所以碰到海量数据时,建议一般用HPC(高性能计算机)去运算;另一方面看看有无可能优化自己的算法,尤其是不要有太多的循环,循环是R的薄弱环节。此外,还可以清理一些不用了的对象来释放内存,如果真的需要大计算的话,可以看一些处理大内存对象与并行计算的软件包等,比如bigmemory等。

4数据分析算法如何根据问题选择
答:数据分析算法的选择是非常复杂的一个问题,这个不仅仅是R的问题了,而是统计的问题,每种统计方法、算法都有其适用的条件,不是所有场合都套上去就可以了,所以学习R来说,其实最好是结合统计、数据分析的方法来学是最好的。
5异常数值和缺失数值如何处理
  《R数据分析-方法与案例详解》的第5章有讲解,请参考。
6特征变量如何构造,衍生变量如何构造
《R数据分析-方法与案例详解》的第5章有讲解,请参考。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表