|
xgghxkhuang 发表于 2015-3-16 20:08 ![]()
楼主,我问几个问题,求高手指教
1如何掌握r
2实际数据分析中r使用有什么可以分享的经验
1如何掌握r
答:要想快速掌握R的最好方法是选择一本叫好的参考书,跟着参考书学一遍即基本上学会R了,当然如果要想熟练使用,还是需要自己在实际的数据分析中多用多思考。
2实际数据分析中r使用有什么可以分享的经验
答:实际分析中R的使用要具体问题具体分析。一般来讲:(1)在读入数据之前,先看一下每个变量的类型,是连续的还是离散的?往往离散的变量需要转换成虚拟变量;(2)写code过程中,勤加注释,因为可能过几个几天都不认识自己写的code了;(3)写程序时尽量少用循环,能用矩阵运算尽量用矩阵运算。
3内存溢出如何办
答:内存问题始终是限制R的一个问题之一。一般来讲,加大内存是最好的方法,所以碰到海量数据时,建议一般用HPC(高性能计算机)去运算;另一方面看看有无可能优化自己的算法,尤其是不要有太多的循环,循环是R的薄弱环节。此外,还可以清理一些不用了的对象来释放内存,如果真的需要大计算的话,可以看一些处理大内存对象与并行计算的软件包等,比如bigmemory等。
4数据分析算法如何根据问题选择
答:数据分析算法的选择是非常复杂的一个问题,这个不仅仅是R的问题了,而是统计的问题,每种统计方法、算法都有其适用的条件,不是所有场合都套上去就可以了,所以学习R来说,其实最好是结合统计、数据分析的方法来学是最好的。
5异常数值和缺失数值如何处理
《R数据分析-方法与案例详解》的第5章有讲解,请参考。
6特征变量如何构造,衍生变量如何构造
《R数据分析-方法与案例详解》的第5章有讲解,请参考。 |
|