|
也来谈谈数据分析
先从我的职业说起,一开始做JAVA开发,但是后来越发的对数据感兴趣,就兼职项目上的DBA,做数据优化,学习Oracle了解数据库原理,碰巧又有BI的新需求,有硬顶着头皮给甲方上了套Oracle BI,到底对甲方有没有用先不说,但是项目结项了万岁!
其实做数据的,核心是在数据分析, 数据源-》数据仓库(集市)-》数据分析-》数据挖掘-》数据展现-》商业决策,这套理论二三十年不会变,但是各个层次的支撑技术发生了翻天覆地的变化。
现在还有人有ORACLE,DB2,这样的数据库做数据仓库数据分析模??没有了,今后也不会有,时代变化这方便,RDBMS 元气已经,做一两个国有企业的烧钱系统还可以,真正的海量数据已经跟不上了。
这个看看市场扪心自问 有多少的DSS 真正的有商业价值的,倒是同我一样结项的有不少。
1.海量数据大家都知道hadoop,
并在这个平台上的hbase,pig,hive是用来做数据分析的。
其中HIVE同DBA应该最靠谱, HIVE是支持SQL92的, DBA用的亲切,但是如果你不知道如何将HIVESQL 映射到MAPREDUCE,也是白搭,就想大家会用SQL,但是不会优化一样,事备工半,所有MAPREDUCE 就是优化的根本了。
目前部门正在积极的实践HADOOP但是,感觉到这个东西需要投入的东西太多了,
如何在HIVE上构建令数据分析人员满意的BI模型,这些都没有现成的框架可以实现,当然这些在大的互联网公司不是问题,因为有数以百计的HADOOP开发人员做这些事情。
还有如何在上边同业界的数据分析语言结合,目前我们集成了thrift将来做PYTHOn的接口,但是一些更高级和专业的数据分析语言如R,等等,问题很多,
总的来说还是不断的模式,数据分析肯定今后数据发展重心上移的必然结果。 |
|