|
hadoop即将融合到我们第二代ETl里面去,说下个人粗浅的理解。
1.不是hadoop开发人员,算是hadoop使用人员,原理必须要掌握的,知其然 知其所以然。
2.hadoop 主要是要发挥发的优势,低成本(硬件),更快完成海量数据处理,这个是我们追求的。目前我们数据仓库系统遇到性能瓶颈,目前解决方案就是横向分解,给后期管理维护带来巨大麻烦。hadoop恰恰就是一个很好的解决方案。
3.我觉得如果不是做框架开发设计的,只是技术使用者,用当前完善的技术来实现客户需求的话,没有必要看源代码。时间有限,青春不多。
总的来说针对技术使用者(而非创作者)来说:了解原理,会使用,能发挥其优势,能解决使用中遇到的问题就差不多了。
不同的技术是为了不同业务场景的需要。不做技术的奴隶,而是做技术的驾驭者。 |
|