|
最近正好在研究这玩意。
1. 您使用过Pig吗?谈谈您对Pig的认识。
使用过,因为项目需求,目前正在研究中。
如果没有PIG,对于HADOOP中数据的处理,我们不得不编写MapReduce处理程序。
但这些需要软件开发经验,而且编写起来也比较麻烦。PIG的出现使得处理HADOOP中的数据
变得简单,无需编写复杂的MapReduce处理程序就能完成我们的需求。
2. Pig和Hive有什么区别?
打个比方,PIG有点类似ORACLE的PLSQL,而HIVE类似ORACLE的SQL。
PIG支持一些控制流,做一些处理,而HIVE基本不具备这样的功能。
HIVE基本就是为了简化统计分析,做一些报表,分组,用的SQL和传统的关系数据库中的
SQL类似,因此对于传统的SQL开发人员来说,比较容易上手。
PIG也可以做类似HIVE中SQL的功能,只不过用的不是SQL语句。
3. 谈谈Pig对Hadoop平台的影响。
PIG的出现使得我们开发HADOOP平台的程序变得简单,对于一些人都比较容易上手。
即便不会JAVA语言,也能编写性能高效的HADOOP程序。这大大降低了开发难度及其
开发周期,否则都要用MapReduce来写,将会大大增加工作量。
4. 有比Pig更好的技术吗?请详细说明。
由于PIG底层也是封装了MapReduce的处理过程,因此在性能方面,直接用MapReduce写
程序会高效,因此对于性能要求比较高的程序,还是自己写MapReduce程序比较好。
|
|