|
1. 您使用过Pig吗?谈谈您对Pig的认识。
目前正在对hadoop正在进行学习,也没有很深的体会。 pig是hadoop项目的一个拓展项目, 用以简化hadoop编程,可以加载数据、表达转换数据以及存储最终结果。提供一种抽象的数据处理能力。pig 提供的操作在大量数据集分析中很有优势。以及于学起来很顺手,其实就像计算机方面的很多东西都似乎有某种共同点似的,当你学习一门技术很精通以后,接触另一样类似东西,会感觉很舒服。就像当初从PHP语言转到JAVA后,感觉思想没有变,变的只有语法。
2. Pig和Hive有什么区别?
Hive 和Pig不支持低时延查询。区别肯定有的,但是也有很多相似之处,Hive的查询语言HiveQL,是基于SQL的,熟悉SQL的朋友都可以很容易的写出使用HiveQL写查询。我觉得最大的区别是:在Hive中可以执行插入/删除 等操作,但是Pig中没有可以插入数据的方法。
3. 谈谈Pig对Hadoop平台的影响。
因为有数据处理的需求的存在,有了pig的存在,而不是为了实现一个复杂的逻辑任务,一个一个MapReduce去Coding,pig能屏蔽MapReduce开发的繁琐细节 ,能更方便地处理海量数据。如果没有pig,我觉得在Hadoop平台,会更麻烦。如果没有pig,简直是不敢想象。
4. 有比Pig更好的技术吗?请详细说明。
由于不是很精通Pig,这个问题不敢回答了,反正我觉得Pig技术的话对Hadoop是不可或缺的,就像买了笔记本电脑,发现少了键盘一样,处理起来就不是很方便。
------ Hadoop初学,说错,或者说得不好,请批评指正。 |
|