|
[有奖讨论]大数据Hadoop平台技术讨论
Hadoop是一个分布式系统基础架构,由Apache基金会开发。Hadoop用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率来访问应用程序的数据,适合那些有着超大数据集的应用程序。
Hadoop是目前大数据领域最主要的解决方案。
本次讨论针对Hadoop平台中的Pig技术。
1. 您使用过Pig吗?谈谈您对Pig的认识。
2. Pig和Hive有什么区别?
3. 谈谈Pig对Hadoop平台的影响。
4. 有比Pig更好的技术吗?请详细说明。
讨论时间:2013.5.3~2013.5.22
讨论奖励:活动结束后将会抽取5位会员赠送《pig编程指南》图书一本。
原书名: Programming Pig
原出版社: O'Reilly Media; 1 edition
作者: (美)Alan Gates
译者: 曹坤
出版社:人民邮电出版社
ISBN:9787115301116
上架时间:2013-2-25
出版日期:2013 年2月
开本:16开
页码:191
tian1982tian liang545621 chszs htyansp ses19828
|
|