123
返回列表 发新帖
楼主: jieforest

[话题讨论]大数据Hadoop平台技术讨论 参与赠送《pig编程指南》图书一本

[复制链接]
论坛徽章:
11
ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:442014年新春福章
日期:2014-02-18 16:41:11灰彻蛋
日期:2013-07-26 09:38:24灰彻蛋
日期:2013-07-01 13:12:272013年新春福章
日期:2013-02-25 14:51:24灰彻蛋
日期:2012-12-04 13:10:242012新春纪念徽章
日期:2012-01-04 11:49:54灰彻蛋
日期:2011-12-06 21:29:03祖国60周年纪念徽章
日期:2009-10-09 08:28:00奥运会纪念徽章:摔跤
日期:2008-08-03 07:23:35
21#
发表于 2013-5-12 00:46 | 只看该作者
1. 您使用过Pig吗?谈谈您对Pig的认识。

没有使用过啊...

2. Pig和Hive有什么区别?

目前还不知道有什么区别...

3. 谈谈Pig对Hadoop平台的影响。

不了解, 无从谈起..

4. 有比Pig更好的技术吗?请详细说明。

适用的就是好的吧...

使用道具 举报

回复
论坛徽章:
5
2011新春纪念徽章
日期:2011-02-18 11:43:32ITPUB十周年纪念徽章
日期:2011-11-01 16:26:292012新春纪念徽章
日期:2012-01-04 11:57:362012新春纪念徽章
日期:2012-02-07 09:59:35秀才
日期:2016-06-23 14:15:06
22#
发表于 2013-5-12 13:00 | 只看该作者
现在还没玩那么深入呢.先听听前驱者的经验

使用道具 举报

回复
论坛徽章:
0
23#
发表于 2013-5-12 14:14 | 只看该作者
美国论文写作培训机构 http://www.assignmentfirst.com/

使用道具 举报

回复
论坛徽章:
68
林肯
日期:2013-09-12 15:57:33马自达
日期:2013-10-11 13:52:31路虎
日期:2014-01-26 14:35:49现代
日期:2013-08-29 14:39:50三菱
日期:2013-11-25 11:21:19雪佛兰
日期:2013-09-12 15:55:00一汽
日期:2013-11-28 14:15:05技术图书徽章
日期:2013-12-11 10:11:35技术图书徽章
日期:2013-12-11 10:10:51技术图书徽章
日期:2014-01-14 10:54:13
24#
发表于 2013-5-15 10:53 | 只看该作者
本帖最后由 pastime_Wang 于 2013-5-23 14:59 编辑

1. 您使用过Pig吗? 谈谈您对Pig的认识

Pig : 数据流描述型语言, 用于大数据数据流处理,
把数据流处理翻译成多个map和reduce函数, 我理解有点类似于简单的ETL操作,
可以进行简单的排序、分组和连接、过滤等操作;

SQL : 数据库查询和编程的 "结构化 " 语言;
C#, Java 等: 面向对象的编程语言;

/*****************************************************/
2. Pig和Hive有什么区别?

Hive 主要是建立在 Hadoop 上的DW基础构架, 使用HQL (类 SQL 查询语言),
使用HQL语言转换为 MapReduce 任务运行.可以用来进行数据提取转化加载(ETL),
还可以存储、查询和分析存储在 Hadoop 中的大规模数据

Pig 与Hive 功能类似, 但Pig 相对较"轻量"的脚本编程语言, 用来写一些"即时脚本",
相比于直接使用Hadoop Java API可大幅减少开发量,而且特别适用于复杂、嵌套数据结构的处理

/*****************************************************/
3. 谈谈Pig对Hadoop平台的影响。

Pig 是为了减少Hadoop 平台上的Java API 开发量和开发效率, 提高开发的灵活性
Pig脚本来对数据进行预处理, 可以像RDBMS 对数据的进行校验和约束(存储在Hadoop文件系统中的数据是没有相关的检查机制的)

/*****************************************************/
4. 有比Pig更好的技术吗?请详细说明。

我觉得HIVE就很好, HQL 更简洁的 类 "SQL", 在DW上的广泛应用, 如 特有统计功能, 学习成本低. 支持扩展

使用道具 举报

回复
论坛徽章:
2
奥运纪念徽章
日期:2013-07-18 13:55:12ITPUB社区12周年站庆徽章
日期:2013-10-08 17:44:42
25#
发表于 2013-5-15 11:20 | 只看该作者
pig是hadoop项目的一个拓展项目, 用以简化hadoop编程,可以加载数据、表达转换数据以及存储最终结果。提供一种抽象的数据处理能力。pig 提供的操作在大量数据集分析中很有优势。以及于学起来很顺手,其实就像计算机方面的很多东西都似乎有某种共同点似的,当你学习一门技术很精通以后,接触另一样类似东西,会感觉很舒服。就像当初从PHP语言转到JAVA后,感觉思想没有变,变的只有语法。

使用道具 举报

回复
论坛徽章:
4
2011新春纪念徽章
日期:2011-02-18 11:43:33紫蛋头
日期:2011-06-17 00:03:54紫蛋头
日期:2012-03-17 00:31:56ITPUB 11周年纪念徽章
日期:2012-10-09 18:14:48
26#
发表于 2013-5-20 15:02 | 只看该作者
因为有数据处理的需求的存在,有了pig的存在,而不是为了实现一个复杂的逻辑任务,一个一个MapReduce去Coding,pig能屏蔽MapReduce开发的繁琐细节  ,能更方便地处理海量数据。如果没有pig,我觉得在Hadoop平台,会更麻烦。如果没有pig,简直是不敢想象。

使用道具 举报

回复
论坛徽章:
10
ITPUB 11周年纪念徽章
日期:2012-10-09 18:09:19itpub13周年纪念徽章
日期:2014-10-08 15:17:53itpub13周年纪念徽章
日期:2014-10-08 15:17:53itpub13周年纪念徽章
日期:2014-10-08 15:17:53马上有钱
日期:2014-02-18 16:43:092014年新春福章
日期:2014-02-18 16:43:09优秀写手
日期:2014-02-18 06:00:11ITPUB社区12周年站庆徽章
日期:2013-10-08 15:00:342013年新春福章
日期:2013-02-25 14:51:24itpub13周年纪念徽章
日期:2014-10-08 15:17:53
27#
发表于 2013-10-10 23:16 | 只看该作者
本帖最后由 tian1982tian 于 2013-10-10 23:16 编辑

不好意思,刚看到中奖信息,不知道现在还可以邮寄书吗?

使用道具 举报

回复
论坛徽章:
0
28#
发表于 2014-7-21 09:08 | 只看该作者
感觉很棒!

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表