楼主: pipihappy8888

话题讨论:菜鸟必看 Hadoop 入门到精通

[复制链接]
论坛徽章:
16
2014年新春福章
日期:2014-02-18 16:43:09目光如炬
日期:2015-08-16 22:00:00目光如炬
日期:2015-08-16 22:00:00慢羊羊
日期:2015-06-26 10:52:05目光如炬
日期:2015-05-25 17:35:22目光如炬
日期:2015-05-25 17:34:42火眼金睛
日期:2015-05-25 15:24:12懒羊羊
日期:2015-03-20 14:42:42itpub13周年纪念徽章
日期:2014-10-08 15:15:25itpub13周年纪念徽章
日期:2014-10-08 15:15:25
11#
发表于 2014-4-8 12:46 | 只看该作者
平时,用关系数据库的多,有空了也了解下

使用道具 举报

回复
论坛徽章:
3
2014年世界杯参赛球队:克罗地亚
日期:2014-06-12 16:53:56海蓝宝石
日期:2014-08-06 14:09:32红宝石
日期:2014-08-28 15:18:18
12#
发表于 2014-4-8 12:48 | 只看该作者
本帖最后由 Detaillee 于 2014-4-8 12:48 编辑

愚见:
》1、scale-up一般采用share-anything的技术架构,主要通过升级硬件来应对不断增长的系统压力,其主要优点是系统扩展起来较为方便、能快速响应压力需求等优点;但由于其扩展能力有限,当系统压力达到一定程度后,一方面扩展起来成本较高;另一方面其性能不会随着硬件的升级而线性增长,当扩展到极限的时候,性能就存在极限性。

》2、Streaming优势:任何支持标准输入输出的语言均可以无缝的接入hadoop平台;程序员可以使用最熟悉的语言进行MapReduce开发;利用像C++等写Map和Reduce执行效率也较高。

》3、两者都是Hadoop生态系统中的重要组成部分;两者都有自己的表达语言,其目的均是将MapReduce的实现简化;两者读写均是在Hdfs文件系统上;
hive有schema、table、分区等metadata概念,而pig没有;hive提供了Thrift server、jdbc接口等,而pig没有;
pig提供了ls cat等经典命令而hive没有;pig相比hive相对轻量;pig比hive具有更强的定制能力。

4》利用sqoop或kettle等ETL工具在hadoop和关系型数据库之间进行数据迁移;
hadoop主要用于日终批量数据处理,主要应用OLAP场景,关系型数据库可应用于OLAP和OLTP场景;
常日终利用hadoop处理完的结果数据会存入关系型数据库如mysql中,以偏做进一步的报表或BI分析。

使用道具 举报

回复
论坛徽章:
41
ITPUB9周年纪念徽章
日期:2010-10-08 09:32:26紫蛋头
日期:2012-11-22 10:14:302013年新春福章
日期:2013-02-25 14:51:24鲜花蛋
日期:2013-07-09 19:31:16本田
日期:2013-11-16 13:09:52马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
13#
发表于 2014-4-8 13:27 | 只看该作者
不错,,当前正是大数据火热期,当然也少不聊hadoop了

使用道具 举报

回复
论坛徽章:
0
14#
发表于 2014-4-8 13:28 | 只看该作者
看来得开始学习Hadoop了。

使用道具 举报

回复
求职 : 数据分析/ETL
论坛徽章:
1
2014年世界杯参赛球队: 葡萄牙
日期:2014-07-24 11:03:54
15#
发表于 2014-4-8 13:36 | 只看该作者

这本书很不错,学习一下

使用道具 举报

回复
论坛徽章:
0
16#
发表于 2014-4-8 14:16 | 只看该作者
好书,求抽中

使用道具 举报

回复
求职 : 数据库管理员
论坛徽章:
35
ITPUB社区12周年站庆徽章
日期:2013-11-07 10:34:33秀才
日期:2016-02-18 09:24:30秀才
日期:2016-01-21 13:37:04ITPUB14周年纪念章
日期:2015-10-26 17:23:44秀才
日期:2015-09-06 10:42:32天枰座
日期:2015-07-14 10:53:552015年新春福章
日期:2015-03-06 11:59:47喜羊羊
日期:2015-03-04 14:54:42itpub13周年纪念徽章
日期:2014-10-08 15:19:03目光如炬
日期:2014-06-16 06:00:12
17#
发表于 2014-4-8 14:28 | 只看该作者
正在重拾JAVA基础知识........

使用道具 举报

回复
论坛徽章:
135
玉石琵琶
日期:2014-07-02 10:11:04九尾狐狸
日期:2014-07-02 10:11:04紫蜘蛛
日期:2014-07-02 10:11:04蓝色妖姬
日期:2014-07-02 10:11:04蓝色妖姬
日期:2014-08-28 15:17:25马上加薪
日期:2014-08-07 12:47:01马上加薪
日期:2014-07-23 11:55:37马上加薪
日期:2014-07-21 16:24:17马上加薪
日期:2014-07-17 17:01:52马上加薪
日期:2014-07-17 16:15:19
18#
发表于 2014-4-8 14:44 | 只看该作者
  好书啊  
对着玩意完全不懂.. 看来需要学学了

使用道具 举报

回复
论坛徽章:
1
秀才
日期:2017-03-20 13:42:20
19#
发表于 2014-4-8 14:45 | 只看该作者
作为一个ITER,hadoop不能不关注,而且要深入关注、学习,这本书看来是一个好书!

使用道具 举报

回复
招聘 : 数据库管理员
论坛徽章:
25
ITPUB9周年纪念徽章
日期:2010-10-08 09:32:25itpub13周年纪念徽章
日期:2014-10-08 16:34:19itpub13周年纪念徽章
日期:2014-10-10 17:49:05马上有车
日期:2014-12-19 09:23:24马上加薪
日期:2014-12-29 20:30:27马上有车
日期:2015-01-20 22:29:13美羊羊
日期:2015-03-04 14:52:282015年新春福章
日期:2015-03-06 11:58:18狮子座
日期:2015-07-14 14:44:11秀才
日期:2015-08-17 13:13:32
20#
发表于 2014-4-8 15:24 | 只看该作者
现在的技术层出不穷,我所关心的是,作为一名dba,需要学习hadoop吗?适合学习hadoop吗?

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表