楼主: arron刘

【话题讨论】 大数据时代如何让自己驾驭Hadoop?

[复制链接]
论坛徽章:
2
ITPUB 11周年纪念徽章
日期:2012-10-09 18:06:20ITPUB社区12周年站庆徽章
日期:2013-10-08 15:00:34
51#
发表于 2013-12-15 23:16 | 只看该作者
学习了。。

使用道具 举报

回复
论坛徽章:
6
ITPUB十周年纪念徽章
日期:2011-11-01 16:26:29咸鸭蛋
日期:2011-11-09 14:50:32咸鸭蛋
日期:2012-06-13 05:10:53三菱
日期:2013-09-17 09:52:46优秀写手
日期:2013-12-18 09:29:13马上加薪
日期:2014-10-15 18:26:41
52#
发表于 2013-12-16 19:03 | 只看该作者
hadoop即将融合到我们第二代ETl里面去,说下个人粗浅的理解。
1.不是hadoop开发人员,算是hadoop使用人员,原理必须要掌握的,知其然 知其所以然。
2.hadoop 主要是要发挥发的优势,低成本(硬件),更快完成海量数据处理,这个是我们追求的。目前我们数据仓库系统遇到性能瓶颈,目前解决方案就是横向分解,给后期管理维护带来巨大麻烦。hadoop恰恰就是一个很好的解决方案。
3.我觉得如果不是做框架开发设计的,只是技术使用者,用当前完善的技术来实现客户需求的话,没有必要看源代码。时间有限,青春不多。

总的来说针对技术使用者(而非创作者)来说:了解原理,会使用,能发挥其优势,能解决使用中遇到的问题就差不多了。
不同的技术是为了不同业务场景的需要。不做技术的奴隶,而是做技术的驾驭者。

使用道具 举报

回复
论坛徽章:
6
ITPUB十周年纪念徽章
日期:2011-11-01 16:26:29咸鸭蛋
日期:2011-11-09 14:50:32咸鸭蛋
日期:2012-06-13 05:10:53三菱
日期:2013-09-17 09:52:46优秀写手
日期:2013-12-18 09:29:13马上加薪
日期:2014-10-15 18:26:41
53#
发表于 2013-12-16 19:08 | 只看该作者
dywjzh 发表于 2013-12-11 12:49
没有上百台服务器,搞什么hadoop

谁规定hadoop一定要上百台server了?

数据仓库中用10个节点以下的项目多的是,河南移动 黑龙江移动等等。

使用道具 举报

回复
论坛徽章:
5
2013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-20 06:00:11技术图书徽章
日期:2014-01-26 14:31:292014年新春福章
日期:2014-02-18 16:43:09马上有钱
日期:2014-02-18 16:43:09
54#
发表于 2013-12-17 10:58 | 只看该作者
shentao19890909 发表于 2013-12-16 19:03
hadoop即将融合到我们第二代ETl里面去,说下个人粗浅的理解。
1.不是hadoop开发人员,算是hadoop使用人员, ...

赞一个~

使用道具 举报

回复
论坛徽章:
0
55#
发表于 2013-12-17 11:18 | 只看该作者
shentao19890909 发表于 2013-12-16 19:03
hadoop即将融合到我们第二代ETl里面去,说下个人粗浅的理解。
1.不是hadoop开发人员,算是hadoop使用人员, ...

赞同这个观点。

使用道具 举报

回复
招聘 : 数据库管理员
论坛徽章:
10
奥运会纪念徽章:花样游泳
日期:2012-08-31 14:52:33马上加薪
日期:2014-02-18 16:48:492014年新春福章
日期:2014-02-18 16:48:49技术图书徽章
日期:2014-01-26 14:10:14技术图书徽章
日期:2014-01-24 10:24:36技术图书徽章
日期:2014-01-24 10:22:00优秀写手
日期:2013-12-18 09:29:09奥运会纪念徽章:击剑
日期:2012-08-17 10:42:57奥运会纪念徽章:击剑
日期:2012-07-27 14:58:55马上有房
日期:2014-03-25 09:38:43
56#
发表于 2013-12-18 09:19 | 只看该作者
发现这个讨论最好需要拿出些实际案例来!

使用道具 举报

回复
招聘 : 数据库管理员
论坛徽章:
10
奥运会纪念徽章:花样游泳
日期:2012-08-31 14:52:33马上加薪
日期:2014-02-18 16:48:492014年新春福章
日期:2014-02-18 16:48:49技术图书徽章
日期:2014-01-26 14:10:14技术图书徽章
日期:2014-01-24 10:24:36技术图书徽章
日期:2014-01-24 10:22:00优秀写手
日期:2013-12-18 09:29:09奥运会纪念徽章:击剑
日期:2012-08-17 10:42:57奥运会纪念徽章:击剑
日期:2012-07-27 14:58:55马上有房
日期:2014-03-25 09:38:43
57#
发表于 2013-12-18 09:20 | 只看该作者
2009532140 发表于 2013-12-11 12:13
我也有这个疑问,数据量多大的适合上这个技术..

我觉得数据量级固然重要,但是要上hadoop ,,,数据规划和数据生态才是决定性的!!

使用道具 举报

回复
求职 : 数据库管理员
招聘 : Java研发
论坛徽章:
6402
娜美
日期:2021-10-12 20:11:36技术图书徽章
日期:2021-09-30 12:11:1120周年集字徽章-年	
日期:2021-09-30 12:12:5820周年集字徽章-20	
日期:2021-09-30 12:43:0619周年集字徽章-周
日期:2021-09-30 13:18:3120周年集字徽章-20	
日期:2021-09-30 16:44:1219周年集字徽章-周
日期:2021-09-30 17:01:04技术图书徽章
日期:2021-09-30 17:59:14技术图书徽章
日期:2021-10-06 10:36:4019周年集字徽章-19
日期:2021-10-06 14:43:24
58#
发表于 2013-12-18 09:22 | 只看该作者
jerry_xing8 发表于 2013-12-18 09:20
我觉得数据量级固然重要,但是要上hadoop ,,,数据规划和数据生态才是决定性的!!

老兄是否能给puber 们详细的说说啊...
例如:什么是数据生态?
为什么他们是决定性作用的啊...

谢谢了啊!

使用道具 举报

回复
招聘 : 数据库管理员
论坛徽章:
10
奥运会纪念徽章:花样游泳
日期:2012-08-31 14:52:33马上加薪
日期:2014-02-18 16:48:492014年新春福章
日期:2014-02-18 16:48:49技术图书徽章
日期:2014-01-26 14:10:14技术图书徽章
日期:2014-01-24 10:24:36技术图书徽章
日期:2014-01-24 10:22:00优秀写手
日期:2013-12-18 09:29:09奥运会纪念徽章:击剑
日期:2012-08-17 10:42:57奥运会纪念徽章:击剑
日期:2012-07-27 14:58:55马上有房
日期:2014-03-25 09:38:43
59#
发表于 2013-12-18 09:22 | 只看该作者
shentao19890909 发表于 2013-12-16 19:08
谁规定hadoop一定要上百台server了?

数据仓库中用10个节点以下的项目多的是,河南移动 黑龙江移动等等 ...

目前除了电信 以为,落地的hadoop 行业,还有那些,现在我们在作交通的???

使用道具 举报

回复
招聘 : 数据库管理员
论坛徽章:
10
奥运会纪念徽章:花样游泳
日期:2012-08-31 14:52:33马上加薪
日期:2014-02-18 16:48:492014年新春福章
日期:2014-02-18 16:48:49技术图书徽章
日期:2014-01-26 14:10:14技术图书徽章
日期:2014-01-24 10:24:36技术图书徽章
日期:2014-01-24 10:22:00优秀写手
日期:2013-12-18 09:29:09奥运会纪念徽章:击剑
日期:2012-08-17 10:42:57奥运会纪念徽章:击剑
日期:2012-07-27 14:58:55马上有房
日期:2014-03-25 09:38:43
60#
发表于 2013-12-18 09:56 | 只看该作者
2009532140 发表于 2013-12-18 09:22
老兄是否能给puber 们详细的说说啊...
例如:什么是数据生态?
为什么他们是决定性作用的啊...

就是这个意思,
假如你就一两个系统数据量很大,你用HADOOP干什么,没事闲的?直接上RAC再做数据优化就解决了吧,
所谓的数据生态,可以理解为我们传统的铁人四项 生产系统+ETL+数据仓库+统一存储,这些都是基础设施,一定得有吧,原来传统数据库都有,但是有瓶颈 OLAP太慢,数据量级上去,成本指数上升。这些还有些每天在那搞数据模型的人,这些人才是真正核心玩家,不是那些做运维的。这是我的理解。

所谓数据规划,我是这样理解的,我做过电信口和交通口的,就拿交通来说,交通口的  只要求保留3个月,有料可查就行了, 现在上头一纸公文 要做交通协调,个体活动模型,这些就需要下一整盘棋了!!

为什么电信用的挺好,因为电信很早就有对数据整合的传统,现在使用只是顺理成章了!!

望大家批评指正!

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表