楼主: hwayw

话题讨论:Hadoop是否是大数据处理的福音

[复制链接]
论坛徽章:
25
ITPUB元老
日期:2005-02-28 12:57:00咸鸭蛋
日期:2013-02-07 11:51:42咸鸭蛋
日期:2013-02-08 09:48:51蜘蛛蛋
日期:2013-02-21 15:47:392013年新春福章
日期:2013-02-25 14:51:24咸鸭蛋
日期:2013-02-28 17:08:42蜘蛛蛋
日期:2013-03-29 16:17:14双黄蛋
日期:2013-04-11 16:11:04咸鸭蛋
日期:2013-05-07 11:55:14咸鸭蛋
日期:2013-05-28 10:46:24
31#
发表于 2012-4-24 11:08 | 只看该作者
hadoop是google的原理,我觉得主要还是适合于海量搜索,搜索引擎这类的东西。淘宝也是用户宝贝搜索吧

使用道具 举报

回复
论坛徽章:
0
32#
发表于 2012-4-25 12:46 | 只看该作者
hadoop的实战 淘宝就是一个好的案例 我相信hadoop对于海量数据的挖掘 是很有好的 本人从事BI 想学习之

使用道具 举报

回复
论坛徽章:
0
33#
发表于 2012-4-25 12:49 | 只看该作者
nannan5000 发表于 2012-4-18 19:55
1、这个问题客观的来看,Hadoop提供的是一类思路。通过分布式实现高可用。
     2、Hadoop的 ...

“都是采用单master的方式”不是有机器做为standby的么?

使用道具 举报

回复
论坛徽章:
13
ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44美羊羊
日期:2015-03-04 14:48:582013年新春福章
日期:2013-04-08 17:42:48ITPUB社区OCM联盟徽章
日期:2013-03-25 14:09:31ITPUB十周年纪念徽章
日期:2011-11-01 16:20:282010广州亚运会纪念徽章:体育舞蹈
日期:2010-11-29 10:30:362010新春纪念徽章
日期:2010-03-01 11:08:29参与WIN7挑战赛纪念
日期:2009-11-06 16:05:25祖国60周年纪念徽章
日期:2009-10-09 08:28:00数据库板块每日发贴之星
日期:2009-02-27 01:01:04
34#
发表于 2012-4-25 17:21 | 只看该作者
非互联网行业,尚未接触。
个人觉得,这东西也就是个对blob类非结构化数据处理的替代方案,要是oracle能把它集成进来,替换掉blob也未可知。

使用道具 举报

回复
论坛徽章:
0
35#
发表于 2012-4-27 20:56 | 只看该作者
还耐心的看完所有人的回复,基本上没人对hadoop提出否定的。从我的个人经验说几句。

1、Hadoop是否是大数据处理的福音?
从技术角度分析M/R算法和数据局部化这两样东西把分布式算法一般化是非常有益处的。但是hadoop的优势被过度放大,就像跟帖一样,没有一个反对声音;是真实的完美吗?所以我觉这种过度放大反而影响了新算法和新技术的出现,你要是说hadoop如何如何不灵光肯定会被毫无疑问的弄死。别人可以拿出N多牛B的公司把你压的毫无反手之力。

2. Hadoop与其他海量数据处理方案相比有什么优劣势?
目前来说它不是最快的,也不是最贵的。就像上面说的,它用M/R和数据局部化来对分布式系统进行了一般化,这意味着我们可以套用这两种技术来进行分布式的数据分析。但是它的数据局部化还不能做到基于内容那么精确,而且HDFS本身不具有强力的容错性除了配合M/R之外它基本上没大用途。

3、Hadoop给您带来哪些更多的机会?
。。。。



使用道具 举报

回复
论坛徽章:
0
36#
发表于 2012-5-2 16:05 | 只看该作者
只闻其名,素未谋面...

使用道具 举报

回复
论坛徽章:
0
37#
发表于 2012-6-21 17:24 | 只看该作者
jams007 发表于 2012-4-18 17:27
我们不让用开源的

你们啥公司?这么变态的。

使用道具 举报

回复
论坛徽章:
15
ITPUB9周年纪念徽章
日期:2010-10-08 09:32:27马上有房
日期:2014-04-04 19:42:43马上有对象
日期:2014-02-18 16:44:082014年新春福章
日期:2014-02-18 16:44:08本田
日期:2014-01-16 21:44:06大众
日期:2013-12-14 09:29:562013年新春福章
日期:2013-02-25 14:51:24ITPUB 11周年纪念徽章
日期:2012-10-09 18:14:48奥运会纪念徽章:射箭
日期:2012-07-26 13:53:55奥运会纪念徽章:跆拳道
日期:2012-07-13 13:54:19
38#
发表于 2012-7-16 06:49 | 只看该作者
Kk

使用道具 举报

回复
论坛徽章:
2
数据库板块每日发贴之星
日期:2009-07-28 01:01:022013年新春福章
日期:2013-02-25 14:51:24
39#
发表于 2012-7-20 10:54 | 只看该作者

使用道具 举报

回复
论坛徽章:
70
三菱
日期:2014-01-17 10:00:292014年世界杯参赛球队: 智利
日期:2014-06-05 11:54:32马上加薪
日期:2014-04-07 17:03:21马上有钱
日期:2014-02-25 21:39:36马上加薪
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有车
日期:2014-02-19 11:55:14马上有车
日期:2014-02-18 16:41:11
40#
发表于 2012-7-23 19:00 | 只看该作者
我提个问题:

使用Hadoop来进行ETL处理。每个子节点都可以装载数据进行处理。在以前的ETL工具中,很多有table compare来处理观察数据的更新,删除。而table compare需要一个巨大的快照表来做为比较的基准表。
在hadoop的框架中,这样的大型表在集群间同步怎么优化?有什么独到的算法?否则这种操作都是瓶颈。

常见的日志处理系统等等,其实ETL的逻辑不需要太多节点间的同步。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表