楼主: 小豆呐呐

【话题讨论】Hadoop能否完全替代传统的数据存储和处理

[复制链接]
论坛徽章:
1
21#
发表于 2012-11-3 21:12 | 只看该作者
1、Hadoop能否完全替代传统的数据存储和处理?
Hadoop是开源的,天生的血统注定了其具有开放性,这也使得更多人有机会参与其中。另外,低成本也降低了企业进入大数据处理市场的门槛。“Hadoop的部署、开发、学习成本都比较低,从这些方面上而言,Hadoop确实有自己的优势。”韩轶平分析说。

除此之外,最重要的一点是,随着大数据处理需求的高速增长,Hadoop和数据库之间的联合应用将越来越多,而在两者之间如何进行数据的调用、查询,怎样保证数据调用和传输的安全,如何更好地对数据进行管理、分析等,都会产生大量的市场机会。

实际上,随着Hadoop受到越来越多厂商和用户的追捧,现在的Hadoop和其诞生之初已经截然不同:从一个单独的开源软件逐渐演变为一个初具规模的生态系统,在这一生态系统中,不同的IT公司扮演着不同的角色:有系统厂商,也有管理监控服务商、数据分析、处理服务商等等。

在这条生态链中,目前各个环节上虽然已经有一些参与者,但距离产业链的完善还有非常大的距离。随着Hadoop在企业应用中的逐渐普及,产业链上各个环节的缺口会越来越大。对于中小开发商而言,这无疑是一个很好的时机:可以根据自身的资源和能力,选择适合的角色和业务进行切入,进而在大数据时代到来时找到自己合适的位置。

2、企业Hadoop能否真的降低企业数据处理的成本?
可减少硬件资源的开销,但会增加维护成本。

3、大家都认为HADOOP是处理大数据,需要多大的数据量?什么级别的企业和数据量需要部署HADDOPN呢?
PB级数据量,类似于大量视频、音频、图片等运用多的企业。

使用道具 举报

回复
招聘 : Oracle 课程老师
论坛徽章:
48
19周年集字徽章-周
日期:2019-09-03 17:47:002011数据库大会纪念章
日期:2015-04-23 10:33:192010数据库技术大会纪念徽章
日期:2015-04-23 10:33:192014年世界杯参赛球队: 俄罗斯
日期:2014-07-17 17:21:42ITPUB伯乐
日期:2014-07-17 14:45:422014年世界杯参赛球队: 希腊
日期:2014-06-20 16:01:122014年世界杯参赛球队:克罗地亚
日期:2014-06-12 16:53:56马上加薪
日期:2014-04-25 14:18:13目光如炬
日期:2014-04-21 06:00:12马上有房
日期:2014-03-31 15:10:37
22#
发表于 2012-11-3 22:20 | 只看该作者
使用案例来回答相信更能说明问题吧 lz 大人

Hbase迎接电信TB级大数据洗礼之热点网站功能实践

在今年年初的时候联通王志军院长就Hadoop在电信行业的大数据应用谈了自己的经验,随着3G网络的发展中国联通目前运营着世界上最大的CDMA网络,流量运营是中国联通一个重要特点。中国联通3G套餐当中流量占比非常非常大,中国联通3G用户流量使用情况也是非常可观的。那么在3G网络功能中上网冲浪占了很大的比例,去研究用户感兴趣的热点网站成为了行为分析中很有特点的一项功能,联通就可以根据这些网站信息推出增值服务,古人云:大浪淘沙始到金啊!

Hbase作为分布式的数据库集群是如何迎接大数据的洗礼呢!,我们之前使用的是Oracle数据库作为存储数据的基石,但当数据量迅猛上涨后许多的瓶颈马上就会呈现出来,大量的数据统计、分组、排序、过滤的操作对Oracle数据库性能真是一个不小的挑战,由于数据不能分布处理,数据的查询速度可想而知。现在我们使用了Hbase数据库就可以很好的解决上述的一系列问题。下面对如何实践设计“热点网站”功能给出了我的一些设想。

表设计:手机上网表 tel-net table 简称 t-n 表

ROW Key                           COLUMN+CELL
18977777777                    column=msisdn:*#06#,     timestamp=1351560318018, value=100                                            
18977777777                    column=msisdn:cellphone,timestamp=1351563680951, value=iphone-5                              
18977777777                    column=sites:http,       timestamp=1351560423739, value=www.dataguru.cn    登陆网站
18977777777                    column=sites:name,       timestamp=1351560476264, value=lianshuchengjin                                
18977777777                    column=user:age,         timestamp=1351560350911, value=28                                             
18977777777                    column=user:name,        timestamp=1351560335833, value=leonarding   
18866662222                    column=msisdn:*#06#,     timestamp=1351560560622, value=101                                            
18866662222                    column=msisdn:cellphone, timestamp=1351560540173, value=iphone-4
18866662222                    column=sites:http,       timestamp=1351560630783, value=www.dataguru.cn    登陆网站
18866662222                    column=sites:name,       timestamp=1351560664387, value=lianshuchengjin
18866662222                    column=user:age,         timestamp=1351560606783, value=26
18866662222                    column=user:name,        timestamp=1351560585193, value=sunev_yu
15911112222                    column=msisdn:*#06#,     timestamp=1351560873212, value=102
15911112222                    column=msisdn:cellphone, timestamp=1351560851244, value=iphone-3
15911112222                    column=sites:http,       timestamp=1351562148765, value=www.itpub.net     登陆网站
15911112222                    column=sites:name,       timestamp=1351562171874, value=itpub
15911112222                    column=user:age,         timestamp=1351562118827, value=100
15911112222                    column=user:name,        timestamp=1351562102858, value=tigerfish

第一步:在一定时间范围内找到所有手机经常上网的网址。
第二步:在map-reduce程序中进行统计和排名(由于手机号就是随机型的因此可以均衡的打散到各个节点执行)。
第三步:汇总结果后,把排名前20的热点网站输出,运营商就可以找到这些热点网站进行合作推出更符合用户倾向的套餐,大把大把的敛money。
后续还可以开发:用户倾向性分析、TOPn大流量排名分析、用户行为分析等等诸如此类的功能。
欢迎大家一起积极讨论,共创Hbase美好未来

使用道具 举报

回复
求职 : 数据库管理员
论坛徽章:
41
喜羊羊
日期:2015-05-08 16:18:362014年新春福章
日期:2014-02-18 16:48:49技术图书徽章
日期:2014-01-26 14:02:05福特
日期:2013-12-27 00:16:54劳斯莱斯
日期:2013-12-20 16:46:55劳斯莱斯
日期:2013-12-02 16:08:54问答徽章
日期:2013-11-12 20:51:23奔驰
日期:2013-10-25 20:19:39ITPUB社区12周年站庆徽章
日期:2013-10-08 15:00:34马上加薪
日期:2014-02-18 16:48:49
23#
发表于 2012-11-4 11:17 | 只看该作者
Hadoop能否完全替代传统的数据存储和处理,我觉得现阶段不太可能,Hadoop在处理海量,类型比较包容,对数据抽取,分析,有非常大的优势,对于OLTP觉得还有一段漫长的路...

使用道具 举报

回复
论坛徽章:
5
2011新春纪念徽章
日期:2011-02-18 11:43:32ITPUB十周年纪念徽章
日期:2011-11-01 16:26:292012新春纪念徽章
日期:2012-01-04 11:57:362012新春纪念徽章
日期:2012-02-07 09:59:35秀才
日期:2016-06-23 14:15:06
24#
发表于 2012-11-5 10:29 | 只看该作者
1、Hadoop能否完全替代传统的数据存储和处理?
hadoop能完全取代传统的数据存储和处理?且不说业务的千差万别,就从数据库厂商来看,传统的数据库厂商貌似才刚到中年.离老年还早呢.
  从业务量来说,世界500强也只有500家,北京市的企业怎么也超过50万家吧.还不过全球呢,我们公司的业务来说,一台基本的服务器就够了.貌似不用hadoop这么大的系统.
    2、企业Hadoop能否真的降低企业数据处理的成本?
也许那个纽约时报还是那个报业,采用google还是亚马逊的hadoop很快就处理完了,但是他的这个业务貌似也不能替代it的需求比如,电力,银行我依然没理解这些企业用hadoop能降低成本还是提高成本
    3、大家都认为Hadoop是处理大数据,需要多大的数据量?什么级别的企业和数据量需要部署Hadoop呢?
   这个也是我疑惑的地方,像我们的数据库数据不过百g,貌似是用不着hadoop这个高端的了.开源的rdbms postgresql已经够我们用了.再加上mongodb和redis我们的性能还是不错的

使用道具 举报

回复
论坛徽章:
1
ITPUB 11周年纪念徽章
日期:2012-10-09 18:13:33
25#
发表于 2012-11-5 11:34 | 只看该作者
各有各的优势,以后应该是多种数据库相互结合使用,才能满足企业的要求

使用道具 举报

回复
论坛徽章:
21
2012新春纪念徽章
日期:2012-11-09 15:23:26奥运会纪念徽章:铁人三项
日期:2012-11-21 16:56:32奥运会纪念徽章:马术
日期:2012-11-21 16:57:09双黄蛋
日期:2012-11-15 18:14:55嫦娥
日期:2012-11-09 15:23:26凯迪拉克
日期:2013-08-07 11:30:472013年新春福章
日期:2013-02-25 14:51:24奥运会纪念徽章:网球
日期:2012-12-10 17:56:28奥运会纪念徽章:帆船
日期:2012-12-03 14:25:26奥运会纪念徽章:艺术体操
日期:2012-12-03 14:25:26
26#
发表于 2012-11-6 08:50 | 只看该作者
不是太了解HADOOP,不过我想完全替代肯定是不可能的,每种数据库都有自己的应用场景,只能说是互补吧,完全替代谈不上。

使用道具 举报

回复
论坛徽章:
0
27#
发表于 2012-11-6 13:40 | 只看该作者
  1、Hadoop能否完全替代传统的数据存储和处理?
  这个要看具体业务场景的,不可能完全取代,但在数据仓库领域可以取代部分
  2、企业Hadoop能否真的降低企业数据处理的成本?
  相比买oracle和db2的license我绝对hadoop能很大程度上降低费用,但在研发,维护上费用应该是增加的。hadoop+虚拟化我觉得还是很不错的!
  3、大家都认为Hadoop是处理大数据,需要多大的数据量?什么级别的企业和数据量需要部署Hadoop呢?
  PB级以上,我绝对很多企业多可以部署hadoop,只是大公司研发投入的比较多!我相信电信运营商也会上的!

使用道具 举报

回复
论坛徽章:
25
IT宝贝
日期:2012-09-04 15:15:55马上有对象
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有车
日期:2014-02-19 11:55:14奥运会纪念徽章:现代五项
日期:2012-10-23 08:54:45奥运会纪念徽章:射箭
日期:2012-10-19 10:47:33奥运会纪念徽章:田径
日期:2012-10-19 09:52:52ITPUB 11周年纪念徽章
日期:2012-10-09 18:09:19ITPUB 11周年纪念徽章
日期:2012-09-28 17:34:42
28#
 楼主| 发表于 2012-11-6 13:45 | 只看该作者

使用道具 举报

回复
招聘 : Linux运维
论坛徽章:
1
鲜花蛋
日期:2013-01-30 21:19:49
29#
发表于 2012-11-6 16:53 | 只看该作者
1、Hadoop能否完全替代传统的数据存储和处理?
现价段来说,hadoop无法完全替代传统的实时在线数据处理。

2、企业Hadoop能否真的降低企业数据处理的成本?
看具体情况了,如果是海量的非结构化数据处理,hadoop确实可以降低企业成本,但如果是非海量的结构化数据处理,同样应用hadoop来进行处理,只能适得其反了。

3、大家都认为Hadoop是处理大数据,需要多大的数据量?什么级别的企业和数据量需要部署Hadoop呢?
至少是上TB级的数据来用hadoop来进行数据处理与分析;互谅网行业的企业与TB甚至PB级别的数据都可以考虑部署hadoop。

使用道具 举报

回复
论坛徽章:
5
会员2006贡献徽章
日期:2006-04-17 13:46:34会员2007贡献徽章
日期:2007-09-26 18:42:10ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44生肖徽章2007版:鼠
日期:2008-01-02 17:35:53ITPUB9周年纪念徽章
日期:2010-10-08 09:28:51
30#
发表于 2012-11-8 16:22 | 只看该作者
我觉得,在数据爆炸的今天,Hadoop是一个发展方向,分布式处理大数据量很有优势,并且是开源的;但是如果说替代的话为时尚早;
随着新的硬盘技术相继推出,单机处理能力还是能得到极大提高,现在的Fussion-io,以后的按热来存储数据的硬盘等等,速度都非常快的!

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表