楼主: hwayw

话题讨论:Hadoop是否是大数据处理的福音

[复制链接]
论坛徽章:
55
马上加薪
日期:2014-02-19 11:55:142010广州亚运会纪念徽章:排球
日期:2011-04-27 13:27:19SQL大赛参与纪念
日期:2011-04-13 12:08:172011新春纪念徽章
日期:2011-02-18 11:43:332011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:332011新春纪念徽章
日期:2011-01-25 15:42:152011新春纪念徽章
日期:2011-01-25 15:41:502011新春纪念徽章
日期:2011-01-25 15:41:01生肖徽章2007版:兔
日期:2011-01-20 12:58:49
21#
发表于 2012-4-19 17:09 | 只看该作者
我又一疑问:现有hadoop大数据处理 太多人关注。我想问问你们是否考虑过 非互联网BI行业企业 现在数据在一些主流数据库上。如何发挥主流数据库数据迁移到hadoop上实现数据互通,优势互补。让BI在效率上更高、更快、更强!

使用道具 举报

回复
论坛徽章:
55
马上加薪
日期:2014-02-19 11:55:142010广州亚运会纪念徽章:排球
日期:2011-04-27 13:27:19SQL大赛参与纪念
日期:2011-04-13 12:08:172011新春纪念徽章
日期:2011-02-18 11:43:332011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:332011新春纪念徽章
日期:2011-01-25 15:42:152011新春纪念徽章
日期:2011-01-25 15:41:502011新春纪念徽章
日期:2011-01-25 15:41:01生肖徽章2007版:兔
日期:2011-01-20 12:58:49
22#
发表于 2012-4-19 17:11 | 只看该作者
xsmdel 发表于 2012-4-19 17:09
我又一疑问:现有hadoop大数据处理 太多人关注。我想问问你们是否考虑过 非互联网BI行业企业 现在数据在一些 ...

本届数据库盛会有没有这方面的声音,望大家分享一二哈。

使用道具 举报

回复
论坛徽章:
122
凯迪拉克
日期:2013-12-04 15:20:03红旗
日期:2013-12-04 15:20:03夏利
日期:2013-12-04 15:20:03福特
日期:2013-12-04 15:20:032010新春纪念徽章
日期:2015-03-26 14:15:332009新春纪念徽章
日期:2009-01-04 14:52:282009日食纪念
日期:2009-07-22 09:30:00ITPUB 11周年纪念徽章
日期:2012-10-09 18:09:192013年新春福章
日期:2015-03-28 23:18:10雪佛兰
日期:2013-12-04 15:56:35
23#
发表于 2012-4-19 23:18 | 只看该作者
好好研究一下,希望能找到一些机会。

使用道具 举报

回复
招聘 : 数据库管理员
论坛徽章:
7
BLOG每日发帖之星
日期:2008-11-24 01:01:03BLOG每日发帖之星
日期:2009-01-20 01:01:05BLOG每日发帖之星
日期:2009-02-02 01:01:04BLOG每日发帖之星
日期:2009-03-27 01:01:10BLOG每日发帖之星
日期:2009-06-15 01:01:022010新春纪念徽章
日期:2010-03-01 11:08:29ITPUB十周年纪念徽章
日期:2011-11-01 16:20:28
24#
发表于 2012-4-20 01:16 | 只看该作者
本帖最后由 asword 于 2012-4-20 01:27 编辑

个人抛砖引玉下,还请大家指教!

1、Hadoop是否是大数据处理的福音?
肯定的,普通的oracle rac受限于存储,极限在100T以下,如果一个数据仓库的数据量更大,只能用售价上千万的 oracle exadata 或是 teradata,
而hadoop的话,只要100台以上的 pc server 即可完成同样的工作,软件本身完全是免费的,性价比完全没法比。

2、Hadoop与其他海量数据处理方案相比有什么优劣势?
优点: 免费、开源、易扩展、pc server成本低
缺点: 查询性能慢,分钟级延迟,不适合做即席查询,只能做批量数据处理与计算
          开发效率低,Map reduce的开发难度远大于sql开发,目前主流解决方案是在hadoop上安装 hive,使用hive来写sql,hive会自动将sql 转换为 map reduce代码,          但是即使是 hive 也不完全支持sql 92标准的语法,  且hive 没有oracle 的分析函数,所以很多case需要自己开发 udf ,对开发能力还是比 sql 高
          存在一些bug,相关配套的商业工具、支持顾问都很少,如非常完善的调度工具、报表工具、性能监控工具,目前只能基于开源社区的代码,
          自行开发完善
         
3、Hadoop给您带来哪些更多的机会?
个人觉得从长远看,开源方案由于免费的最大好处,在国内所有差钱且拥有大数据(100T以上)的行业都会推广起来,除了不差钱的国有大中型企业,
其他都会逐渐开始尝试使用hadoop,所以从现在起,就积累这部分知识,对于未来的职业发展很有好处。

使用道具 举报

回复
招聘 : 数据库管理员
论坛徽章:
7
BLOG每日发帖之星
日期:2008-11-24 01:01:03BLOG每日发帖之星
日期:2009-01-20 01:01:05BLOG每日发帖之星
日期:2009-02-02 01:01:04BLOG每日发帖之星
日期:2009-03-27 01:01:10BLOG每日发帖之星
日期:2009-06-15 01:01:022010新春纪念徽章
日期:2010-03-01 11:08:29ITPUB十周年纪念徽章
日期:2011-11-01 16:20:28
25#
发表于 2012-4-20 01:19 | 只看该作者
xsmdel 发表于 2012-4-19 17:09
我又一疑问:现有hadoop大数据处理 太多人关注。我想问问你们是否考虑过 非互联网BI行业企业 现在数据在一些 ...

oracle 和 mysql 数据可以用开源的 sqoop 迁移数据到 hadoop上,
sql server 今年微软计划出一个官方的工具,支持数据迁移到 hadoop,
IBM DB2 目前不知,你可以去 IBM Big Data Project的主页上找找看

使用道具 举报

回复
论坛徽章:
11
2011新春纪念徽章
日期:2011-02-18 11:42:49阿斯顿马丁
日期:2013-10-31 16:33:252013年新春福章
日期:2013-02-25 14:51:24ITPUB 11周年纪念徽章
日期:2012-10-09 18:16:00奥运会纪念徽章:足球
日期:2012-08-19 15:57:15蛋疼蛋
日期:2012-02-22 22:32:12茶鸡蛋
日期:2012-02-14 23:20:502012新春纪念徽章
日期:2012-01-04 11:57:56复活蛋
日期:2011-12-28 11:00:35茶鸡蛋
日期:2011-12-07 17:10:33
26#
发表于 2012-4-20 10:18 | 只看该作者
这个要关注,在处理大数据上,hadoop的可扩展优势还是很明显的

使用道具 举报

回复
27#
发表于 2012-4-20 11:24 | 只看该作者
先占个位置。

使用道具 举报

回复
论坛徽章:
512
生肖徽章2007版:猴
日期:2012-10-24 13:24:51生肖徽章2007版:猴
日期:2012-10-24 13:24:51生肖徽章2007版:猴
日期:2012-10-24 13:24:51生肖徽章2007版:猴
日期:2012-10-24 13:24:51生肖徽章2007版:猴
日期:2012-10-24 13:24:51生肖徽章2007版:猴
日期:2012-10-24 13:24:51生肖徽章:猴
日期:2012-10-24 13:25:07生肖徽章:猴
日期:2012-10-24 13:25:07生肖徽章:猴
日期:2012-10-24 13:25:07生肖徽章:猴
日期:2012-10-24 13:25:07
28#
发表于 2012-4-20 13:49 | 只看该作者
    1、Hadoop是否是大数据处理的福音?
   目前来看对于处理海量视频文件应该还是不错的。
   2、Hadoop与其他海量数据处理方案相比有什么优劣势?
   优点:
   是开源产品,目前使用比较多,相对比较成熟,对比其他海量数据处理方法网上有更多的资料。
   分布式系统,添加节点相对容易,成本低廉。
   缺点:
   组件过多,相互之间配置文件比较混乱,使用的时候,不知道哪些版本的组件之间配合的兼容性比较好。
   对开发人员来说工作量比较大。
    3、Hadoop给您带来哪些更多的机会?
   带来工作机会,当前正在研究,目前有项目将在hadoop平台上试用。

使用道具 举报

回复
论坛徽章:
63
2010广州亚运会纪念徽章:台球
日期:2010-10-18 12:43:48茶鸡蛋
日期:2013-01-09 10:59:002013年新春福章
日期:2013-02-25 14:51:24奥运会纪念徽章:帆船
日期:2013-04-02 17:07:052013年新春福章
日期:2013-04-08 17:42:48奥运纪念徽章
日期:2013-07-18 13:55:12优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11马上有钱
日期:2014-03-20 16:14:11
29#
发表于 2012-4-20 15:47 | 只看该作者
1、Hadoop是否是大数据处理的福音?
肯定是。当然,大数据的分析、处理并不局限于Hadoop,业界还有很多选择。Hadoop是最低廉的解决方案。
  
2、Hadoop与其他海量数据处理方案相比有什么优劣势?
Hadoop最大的优势免费和开源。Hadoop虽然不能做到百分百的免费,因为毕竟你多多少少的都要根据需求购买一些付费的服务和支持。但它们却为你提供了低成本解决问题的方案。它们本身是没有数据库使用License限制的,于是它们很轻松地能够在10台、50台或者上百台的机器上并发处理大规模数据。
Hadoop的劣势是非SQL,需要学习的东西很多,而且公司通常在SQL数据库方面积累了很多技术、技巧。Hadoop会使你不得不放弃你所积累和具备的SQL数据库经验和技能。

3、Hadoop给您带来哪些更多的机会?
中小公司或者企业能够用Hadoop搭建大数据处理环境,在早期如果不花费巨额资金,是不可能做到这一点的。

使用道具 举报

回复
论坛徽章:
2
数据库板块每日发贴之星
日期:2009-07-28 01:01:022013年新春福章
日期:2013-02-25 14:51:24
30#
发表于 2012-4-23 18:35 | 只看该作者
有没有大家贡献一个oracle hadoop的案例呢

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表