楼主: hwayw

话题讨论:Spark VS Hadoop有哪些异同点?

[复制链接]
论坛徽章:
10
ITPUB 11周年纪念徽章
日期:2012-10-09 18:09:19itpub13周年纪念徽章
日期:2014-10-08 15:17:53itpub13周年纪念徽章
日期:2014-10-08 15:17:53itpub13周年纪念徽章
日期:2014-10-08 15:17:53马上有钱
日期:2014-02-18 16:43:092014年新春福章
日期:2014-02-18 16:43:09优秀写手
日期:2014-02-18 06:00:11ITPUB社区12周年站庆徽章
日期:2013-10-08 15:00:342013年新春福章
日期:2013-02-25 14:51:24itpub13周年纪念徽章
日期:2014-10-08 15:17:53
11#
发表于 2014-5-7 22:30 | 只看该作者
支持,我们正准备上spark项目,现在已经上了hive、hbase、MR、storm等相关技术的项目,希望今年能上shark项目以改善hive高延迟性能问题,到时候在讨论啊!希望能抽中书。

使用道具 举报

回复
论坛徽章:
2
12#
发表于 2014-5-10 15:29 | 只看该作者
本帖最后由 大海里的骆驼 于 2014-5-10 15:30 编辑

一般公司都在用hadoop
spark现在用的公司比较少
还有待时间的证明spark的可靠性

使用道具 举报

回复
论坛徽章:
10
生肖徽章2007版:鸡
日期:2008-01-02 17:35:53生肖徽章2007版:鼠
日期:2008-01-02 17:35:53奥运会纪念徽章:击剑
日期:2008-10-24 13:24:30ITPUB十周年纪念徽章
日期:2011-11-01 16:21:152012新春纪念徽章
日期:2012-01-04 11:51:22咸鸭蛋
日期:2012-03-23 20:40:03ITPUB 11周年纪念徽章
日期:2012-10-09 18:06:20奥运会纪念徽章:击剑
日期:2012-10-22 14:00:49马上加薪
日期:2014-12-12 14:55:07
13#
发表于 2014-5-10 16:57 | 只看该作者
mark----

使用道具 举报

回复
论坛徽章:
10
ITPUB 11周年纪念徽章
日期:2012-10-09 18:09:19itpub13周年纪念徽章
日期:2014-10-08 15:17:53itpub13周年纪念徽章
日期:2014-10-08 15:17:53itpub13周年纪念徽章
日期:2014-10-08 15:17:53马上有钱
日期:2014-02-18 16:43:092014年新春福章
日期:2014-02-18 16:43:09优秀写手
日期:2014-02-18 06:00:11ITPUB社区12周年站庆徽章
日期:2013-10-08 15:00:342013年新春福章
日期:2013-02-25 14:51:24itpub13周年纪念徽章
日期:2014-10-08 15:17:53
14#
发表于 2014-5-11 21:19 | 只看该作者
准确的说是mapreduce和spark的异同,我们现在正在搞spark的工作,准备将之前的mapreduce计算框架换掉,有可能年底吧,hive的和集群里面的好多任务都太慢了。

使用道具 举报

回复
论坛徽章:
3
2014年世界杯参赛球队:克罗地亚
日期:2014-06-12 16:53:56海蓝宝石
日期:2014-08-06 14:09:32红宝石
日期:2014-08-28 15:18:18
15#
发表于 2014-5-12 23:30 | 只看该作者
很明显spark是这两年大数据技术最为热门的技术之一,但从前面的评论看来大众对其的了解还是比较少的,本人将了解的情况陈述如下:
1、spark由于启用了内存分布数据集,充分利用了分布式内存技术使其运算效率在hadoop至少;使用Scala语言编写;另外随着hadoop 2.0的发布,Spark亦可直接运行在YARN上。
2、容错特性:Spark 引进弹性分布式数据集(RDD) 。RDD 是分布在一组节点中的只读对象集合。集合是弹性的,如果数据集一部分丢失,则可以对它们进行重建。重建部分数据集的过程依赖于容错机制,该机制可以维护 "血统"(即允许基于数据衍生过程重建部分数据集的信息)。
3、很明显采用内存计算的效率远高于具有大量磁盘IO操作的Hadoop
4、迷你书,能在最短的时间内掌握尽可能多的内容,看起来不至于太累。

期待中奖!

使用道具 举报

回复
panda_rabbit 该用户已被删除
16#
发表于 2014-5-15 17:38 | 只看该作者
本帖最后由 panda_rabbit 于 2014-5-15 17:38 编辑

我想知道未来是spark替代hadoop呢?还是两者并存呢?

使用道具 举报

回复
论坛徽章:
1
马上有对象
日期:2014-05-16 09:37:30
17#
发表于 2014-5-16 09:30 | 只看该作者
我只知道spark比Hadoop快。而且快的不只是一倍。对于1.X版本的Hadoop,spark应该可以取代了吧?对于2.x的Hadoop,spark可以利用yarn框架运行得更好。
不知道说得对不对。

使用道具 举报

回复
论坛徽章:
407
紫蛋头
日期:2012-05-21 10:19:41迷宫蛋
日期:2012-06-06 16:02:49奥运会纪念徽章:足球
日期:2012-06-29 15:30:06奥运会纪念徽章:排球
日期:2012-07-10 21:24:24鲜花蛋
日期:2012-07-16 15:24:59奥运会纪念徽章:拳击
日期:2012-08-07 10:54:50奥运会纪念徽章:羽毛球
日期:2012-08-21 15:55:33奥运会纪念徽章:蹦床
日期:2012-08-21 21:09:51奥运会纪念徽章:篮球
日期:2012-08-24 10:29:11奥运会纪念徽章:体操
日期:2012-09-07 16:40:00
18#
发表于 2014-5-16 09:31 | 只看该作者
我关心用来做数据库能否支持跨节点的高效连接和并发更新操作

使用道具 举报

回复
论坛徽章:
17
生肖徽章2007版:猴
日期:2015-07-24 10:50:33紫水晶
日期:2015-09-14 19:29:07萤石
日期:2015-09-14 19:24:48萤石
日期:2015-09-13 14:30:02萤石
日期:2015-09-11 23:05:02红宝石
日期:2015-09-11 23:04:43萤石
日期:2015-09-11 23:04:27生肖徽章2007版:兔
日期:2015-07-31 16:43:10生肖徽章2007版:龙
日期:2015-07-24 10:51:00生肖徽章2007版:龙
日期:2015-07-24 10:50:51
19#
发表于 2014-5-16 14:19 | 只看该作者
我们公司现在数据的处理主要是在hadoop上   但是也搭建了10台的spark的集群   
hadoop 可以使用比较廉价的PC机器    但是spark尽量还是使用内存配置比较高的   我们这用的是64G内存的
网上资料说尽量使用96G内存以上的   但是我们这没那么好的机器做测试
相比较于hadoop   我们使用的spark觉得有几下几个优点
第一 spark基于内存计算,速度很明显 。  10台的SPARK的集群的速度可以和我们这hadoop集群的50台的差不多  但是 hadoop 的集群内存大小不一  有8G的  有16G的  
第二  spark是基于Scala  相比较hadoop基于java    spark更适合数据挖掘       因为scala就是技术机器挖掘的
第三  hadoop 编程模式处理数据很死  只有map 和reduce   而spark编程模式更灵活
第四  据说 spark的算法比hadoop算法更厉害   这个我们这也不知道怎么看    只知道处理数据速度确实快了很多

使用道具 举报

回复
求职 : 数据库管理员
招聘 : Java研发
论坛徽章:
6402
娜美
日期:2021-10-12 20:11:36技术图书徽章
日期:2021-09-30 12:11:1120周年集字徽章-年	
日期:2021-09-30 12:12:5820周年集字徽章-20	
日期:2021-09-30 12:43:0619周年集字徽章-周
日期:2021-09-30 13:18:3120周年集字徽章-20	
日期:2021-09-30 16:44:1219周年集字徽章-周
日期:2021-09-30 17:01:04技术图书徽章
日期:2021-09-30 17:59:14技术图书徽章
日期:2021-10-06 10:36:4019周年集字徽章-19
日期:2021-10-06 14:43:24
20#
发表于 2014-5-19 15:45 | 只看该作者
oracle_cj 发表于 2014-5-5 09:27
1、   Spark VSHadoop有哪些异同点?       Hadoop:分布式批处理计算,强调批处理,常用于数据挖掘、分析[/ ...

靠。你啥都要啊

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表