|
1、Spark VS Hadoop有哪些异同点?
作为通用的并行处理框架,Spark具有类似Hadoop的一些优点,而且Spark采用了更好的内存管理,
在迭代计算上具有比Hadoop更高的效率,Spark还提供了更为广泛的数据集操作类型,大大方便了
用户的开发,checkpoint的应用使Spark具有很强容错能力,众多优越的性能和比Hadoop更广泛
的适用面让Spark的进一步发展值得期待。
2、Spark在容错性方面是否比其他工具更有优越性?
在分布式数据集计算时通过checkpoint来实现容错,而checkpoint
有两种方式,一个是checkpoint data,一个是logging the updates。
用户可以控制采用哪种方式来实现容错。
3、Spark对于数据处理能力和效率有哪些特色?
由于Spark处理数据利用内存,因此它的速度是非常快的,
Spark Streaming:大大提高Spark流处理的能力和稳定性,
使用户可以用同一套代码进行大数据流处理和批量处理。
4、说说您阅读迷你书的感想?
仔细的看了一下迷你书,大概了解到这本书的框架是怎么样的,这本书中将介绍Spark
的什么功能,实际上这本迷你书包括这本书的前三章,这三章基本上讲了Spark的最基本
的知识,第一章就是安装,这个很符合学习者的学习习惯,第二章将的是Spark shell,
这个Spark shell是用户经常会使用的Spark下面的工具,它集程序的开发与调试与一体,
第三章介绍如何构建和运行Spark应用,这一章介绍的就是开发者在Spark下面经常要进行
的工作。 |
|