本帖最后由 sunny1889 于 2014-7-7 20:52 编辑
1. 云计算与大数据有什么关系?
(1)从目标上看,大数据主要解决数据存储和分析问题,尤其是强调后者;云计算致力于将计算能力作为服务提供,这种能力体现在基础设施层是主机和存储服务提供,体现在平台层是开发环境托管,体现在应用层是各种云化的应用。
(2)从服务模式看,大数据可以采用云化的理念去提供服务。
(3)从技术实现看,大数据也可以使用云计算提供的计算能力去实现各种大数据存储和分析。但从实际实现方式看,大数据往往会使用云计算的一些技术和资源作为底层基础。(4)从概念发展的先后看,云计算要先于大数据出现,并且更加体系化。
2. 云在技术层面的核心问题是什么?
(1)云计算是并行计算、分布式计算和网格计算的发展,云计算在现有互联网的基础上把所有硬件、软件结合起来,充分利用和调动现有一切信息资源,通过构架一个新型的服务模式,或者能提供服务的一种新的系统结构。为人们提供各种不同层次、各种不同需求的低成本、高效率的智能化的服务及信息服务模式的改变。
(2)云在技术层面的核心问题是虚拟化技术和分布式数据存储技术。
(3)虚拟化是云计算最重要的核心技术之一,它为云计算服务提供基础架构层面的支撑,是ICT服务快速走向云计算的最主要驱动力。虚拟化技术旨在合理调配计算机资源,使其更高效地提供服务。。随着云计算应用的持续升温,业内对虚拟化技术的重视也提到了一个新的高度。很多人认为云计算就是虚拟化。事实上并非如此,虚拟化是云计算的重要组成部分但不是全部。
(4)分布式数据存储技术能够快速、高效地处理海量数据,这是云计算的另一大优势。分布式存储与传统的网络存储并不完全一样,传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。在当前的云计算领域,Google的GFS和Hadoop开发的开源系统HDFS是比较流行的两种云计算分布式存储系统。
3. Hadoop,NoSQL,NewSQL如何定位与使用这些技术?
(1)Hadoop实现了包括分布式文件系统HDFS和MapReduce框架在内的云计算软件平台的基础架构,Hadoop已被全球几大IT公司用作其”云计算”环境中的重要基础软件,使用Hadoop构建云计算平台也成为一种趋势。 (2)NoSQL是从构建分布式系统的角度出发,首先解决量的问题;现阶段NoSQL面临的挑战主要为两方面,一是不够标准化,二是不能工程化。 (3)NewSQL是从继承SQL/ACID处理能力的视角出发,构建分布式系统,其技术优势在于几乎可以无缝的完整的替换原有系统的 RDBMS;
4. 说说读完试读章节后您的感想
《纵横大数据——云计算数据基础设施》试读第9章:InfiniData——一种关系型云数据库的设计与实践,这章节从企业数据的需求引起,进行技术分析和数据库的架构设计。在云存储层这一点讲解非常详细,跟本书的题目很对应,毕竟是底层的基础设施。本章节还引入了MapReduce的云计算框架,可谓是面面俱到,使得InfiniData云数据库的设计显得更内容丰富,技术层面的分析也很到位。总体来看,这本书是一本很不错的大数据底层架构设计的经典读物,纵横大数据的名字很霸气,个人非常喜欢,相信书的内容一样的霸气十足。
|