|
本帖最后由 jimmy-_-lixw 于 2014-1-9 11:59 编辑
支持大数据讨论话题。
1、大数据有哪些潜在价值
其价值在数据量和数据处理速度,以及能够使用大数据作有意义和积极的工作。
大数据与普通数据有两个明显区别,一是海量,二是响应速度。“大数据利用传统工具往往需要数月时间才能完成分析,而应用大数据工具后,不到1s时间就可以获取同样结果。”大数据管理是一项重要的工作。无论你有多少何种质量的数据,如果你不能将它们按照某种便于访问和分析的格式存储到一个环境中,那么你就无法体现出这些数据的价值。
2、Hadoop的优势有哪些
总体上说Hadoop的优势有4方面。
可扩展:不论是存储的可扩展还是计算的可扩展都是Hadoop的设计根本。
经济:框架可以运行在任何普通的PC上。
可靠:分布式文件系统的备份恢复机制以及MapReduce的任务监控保证了分布式处理的可靠性。
高效:分布式文件系统的高效数据交互实现以及MapReduce结合LocalData处理的模式,为高效处理海量的信息作了基础准备。
身边的大数据技术用了哪些技术,首当其冲的当然是Hadoop,使用这些技术的使用场景非常广泛。
应用Hadoop最多使用的还是其分布式存储功能,HDFS存储数据。至于MapReduce、Hive、Pig、HBase、Mahout等,都也是Hadoop强大的应用功能。同时也是其本身的优势。
Hadoop分布式计算不同的场景各自的数据流量也不同,所以相对而言并将数据量大的称为大数据。因此不同应用行业,级别差异,大数据不应当作为比较。
3、写一篇不少于200字的试读感想
这本书很实用,由浅入深,实践和理论相结合,对工作有很大的帮助,是本不可多得的好书。试读章节中,看出是作者在大数据领域的研究成果。
第4章阐述大数据技术应用与企业级应用系统的整合策略。
现有企业级数据分析是以关系型数据库为基础,建立了涵盖网络、存储、服务器、虚拟化、云计算和信息安全等方面的企业IT架构,大数据技术的企业级应用需要实现与这些技术的高效整合,构建新一代的企业级应用架构。
本章分别介绍了大数据传输、集成和流程化管理,大数据与存储架构的整合,大数据对网络架构的发展,大数据与虚拟化技术的整合,云计算平台上的大数据云,以及大数据与信息安全等六个方面的内容。
通过试读章节来看,目录可知道作者的写作思路很清晰,同时我也希望获得此书再看看其他章节的内容。
|
|