|
1、从大数据分析的计算方式来看,部署大数据分析方案,您会看好哪种方式呢?小型机、X86虚拟化、刀片服务器、开源分布式计算方式还是其它方式?
现网部署大数据分析一般采用的是刀片存储服务器进行部署,X86虚拟化目前还在测试阶段。
2、海量并行处理数据库系统MPP已经存活十多年了,不管是传统数据还是大数据都可以使用MPP架构,那么它到底有哪些威力呢?对企业而言,在处理海量数据时,是选择数据仓库还是一体机?
如果说刀片存储是一体机的话,我觉得在处理海量数据的时候,刀片存储应该可以占据一定席位。
毕竟MPP数据库就是需要主机带存储,当前的存储刀片已经可以满足一台刀片配几十T的存储盘,从SAS盘,SATA盘; 并且刀片背板可以配置万兆网卡用以满足大数据量的通信。
补充《大数据时代的IT架构设计》试读想法
整体上来说,试读包含了四位大师的网络架构和说明,分别为hadoop的上网日志分析、hadoop的金融银行业的应用架构、优酷土豆的hadoop平台开放之路以及淘宝的自创的海量文件存储实践四大内容。
关于hadoop的上网日志分析,当前现网已经部署hadoop的网络爬虫以及hadoop的日志分析,如文章中介绍的通过url匹配进行用户上网日志的抓取,通过日志分析,过滤,导入到传统的数据库中。 这点和文章中不太一致,文章是全部通过hadoop处理。我们这边hadoop只是获取爬虫数据,过滤完后,传到传统的数据库中进行关联用户资料,再进行分析。
关于淘宝的海量文件存储实践,前期看过淘宝技术这十年,感觉淘宝人才济济,太厉害了,对于海量数据的分析能力很强悍。
书的内容很丰富,而且组网图我感觉有点立体感,后续可以借鉴到工作中。
|
|