|
本帖最后由 thy84919 于 2012-9-24 21:42 编辑
1:作为一名DBA或者架构师,你将如何去管理这些海量数据?普通的关系型数据库很难去满足这种压 力,请谈谈自己的想法。
海量数据不一定是常用查询数据,所以放在以空间换取时间的数据仓库中,通过优化硬件,配置等满足不常用的查询。对于常用的查询通常不会使用到大而全的全部数据,所以以查询主题来建立不同需求的数据集市,面对不同的需求和达到一个合理的响应时间,甚至一些工具开始对轻量级的数据进行内存中的管理,其实这些自己感觉是对大数据的细化应用。
2:你看好大数据环境下的数据分析行业吗?谈谈自己对数据分析未来的想法。
看好,但是更加看好对于大环境数据下中的有用数据提取
3:你接触或者使用过哪些数据分析工具?他们在数据分析方面有什么优缺点。
MS,oracle,QV,spotfile, 好坏各有,只是针对不同的人群和需求而已,通常一个工具的优点在不同的需求下会变成缺点,同时一个缺点也可能会变成优点
4:淘宝网每天需要对PB级的数据进行加载分析,这些海量数据在存储方式,访问,分配,数据传输的带宽瓶颈,海量数据的计算都将面临一些困难,请谈谈自己在海量数据加载分析方面相关问题的一些想法。
没有碰到过这么大数据量的项目
是否可以通过分布式存储将数据存在不同的网络服务服务器上。具体想法没有,哈哈!!
|
|