|
还有上文提到的Cloudera发布了实时查询开源项目Impala。多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。虽然Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。
大数据面临的一个很大的问题是大多数分析查询都很缓慢且非交互式。Google的Dremel能以极快的速度处理网络规模的海量数据。据谷歌的研究报告显示,Dremel能以拍字节(petabyte,PB,1PB等于1024TB)的数量级来进行查询,而且只需几秒钟时间就能完成。而其对应的开源版本就是Drill。 Drill与MapReduce相辅相成。在谷歌,数以千计的工程师每天都在使用Dremel和MapReduce,未来也将有着更多的人来使用Drill与MapReduce。如果想了解的更多,可能你还需要看看Google Dremel 与 Apache Hadoop的对比篇。 |
|