1.早在2013年微软借助Bing的大数据分析,成功预测了24个奥斯卡奖中的19个,2014年和2015年则飙升到了21个,微软是如何借助Bing成功实现奥斯卡奖的大数据分析?背后可能用到了哪些数据模型和算法?
微软做搜索引擎那么多年,通过各种渠道观察搜集的数据那是相当相当多的,通过这些数据为自己的网站得到一些启迪,并把它发挥出来为自身创造一定的利益,这个就是Bing的价值。个人觉得微软对这些数据分析是自身网站和竞争对手最常用也是最基本的能力。通过这些数据(一定时间的观察后可绘制成趋势图)可以比较清楚的了解自身网站和竞争对手的网站优化情况以及在搜索引擎的权重表现。通过对关键词分类整理,然后查询在搜索引擎的排名情况,进而对比分析关键词带来的转化,可以看出优化情况。哪些还需要加强,哪些需要维护,哪些词高排名却没有带来实质的意义,进而调整网站优化策略。至于用到的数据模型和算法应该是Hadoop吧。
2.对于大数据的典型应用,到底是预测更重要,还是大数据可视化分析更重要?您比较看好哪些大数据可视化分析工具?请结合您所了解的大数据应用场景谈谈您的想法。
个人觉得还是可视化分析更重要。可视化分析对于我们更加有借鉴意义。个人比较喜欢Google Refine。用户在电脑上运行这个应用程序后就可以通过浏览器访问之。这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好,Google Refine能够把不规范的写法迅速统一起来。
3.有业界传闻预测奥斯卡只是玩票,微软豪赌大数据到底想干点啥?很多企业纷纷投入大数据的浪潮中,您比较看好哪些企业的大数据解决方案?
微软的大数据,微软在软件和电脑系统上已经做的相当好了,已经拥有很多的用户,通过大数据,微软可以获取到已经挖掘到更多的商机以及以后的发展趋势。我比较看好阿里的大数据解决方案吧。
|