|
1.自建Hadoop集群是企业选择处理大数据的主流方法之一,相比之下,ODPS平台有哪些优势?
集群系统搭建、相关文件配置、网络带宽、存储、安全等。
阿里这套相当于ERP系统,可以兼容所有业务;而企业自建平台相当于量身定做的ERP系统。自建的,企业完全可控。而阿里有技术实力的保证,具体用户自由选择。
2.ODPS是一个比Google BigQuery更强大的产品——不仅提供更加丰富的SQL语法,还将提供MapReduce编程模型和大规模机器学习建模能力。请谈谈您对这种ODPS的技术理解。
SQL语法,应该是在hive基础上做的二次开发或优化速度
MapReduce 这个才是大数据处理的核心。分布式处理,就是将任务分布到多台机器处理,这里也是企业自己要实现的业务逻辑地方,阿里不可能帮你做,通用的除外。
3.阿里将ODPS的内部技术正式商用化,这也标志着大数据进入了公共服务时代。请结合您的想象,谈谈怎么用ODPS来玩大数据?
根据自己企业的实际情况具体分析,其实可以把它想象成时下的BI工具。
简单的,系统日志分析功能,分析用户登录的并发数、常用的操作模块、使用时间,由此可以知道用户最常用的是哪个模块、哪段时间峰值最大、等,以此优化企业系统。
企业类型不一样,所需关注的度不一样,这范围太广。 |
|