|
1.自建Hadoop集群是企业选择处理大数据的主流方法之一,相比之下,ODPS平台有哪些优势?
主要优势有:
(1) 处理能力强大,这个体现在处理数据的量以及处理速度上,众所周知,阿里的业务的数据量在国内是首屈一指的,它能在6小时处理100PB数据,由此可见,一般
公司的业务处理应该是没有问题。
(2) 成本低龄,用户可以根据自己的业务特点与实际需求来租用相应的计算能力,这样用户的钱可以用在刀刃上,如果业务规模扩大,可以再购买更多的计算能力。
2.ODPS是一个比Google BigQuery更强大的产品——不仅提供更加丰富的SQL语法,还将提供MapReduce编程模型和大规模机器学习建模能力。请谈谈您对这种ODPS的技术理解。
ODPS技术有如下的技术特征:
(1)企业级特征:有定制化的ETL,窗口函数、存储过程、作业调度、M\R支持、UDF等
(2)项目支撑: 项目空间和帐号授权机制. Quota和Priority的管理
(3)支持Web service:RESTfUL api,多语言SDK,事件订阅。
3.阿里将ODPS的内部技术正式商用化,这也标志着大数据进入了公共服务时代。请结合您的想象,谈谈怎么用ODPS来玩转大数据?
各公司认真梳理本公司的业务,将有需要上大数据计算平台的业务找出来,估计一下成本与风险,有选择的将项目迁移到ODPS
平台上面。 |
|