|
呵呵,我也来说两句..
1.如果是二进制包安装,那是需要root权限的,如果是tarball安装,就不需要root了。
2.根据我实际的维护经验,规划hadoop集群时要考虑下面因素:
(1)指定冗余副本数,保证数据安全
(2)大集群时要规划好机架策略
(3)开启回收站,避免误删时丢失数据
(4)由于namenode是单点,所以要做好数据备份
(5)使用ganlia,nagios等软件,监控好集群,问题要早发现早解决
(6)注意小文件数量,及时合并小文件,减少namenode压力
3.由于现在只用过hadoop,所以谈不上喜欢哪个了
4.是管理框架,可以运行其他应用,相对于与原始框架,有下列改进:
(1)将资源管理和应用程序分离,分别由YARN和ApplicationMaster负责,扩展性,容错性更好(2)支持多种计算框架,比如Mapreduce和Spark,用户可以根据不同变成模型编写自己的ApplicationMaster。
(3)监视每个子job的程序分布化了,这实际大大较少jobtrakcer压力
(4)使用container隔离资源,不同于MRv1的slot,可以动态分配资源,避免资源浪费
5. 没用过Mesos,不敢妄评。
|
|