楼主: pipihappy8888

话题讨论:想成为Hadoop技术高手吗?

[复制链接]
论坛徽章:
7
阿斯顿马丁
日期:2013-11-27 16:58:03问答徽章
日期:2013-12-11 11:36:33日产
日期:2014-01-17 17:59:11技术图书徽章
日期:2014-01-24 10:24:362014年新春福章
日期:2014-02-18 16:42:02马上有房
日期:2014-02-18 16:42:02马上有车
日期:2014-04-16 17:19:00
11#
发表于 2014-3-26 16:17 | 只看该作者
1、安装hadoop需要root权限 ,比如配置hadoop集群需要修改host文件等
配置core-site.xml等文件,我也使用的root权限

2、我觉得需要从磁盘、内存等方面考虑,还要考虑 replication 的数据副本的数量
3、目前这些技术对我来说都很新的内容
期待书。。。

使用道具 举报

回复
论坛徽章:
10
三菱
日期:2013-11-25 11:21:192014年世界杯参赛球队: 葡萄牙
日期:2014-08-05 11:33:52技术图书徽章
日期:2014-05-23 16:44:532014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082015年新春福章
日期:2015-04-08 13:44:17
12#
发表于 2014-3-26 17:29 | 只看该作者
我是一个初学者,说下我的认识吧
1.安装Hadoop时需要root权限,或者至少需要有sudo的权限。
2.至少应该考虑hadoop集群框架是怎样的,即哪个服务器作为master,哪些作为slave。
还有hdfs的数据备份方式,master的备份策略:是否使用Secondary NameNode,是否配置一个远程的NFS来备份NameNode的一些重要文件。
3.其他的都还没了解过
4.Yarn即MapReduce V2,是一个计算框架。
支持除MapReduce编程框架外的其他框架,所以可以运行非MapReduce应用。
Yarn的优势:
  a.分散了JobTracker的任务。资源管理任务由资源管理器负责,作业启动、运行和检测任务由分布在集  

群节点上的应用主体负责。这样大大减缓了MapReduce V1中的JobTracker单点瓶颈和单点风险的问题,   

大大提高了集群的扩展性和可用性。
  b.在MapReduce V2中应用主体是一个用户可自定制的部分,因此用户可以针对编程模型写自己的应用主  

体程序。这样大大扩展了MapReduce V2的使用范围。
  c.在资源管理器上使用Zookeeper实现故障转移。当资源管理器故障时,备用资源管理器将根据保存在  

Zookeeper中的集群状态快速启动。MapReduce V2支持应用程序指定监测点。这样能保证应用主体在失败  

后能迅速的根据HDFS上保存的状态重启。这两大措施大大提高了MapReduce V2的可用性。
  d.资源管理统一组织成资源容器,而不像在MapReduce V1中Map池和Reduce池有所差别。这样只要有任务

请求资源,调度器就会将集群中可用资源分配给请求任务,而无关资源类型。这大大提高了集群资源的利用率。
5.对Mesos还不了解

使用道具 举报

回复
论坛徽章:
184
2013年新春福章
日期:2013-05-27 10:23:002013年新春福章
日期:2013-05-27 10:23:002013年新春福章
日期:2013-06-05 15:29:212013年新春福章
日期:2013-06-05 15:29:212013年新春福章
日期:2013-05-27 10:23:002013年新春福章
日期:2013-06-05 15:29:21马上有房
日期:2014-03-03 16:14:44马上有对象
日期:2014-02-18 16:44:082014年新春福章
日期:2014-03-04 16:55:19ITPUB 11周年纪念徽章
日期:2012-09-28 17:34:42
13#
发表于 2014-3-26 17:45 | 只看该作者
高端大气上档次

使用道具 举报

回复
论坛徽章:
737
季节之章:春
日期:2015-07-31 17:16:29ITPUB季度 技术新星
日期:2014-07-17 14:37:00季节之章:秋
日期:2015-07-31 17:16:14季节之章:夏
日期:2015-07-31 17:16:29股神
日期:2014-10-15 09:23:31衰神
日期:2014-10-20 22:47:12季节之章:冬
日期:2015-07-31 17:16:14红钻
日期:2014-12-16 17:51:41洛杉矶湖人
日期:2016-09-23 08:18:15布鲁克林篮网
日期:2016-09-23 08:17:18
14#
发表于 2014-3-26 17:46 | 只看该作者
支持.....

使用道具 举报

回复
论坛徽章:
2
15#
发表于 2014-3-26 23:54 | 只看该作者
我来讲讲我们公司Hadoop的应用吧  10台戴尔的64G内存的集群 另外还有几台接口机器    hadoop我主要应用分三块   一部分是mapreduce ,还有HIVE  还有HBASE    mapreduce主要是用来数据清洗的   当然你也可以用Python或者Perl或者AWK但是 mapreuce运算集群速度还是很快的   而且mapreduce模型很简单  用JAVA写模式都很固定的  只要你往里套就行了      然后就是HIVE   就是数据仓库   做报表展示用的   注意HIVE不能实时    还有个就是HBASE  这个是实时查询用的  HBASE查询的时候一般只是要KEY来查询 ,所以KEY设置很关键,  当然你也可以用value查询  但是这样就慢了  不能像用KEY查询毫秒级的 我自己用的时间也少  希望能和大家多交流交流

使用道具 举报

回复
论坛徽章:
82
2013系统架构师大会纪念章
日期:2015-07-31 17:48:20探花
日期:2015-08-17 14:58:32榜眼
日期:2015-08-17 14:59:28进士
日期:2015-08-17 15:00:55举人
日期:2015-08-17 15:00:55秀才
日期:2015-08-19 09:36:37秀才
日期:2015-08-20 08:50:41嫦娥
日期:2015-08-21 09:11:54秀才
日期:2015-08-24 09:48:07进士
日期:2015-08-17 14:58:18
16#
发表于 2014-3-27 09:18 | 只看该作者
释怀355 发表于 2014-3-26 17:29
我是一个初学者,说下我的认识吧
1.安装Hadoop时需要root权限,或者至少需要有sudo的权限。
2.至少应该考 ...

我觉得层主说的是对的

使用道具 举报

回复
论坛徽章:
8
2010新春纪念徽章
日期:2010-03-01 11:19:53ITPUB十周年纪念徽章
日期:2011-11-01 16:23:26鲜花蛋
日期:2012-03-24 09:28:42ITPUB 11周年纪念徽章
日期:2012-10-09 18:08:15ITPUB 11周年纪念徽章
日期:2012-10-23 16:55:312013年新春福章
日期:2013-02-25 14:51:24日产
日期:2013-10-24 08:12:112014年世界杯参赛球队: 尼日利亚
日期:2014-07-24 11:03:13
17#
发表于 2014-3-27 10:29 | 只看该作者
活动支持一下 。。其他稍后补上。

使用道具 举报

回复
论坛徽章:
2
2013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-24 06:00:13
18#
发表于 2014-3-27 14:29 | 只看该作者
只是知道,没仔细了解过

使用道具 举报

回复
论坛徽章:
0
19#
发表于 2014-3-27 14:55 | 只看该作者
不拿点高端的东西 不好忽悠客户的,我前两天还在搭建hadoop平台,目前正在学习中

使用道具 举报

回复
论坛徽章:
8
ERP板块每日发贴之星
日期:2011-02-08 01:01:01ERP板块每日发贴之星
日期:2011-08-21 01:01:01ITPUB十周年纪念徽章
日期:2011-11-01 16:26:29嫦娥
日期:2012-02-21 15:05:21最佳人气徽章
日期:2012-03-13 17:39:18技术图书徽章
日期:2014-05-22 10:14:362015年新春福章
日期:2015-03-04 14:53:162015年新春福章
日期:2015-03-06 11:58:39
20#
发表于 2014-3-27 15:48 | 只看该作者
高端技术,仰望一下

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表