楼主: hwayw

《大数据技术全解》有奖试读活动(已公布获奖)

[复制链接]
论坛徽章:
40
2014年新春福章
日期:2014-02-18 16:42:02秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:51:162015年中国系统架构师大会纪念徽章
日期:2015-09-16 12:54:392014系统架构师大会纪念章
日期:2015-09-16 12:54:392013系统架构师大会纪念章
日期:2015-09-16 12:54:392012系统架构师大会纪念章
日期:2015-09-16 12:54:392011系统架构师大会纪念章
日期:2015-09-16 12:54:392010系统架构师大会纪念
日期:2015-09-16 12:54:39秀才
日期:2015-12-25 15:31:10
41#
发表于 2014-6-30 14:37 | 只看该作者
7楼写的太牛了。

使用道具 举报

回复
论坛徽章:
3
马上有对象
日期:2014-06-12 16:32:07蓝色妖姬
日期:2014-08-28 15:17:25秀才
日期:2015-10-08 17:57:58
42#
发表于 2014-6-30 22:19 | 只看该作者

RE: 《大数据技术全解》有奖试读活动

1.大数据的存储有哪些问题。
    主要问题涉及,
           容量问题:大容量,PB、EB甚至ZB数据如何管理;如何管理文件系统层累积的元数据是一个难题;
           延迟问题:实时性问题,未来更多的应用需要支持快速的海量数据收集、分析、分享等,对时效性要求极高;
           安全问题:特别如金融行业都有自己的安全标准和保密性需求;
           成本问题:大数据4V特性,其中海量的数据总体价值高,但是价值密度低,而保存海量的数据,总体的成本也是高昂的;
           持久可用性问题:大数据中部分数据如客户交易数据等可能需要保存20年以上或者更久,数据一致性检测的功能以及其他保证长期高可用的特性;
           备份问题:一般采用大数据架构(如Hadoop),数据副本会有多个,这时候数据备份可能不需要按照传统的方法进行备份,需要将数据按照可再生、不可再生进行等分级管理;
           迁移问题:未来如果出现升级变迁,需要进行数据迁移,大数据的数据量级对该项工作会带来很大的麻烦;
2. 企业大数据如何加工?
在大数据时代,企业进行数据加工应该基于“全业务、全系统、全信息”指导思想,将数据作为企业核心资产,同时需要采用大数据思维、技术进行挖掘分析,主要的几个加工步骤
如盘后数据采集,可以考虑采用Flume进行非结构化数据收集、采用DataStage、Infomatic、Kettle等进行结构化数据采集;数据清洗工具:MR、Hive、Pig、存储过程、ETL工具等;
数据挖掘可以考虑Mahout、SPss、sass等,算法方面可以考虑如聚类、分类、决策树、统计分析等;另外就是可以考虑专业BI工具(cognos、BO等)、开源工具实现数据可视化;
soso。其实也不要让“大数据”搅乱了自己。建议各个企业在实施大数据项目时,立足企业自身的特定情况,量身定做自己的大数据方案,并且适当的考虑扩展性就可以了。比如,加入
你的企业未来10年估计只有10TB的数据量级,那么你可能根本不用太考虑存储的容量问题、成本问题、备份问题等。而在数据加工方面,可能在绝对数据量上和BAT相比是“小数据”,
但是你依旧可以充分利用大数据思维中的全样本、相关性等思想进行数据的加工和分析,面向有价值的针对性应用主题进行资源投入和开采,发挥真正意义上的大数据价值。     
3. 说说读完试读章节后您的感想。
看了几个章节,从大数据的基础技术,到系统的设计理论,进行了概括和总结;对于大数据实战的朋友快速投入实战具有比较大的指导意义,对于企业进行数据加工应该基于“全业务、全系统、全信息”指导思想十分赞同,但也深知要真正做到难度很大,目前正在进行大数据实践,希望能获得此书。谢谢。




使用道具 举报

回复
论坛徽章:
39
2014年世界杯参赛球队: 英格兰
日期:2014-06-13 14:40:022013数据库大会纪念章
日期:2015-03-18 10:16:212014数据库大会纪念章
日期:2015-03-18 10:16:21秀才
日期:2015-06-24 13:05:36秀才
日期:2015-07-30 16:18:26秀才
日期:2015-08-06 13:55:21秀才
日期:2015-08-13 13:38:45知识
日期:2015-08-13 14:08:10秀才
日期:2015-08-24 09:48:07秀才
日期:2015-09-10 17:13:35
43#
发表于 2014-7-2 21:58 | 只看该作者

收藏 拜读

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表