12
返回列表 发新帖
楼主: xiaojiang520033

[原创] 面对大数据时代的到来,传统BI从业者如何应对?

[复制链接]
论坛徽章:
1
奥运纪念徽章
日期:2013-07-18 13:55:12
11#
发表于 2013-5-9 10:25 | 只看该作者
顶楼上一下  非常赞同楼上的观点

使用道具 举报

回复
论坛徽章:
2
2012新春纪念徽章
日期:2012-01-04 11:54:46ITPUB 11周年纪念徽章
日期:2012-10-09 18:09:19
12#
发表于 2013-5-20 11:23 | 只看该作者
wangfans 发表于 2013-5-8 16:28
在这个大数据概念热得发烫的时代,各种挂着羊头买狗肉的忽悠者真是不少。

大数据的本质其实还是BI,还是 ...

稀疏存储读取?数据随机分布,造成存储上的稀疏?
不理解,能具体说一下吗?

使用道具 举报

回复
论坛徽章:
66
现任管理团队成员
日期:2011-05-07 01:45:08版主9段
日期:2013-04-21 02:21:02ITPUB年度最佳版主
日期:2014-02-19 10:05:27ITPUB年度最佳版主
日期:2013-01-30 17:30:25ITPUB年度最佳技术原创精华奖
日期:2012-03-13 17:12:05优秀写手
日期:2013-12-18 09:29:15元宝章
日期:2015-02-10 19:57:54金牌徽章
日期:2015-02-10 19:59:42银牌徽章
日期:2015-02-10 19:59:42铜牌徽章
日期:2015-02-10 19:59:41
13#
发表于 2013-5-20 12:48 | 只看该作者
xdw8933 发表于 2013-5-20 11:23
稀疏存储读取?数据随机分布,造成存储上的稀疏?
不理解,能具体说一下吗?

关系型数据库容易造成存储稀疏,最简单的例子就是

key, null,null,null,null,null,null,。。。。。

比方说有上亿条记录,只有一万条记录null直位置全有value,其余的都没有,但是这个null值一般在关系型数据库里面占有空间的。

读取的时候同理,全表扫面也要全扫一遍。

使用道具 举报

回复
论坛徽章:
66
现任管理团队成员
日期:2011-05-07 01:45:08版主9段
日期:2013-04-21 02:21:02ITPUB年度最佳版主
日期:2014-02-19 10:05:27ITPUB年度最佳版主
日期:2013-01-30 17:30:25ITPUB年度最佳技术原创精华奖
日期:2012-03-13 17:12:05优秀写手
日期:2013-12-18 09:29:15元宝章
日期:2015-02-10 19:57:54金牌徽章
日期:2015-02-10 19:59:42银牌徽章
日期:2015-02-10 19:59:42铜牌徽章
日期:2015-02-10 19:59:41
14#
发表于 2013-5-20 12:48 | 只看该作者
当然我这是举的比较极端的情况

使用道具 举报

回复
招聘 : Java研发
论坛徽章:
114
SQL数据库编程大师
日期:2013-12-06 13:59:43萤石
日期:2013-12-06 15:50:21ITPUB元老
日期:2007-09-25 17:05:532011数据库大会纪念章
日期:2015-04-23 10:33:192010数据库技术大会纪念徽章
日期:2015-04-23 10:33:19喜羊羊
日期:2015-03-24 13:02:282015年新春福章
日期:2015-03-06 11:57:31喜羊羊
日期:2015-03-04 14:49:39马上有房
日期:2015-01-22 17:30:45马上加薪
日期:2014-12-25 08:48:51
15#
发表于 2013-5-20 19:41 | 只看该作者
wangfans 发表于 2013-5-20 12:48
关系型数据库容易造成存储稀疏,最简单的例子就是

key, null,null,null,null,null,null,。。。。 ...

这个,不是你想的这样,至少oracle不是这样,后面全空是不占空间的,
我到是觉得,关系型数据库的发展是建立在文本处理不方便的基础之上的,不是说现在的堆机器就是能解决一切,想想我们现在的一系统,都二十多年了,底层还都是用C++自己实现的,感觉,到了现在还符合潮流了,我感觉是,没有落伍的技术,关键是用在合适的地方

使用道具 举报

回复
论坛徽章:
66
现任管理团队成员
日期:2011-05-07 01:45:08版主9段
日期:2013-04-21 02:21:02ITPUB年度最佳版主
日期:2014-02-19 10:05:27ITPUB年度最佳版主
日期:2013-01-30 17:30:25ITPUB年度最佳技术原创精华奖
日期:2012-03-13 17:12:05优秀写手
日期:2013-12-18 09:29:15元宝章
日期:2015-02-10 19:57:54金牌徽章
日期:2015-02-10 19:59:42银牌徽章
日期:2015-02-10 19:59:42铜牌徽章
日期:2015-02-10 19:59:41
16#
发表于 2013-5-20 21:56 | 只看该作者
piliskys 发表于 2013-5-20 19:41
这个,不是你想的这样,至少oracle不是这样,后面全空是不占空间的,
我到是觉得,关系型数据库的发展是 ...

key, null,null,null,null,null,null,。。。。。value, value

。。。。。。省略号连value也省略了,你看懂了吗?

使用道具 举报

回复
论坛徽章:
66
现任管理团队成员
日期:2011-05-07 01:45:08版主9段
日期:2013-04-21 02:21:02ITPUB年度最佳版主
日期:2014-02-19 10:05:27ITPUB年度最佳版主
日期:2013-01-30 17:30:25ITPUB年度最佳技术原创精华奖
日期:2012-03-13 17:12:05优秀写手
日期:2013-12-18 09:29:15元宝章
日期:2015-02-10 19:57:54金牌徽章
日期:2015-02-10 19:59:42银牌徽章
日期:2015-02-10 19:59:42铜牌徽章
日期:2015-02-10 19:59:41
17#
发表于 2013-5-20 22:11 | 只看该作者
Oracle是哪样的? 几年前做过实验,专门dump Oracle的block查看过,null 确实是占空间的。


使用道具 举报

回复
求职 : 数据分析/ETL
论坛徽章:
0
18#
发表于 2013-8-30 15:12 | 只看该作者
别被大数据的概念所迷惑,都是表面现象。玩数据的就是玩数据的,多与少就是量的概念,不同的数据量用不同的技术与适应,可数据还是该整合的整合,该抽取的抽取。

使用道具 举报

回复
论坛徽章:
0
19#
发表于 2013-9-5 09:13 | 只看该作者
本帖最后由 callmecen 于 2013-9-5 09:14 编辑

传统BI针对结构化数据,大数据中包括了结构化数据与非结构化数据,BI能否深层的去挖掘非结构化数据内部的价值?包括图片、视频、音频等等,这个是连google、Amazon等巨头都做不到的,归根结底BI在大数据中的价值主要还是针对其中的结构化数据,因此BI的方法在大数据中一样适用,我们需要做的是如何对大数据做清洗,把其中的结构化数据价值挖掘出来。当然了,如果能尽量挖掘非结构化的数据那将是另外一片蓝海了。个人愚见,请大家批评指正。

使用道具 举报

回复
论坛徽章:
3
优秀写手
日期:2013-12-27 06:00:122014年新春福章
日期:2014-02-18 16:43:09马上有钱
日期:2014-02-18 16:43:09
20#
发表于 2014-4-3 16:47 | 只看该作者
这里讲的大数据:分布式数据库

至于图片、声音、视频等非标准格式的数据存储与应用,确实是一片蓝海的感觉~

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表