楼主: pipihappy8888

话题讨论:大数据是天使还是魔鬼?

[复制链接]
求职 : 数据库管理员
论坛徽章:
45
2011新春纪念徽章
日期:2011-02-18 11:43:322014年新春福章
日期:2014-04-14 09:54:08马上有对象
日期:2014-03-20 10:10:18马上有房
日期:2014-02-18 16:42:022014年新春福章
日期:2014-02-18 16:42:02技术图书徽章
日期:2014-01-24 10:11:16兰博基尼
日期:2013-12-11 10:38:11ITPUB社区12周年站庆徽章
日期:2013-11-07 10:34:33ITPUB社区12周年站庆徽章
日期:2013-10-17 13:56:592014年新春福章
日期:2014-04-14 09:54:08
11#
发表于 2014-3-13 16:47 | 只看该作者
支持一下吧,现在还没有真正从事大数据分析研究,还在数据的积累阶段啊

使用道具 举报

回复
论坛徽章:
11
ITPUB9周年纪念徽章
日期:2010-10-08 09:31:22秀才
日期:2016-01-21 13:42:39知识
日期:2015-06-02 15:04:49懒羊羊
日期:2015-03-18 09:28:52知识
日期:2015-03-10 11:54:022015年新春福章
日期:2015-03-06 11:57:31沸羊羊
日期:2015-03-04 14:43:43技术图书徽章
日期:2014-04-04 15:09:22ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:072010广州亚运会纪念徽章:高尔夫球
日期:2010-11-12 16:47:25
12#
发表于 2014-3-13 17:28 | 只看该作者
pipihappy8888 发表于 2014-3-13 16:27
老美在反恐方面利用大数据做的不错,但这次也没防住,可惜啦!

是啊,我们还没能做到像帕兰蒂尔那样牛,不过我们的行为计算团队也在研究

使用道具 举报

回复
论坛徽章:
11
ITPUB9周年纪念徽章
日期:2010-10-08 09:31:22秀才
日期:2016-01-21 13:42:39知识
日期:2015-06-02 15:04:49懒羊羊
日期:2015-03-18 09:28:52知识
日期:2015-03-10 11:54:022015年新春福章
日期:2015-03-06 11:57:31沸羊羊
日期:2015-03-04 14:43:43技术图书徽章
日期:2014-04-04 15:09:22ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:072010广州亚运会纪念徽章:高尔夫球
日期:2010-11-12 16:47:25
13#
发表于 2014-3-13 17:30 | 只看该作者
2009532140 发表于 2014-3-13 16:42
老师分析的不错

呦!!!呦呦呦!!!别,老师可不敢当,也就是感兴趣,工作中经常琢磨。

使用道具 举报

回复
论坛徽章:
11
ITPUB9周年纪念徽章
日期:2010-10-08 09:31:22秀才
日期:2016-01-21 13:42:39知识
日期:2015-06-02 15:04:49懒羊羊
日期:2015-03-18 09:28:52知识
日期:2015-03-10 11:54:022015年新春福章
日期:2015-03-06 11:57:31沸羊羊
日期:2015-03-04 14:43:43技术图书徽章
日期:2014-04-04 15:09:22ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:072010广州亚运会纪念徽章:高尔夫球
日期:2010-11-12 16:47:25
14#
发表于 2014-3-13 17:35 | 只看该作者
super_sky 发表于 2014-3-13 16:47
支持一下吧,现在还没有真正从事大数据分析研究,还在数据的积累阶段啊

不过,有办法获取互联网数据呀,爬虫嘛。如果能融合在一起,会给你极大的提速。大数据中的价值非常稀疏,如果在低速积累数据,可能会耽误很多时间。移动公司的GPRS数据,一个省一天1TB,攒60天可以看到很多金矿,但并不是说一天的数据就没有价值。

使用道具 举报

回复
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
15#
 楼主| 发表于 2014-3-13 17:43 | 只看该作者
华孙 发表于 2014-3-13 17:35
不过,有办法获取互联网数据呀,爬虫嘛。如果能融合在一起,会给你极大的提速。大数据中的价值非常稀疏, ...

怎么淘到有价值的数据可能是关键。

使用道具 举报

回复
求职 : 数据库管理员
招聘 : Java研发
论坛徽章:
6402
娜美
日期:2021-10-12 20:11:36技术图书徽章
日期:2021-09-30 12:11:1120周年集字徽章-年	
日期:2021-09-30 12:12:5820周年集字徽章-20	
日期:2021-09-30 12:43:0619周年集字徽章-周
日期:2021-09-30 13:18:3120周年集字徽章-20	
日期:2021-09-30 16:44:1219周年集字徽章-周
日期:2021-09-30 17:01:04技术图书徽章
日期:2021-09-30 17:59:14技术图书徽章
日期:2021-10-06 10:36:4019周年集字徽章-19
日期:2021-10-06 14:43:24
16#
发表于 2014-3-13 17:49 | 只看该作者
pipihappy8888 发表于 2014-3-13 17:43
怎么淘到有价值的数据可能是关键。

如何判断某个数据是否有价值更是关键

使用道具 举报

回复
论坛徽章:
11
ITPUB9周年纪念徽章
日期:2010-10-08 09:31:22秀才
日期:2016-01-21 13:42:39知识
日期:2015-06-02 15:04:49懒羊羊
日期:2015-03-18 09:28:52知识
日期:2015-03-10 11:54:022015年新春福章
日期:2015-03-06 11:57:31沸羊羊
日期:2015-03-04 14:43:43技术图书徽章
日期:2014-04-04 15:09:22ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:072010广州亚运会纪念徽章:高尔夫球
日期:2010-11-12 16:47:25
17#
发表于 2014-3-13 17:57 | 只看该作者
2009532140 发表于 2014-3-13 17:49
如何判断某个数据是否有价值更是关键

我觉得无法直接能判断出来,否则就不是数据挖掘了,很多时候我们是在做发现的工作,最开始根本就不知道运营商CDR话单跑pagerank算法,排在最前面的居然都是被标注多次的垃圾电话号码。

使用道具 举报

回复
论坛徽章:
11
奥运纪念徽章
日期:2012-11-28 09:37:30马上加薪
日期:2014-03-20 16:14:11马上有对象
日期:2014-03-20 16:14:11马上有钱
日期:2014-03-20 16:14:11马上有房
日期:2014-03-20 16:14:11马上有车
日期:2014-03-20 16:13:24ITPUB社区12周年站庆徽章
日期:2013-10-17 13:56:39ITPUB社区12周年站庆徽章
日期:2013-10-08 17:44:422013年新春福章
日期:2013-02-25 14:51:24ITPUB官方微博粉丝徽章
日期:2012-12-11 17:06:47
18#
发表于 2014-3-13 21:20 | 只看该作者
看了不少大数据方面的书还有资料
但真正想学以致用时却发现要么数据不够大  要么没什么价值  要么技术不够挖掘不出什么来
公司有几个T的交易数据,就只出了几个报表给领导看看,哎..................

使用道具 举报

回复
论坛徽章:
57
SQL极客
日期:2013-12-09 14:13:35秀才
日期:2016-01-21 13:42:39秀才
日期:2016-01-13 12:14:26SQL大赛参与纪念
日期:2016-01-13 10:32:19SQL数据库编程大师
日期:2016-01-13 10:30:43秀才
日期:2015-12-14 14:47:54秀才
日期:2015-10-19 15:50:392015年新春福章
日期:2015-03-06 11:58:18懒羊羊
日期:2015-03-04 14:52:11优秀写手
日期:2014-11-08 06:00:14
19#
发表于 2014-3-13 21:45 | 只看该作者
目前比较多的是ods,数据仓库,再加bi,bi大多是报表,
bi要的是体现业务逻辑,即数据准确,就像一把无形尺子丈量所有业务指标。

使用道具 举报

回复
论坛徽章:
57
SQL极客
日期:2013-12-09 14:13:35秀才
日期:2016-01-21 13:42:39秀才
日期:2016-01-13 12:14:26SQL大赛参与纪念
日期:2016-01-13 10:32:19SQL数据库编程大师
日期:2016-01-13 10:30:43秀才
日期:2015-12-14 14:47:54秀才
日期:2015-10-19 15:50:392015年新春福章
日期:2015-03-06 11:58:18懒羊羊
日期:2015-03-04 14:52:11优秀写手
日期:2014-11-08 06:00:14
20#
发表于 2014-3-13 21:49 | 只看该作者
xgghxkhuang 发表于 2014-3-13 21:45
目前比较多的是ods,数据仓库,再加bi,bi大多是报表,
bi要的是体现业务逻辑,即数据准确,就像一把无形尺 ...

数据仓库对应的有数据集市,建模设计,好的模型是数据冗余与性能的折中。
然后就是物理设计,有td,gp,或hadoop,
oracle不太适合数据仓库

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表