楼主: pipihappy8888

【话题讨论】当大数据遇到世界杯:预测不再是预测!(已公布奖项)

[复制链接]
论坛徽章:
151
授权会员
日期:2005-11-16 17:49:25世界杯纪念徽章
日期:2006-07-20 13:19:20ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44生肖徽章2007版:龙
日期:2008-11-25 11:15:28生肖徽章2007版:羊
日期:2009-06-02 18:18:38生肖徽章2007版:鼠
日期:2009-06-17 22:01:192010新春纪念徽章
日期:2010-03-01 11:04:582010年世界杯参赛球队:科特迪瓦
日期:2010-06-11 19:25:562010广州亚运会纪念徽章:网球
日期:2010-12-31 16:37:522010广州亚运会纪念徽章:藤球
日期:2011-01-02 15:47:20
11#
发表于 2014-7-10 22:52 | 只看该作者
1.当预测不再是预测的时候,我们是用“掷骰子”来碰运气,还是应该相信大数据?
要相信大数据,想办法利用好大数据

2.同为数据预测,为什么百度预测百发百中,而华尔街投行却错得离谱?到底预测模型中哪些因素最关键?
因素的范围边界、以及各因素的影响权重

3.大数据预测怎么才能从靠谱变得非常靠谱?数据越大就越靠谱吗?大数据与传统的方法该如何为互补?
靠谱一定要有足够的样本空间,样本选择不合理,即使数据越大也可能会失真。
传统的方法来建模,大数据用 验证和完善,毕竟大数据的获取也是有成本代价的,再说数据越多,就需要的计算资源更多,成本越高。

4.本届世界杯进入了白热化阶段,到底谁会夺冠?猜猜大结局。 ,
86老马胜了,90德国赢了,这次该梅西举杯吧。

使用道具 举报

回复
论坛徽章:
39
2014年世界杯参赛球队: 英格兰
日期:2014-06-13 14:40:022013数据库大会纪念章
日期:2015-03-18 10:16:212014数据库大会纪念章
日期:2015-03-18 10:16:21秀才
日期:2015-06-24 13:05:36秀才
日期:2015-07-30 16:18:26秀才
日期:2015-08-06 13:55:21秀才
日期:2015-08-13 13:38:45知识
日期:2015-08-13 14:08:10秀才
日期:2015-08-24 09:48:07秀才
日期:2015-09-10 17:13:35
12#
发表于 2014-7-10 23:20 | 只看该作者
1.当预测不再是预测的时候,我们是用“掷骰子”来碰运气,还是应该相信大数据?
  
      德国7:1 狂虐巴西,,之前有大数据分析,巴西的夺冠胜率为48.5%,德国只有11.4%.今天的结果是不是已经充分证明了这些大数据预测都是胡扯的。个人以为,这种大数据分析应用在生物、化学等纯科学领域应该是合适的 。如果有人参与的领域,大数据还是不适合的,因为人性,数据是无法预测的。所以我觉得还是应该相信大数据,但是一定要在合适的地方。


2.同为数据预测,为什么百度预测百发百中,而华尔街投行却错得离谱?到底预测模型中哪些因素最关键?

       百度预测世界杯的主要数据来源包括:百度搜索数据,球队基础数据,球员基础数据,赔率市场数据。百度大数据通过分析过去5年987支球队的3.7万场比赛数据,共涉及29610名球员,112,285,543条相关数据,构建了足球赛事预测模型。
为了验证模型是否准确,百度用2010年南非世界杯的淘汰赛数据进行了准确性验证,具体方法是为预测模型输入2010年世界杯期间的比赛、球队、球员等相关数据,由预测模型计算出淘汰赛比赛结果,与当时的比赛结果进行对比,结果显示16场淘汰赛算准了12场,准确率为75%。
     华尔街投行则是根据各个球队的FIFA排名、历史战绩、球员构成和赌球赔率等因素,建立了量化分析模型,并根据复杂计算得到一份夺冠概率表格。其中巴西名列第一,紧随其后的是德国、西班牙、法国。然后再根据某些假设,得出最终的冠军得主。这些假设就没有实际数据来的更加直接了。
       预测模型中个人感觉(1)数据质量。数据通常来自内部数据如客户交易数据和生产数据。你手里的数据越多,相关度和质量越高,你找出原因和结果的可能性越大。以及(2)数据分析模型最重要。。

3.大数据预测怎么才能从靠谱变得非常靠谱?数据越大就越靠谱吗?大数据与传统的方法该如何互补?

      提高数据质量,优化数据科学家审视数据,并围绕业务目标建立预测分析规则。选择优秀预测分析软件以及运营软件。如果你很幸运找到了合适的预测规则,下一步就是将规则植入你的应用。更重要的是将预测规则需要的数据事先准备好。
       数据越大使得预测从一定程度上会使预测更加靠谱一点,更加准确一点。但是也是有一个临界点的。。不可能数据越大越靠谱,毕竟数据挖掘伴随着数据量的增大难度也越大。
      面向大数据时代,传统数据库不完全适应,需要一些变革,需要在扩展性,需要在数据处理能力方面有一些新的变化。传统来说我们不是有数据分析,在大数据工具这块,技术层面我们讲一个新的工具,它是一个工具,不是大数据,不神秘,能够对文件、图片、文本,这类数据进行分布式的计算和处理,然后对结果进行合并,可以做到弹性扩展,分布式的计算架构,它和传统我们以数据库为核心的传统数据管理方法形成了互补的关系。

4.本届世界杯进入了白热化阶段,到底谁会夺冠?猜猜大结局。

        德国。。

使用道具 举报

回复
论坛徽章:
1
蛋疼蛋
日期:2012-05-02 22:31:18
13#
发表于 2014-7-10 23:37 | 只看该作者
这也叫大数据???

使用道具 举报

回复
论坛徽章:
484
ITPUB北京香山2007年会纪念徽章
日期:2007-01-24 14:35:02ITPUB北京九华山庄2008年会纪念徽章
日期:2008-01-21 16:50:24ITPUB北京2009年会纪念徽章
日期:2009-02-09 11:42:452010新春纪念徽章
日期:2010-03-01 11:04:552010数据库技术大会纪念徽章
日期:2010-05-13 10:04:272010系统架构师大会纪念
日期:2010-09-04 13:35:54ITPUB9周年纪念徽章
日期:2010-10-08 09:28:512011新春纪念徽章
日期:2011-02-18 11:43:32ITPUB十周年纪念徽章
日期:2011-11-01 16:19:412012新春纪念徽章
日期:2012-01-04 11:49:54
14#
发表于 2014-7-11 00:26 | 只看该作者
预测准是这样的
小组赛结束后,4096个ID去不同的贴吧发帖,贴出冠亚季军的名单
最终只要有一个中,便声称这是大数据,或者半仙之类的预测结果,哈哈
至于其他的预测,要么湮没,要么被删除,反正就是你怎么也看不到了

使用道具 举报

回复
论坛徽章:
407
紫蛋头
日期:2012-05-21 10:19:41迷宫蛋
日期:2012-06-06 16:02:49奥运会纪念徽章:足球
日期:2012-06-29 15:30:06奥运会纪念徽章:排球
日期:2012-07-10 21:24:24鲜花蛋
日期:2012-07-16 15:24:59奥运会纪念徽章:拳击
日期:2012-08-07 10:54:50奥运会纪念徽章:羽毛球
日期:2012-08-21 15:55:33奥运会纪念徽章:蹦床
日期:2012-08-21 21:09:51奥运会纪念徽章:篮球
日期:2012-08-24 10:29:11奥运会纪念徽章:体操
日期:2012-09-07 16:40:00
15#
发表于 2014-7-11 06:06 来自手机 | 只看该作者
足球飞行路线都算不出来

使用道具 举报

回复
论坛徽章:
571
NBA季后赛纪念徽章
日期:2012-06-25 12:19:11洛杉矶快船
日期:2014-06-16 11:45:27NBA常规赛纪念章
日期:2013-04-22 11:49:35NBA季后赛纪念徽章
日期:2011-06-13 11:34:51NBA常规赛纪念章
日期:2011-04-15 13:34:11NBA季后赛纪念徽章
日期:2013-06-21 14:52:05NBA常规赛纪念章
日期:2012-04-27 16:07:05生肖徽章:羊
日期:2014-08-15 14:12:01ITPUB9周年纪念徽章
日期:2016-10-28 17:00:11ITPUB9周年纪念徽章
日期:2016-10-28 17:00:11
16#
发表于 2014-7-11 09:27 | 只看该作者
1.当预测不再是预测的时候,我们是用“掷骰子”来碰运气,还是应该相信大数据?
相信大数据,必须的!

2.同为数据预测,为什么百度预测百发百中,而华尔街投行却错得离谱?到底预测模型中哪些因素最关键?
读盘操纵者的盘口。百度可以很容易地搜集到这些关系。

3.大数据预测怎么才能从靠谱变得非常靠谱?数据越大就越靠谱吗?大数据与传统的方法该如何互补?
大数据与读盘赔率相结合。

4.本届世界杯进入了白热化阶段,到底谁会夺冠?猜猜大结局。
德国

使用道具 举报

回复
论坛徽章:
6
2014年新春福章
日期:2014-02-18 16:49:31马上有钱
日期:2014-02-18 16:49:31itpub13周年纪念徽章
日期:2014-10-08 15:15:25itpub13周年纪念徽章
日期:2014-10-08 15:15:25喜羊羊
日期:2015-03-04 14:54:422015年新春福章
日期:2015-03-06 11:59:47
17#
发表于 2014-7-11 09:35 | 只看该作者
阿根廷,,

使用道具 举报

回复
论坛徽章:
0
18#
发表于 2014-7-11 09:36 | 只看该作者
大数据肯定是有科学道理的,但要考虑好心智模型。
冠军:阿根廷。。

使用道具 举报

回复
论坛徽章:
10
三菱
日期:2013-11-25 11:21:192014年世界杯参赛球队: 葡萄牙
日期:2014-08-05 11:33:52技术图书徽章
日期:2014-05-23 16:44:532014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082014年新春福章
日期:2014-04-14 09:54:082015年新春福章
日期:2015-04-08 13:44:17
19#
发表于 2014-7-11 09:39 | 只看该作者
1.当然还是相信大数据预测,更科学一些,但是我还是可以允许有偏差,因为只要牵扯到人变化的因素和不可预估的因素太多了,所以又偏差也是正常的。
2.应该是数据量,还有数据质量有差别,最核心的就是预测过程中的建模跟算法吧
3.我觉得随着大数据的应用越来越多,技术也就越来越成熟,从靠谱变的非常靠谱是件必然的事情。
   不能说数据越大就越靠谱,还要看数据的质量,还有估测过程中用到的策略算法。
   大数据和传统方法应该结合在一起,具体怎么结合这个不好说
4.德国

使用道具 举报

回复
论坛徽章:
651
生肖徽章:鼠
日期:2014-07-24 09:00:11生肖徽章2007版:鼠
日期:2009-03-19 21:39:41股神
日期:2012-09-29 10:14:59红钻
日期:2012-11-30 10:49:33至尊黑钻
日期:2019-01-19 11:43:58季节之章:秋
日期:2012-04-23 12:44:40季节之章:秋
日期:2012-01-05 14:00:54季节之章:冬
日期:2011-07-11 18:30:40季节之章:冬
日期:2012-05-20 13:22:14NBA季后赛大富翁
日期:2018-06-13 16:07:24
20#
发表于 2014-7-11 10:06 | 只看该作者
预测是否准要看模型的设置和参数的设定

冠军我猜是德国

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表