楼主: pipihappy8888

话题讨论:大数据是天使还是魔鬼?

[复制链接]
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
51#
 楼主| 发表于 2014-3-14 11:30 | 只看该作者
xinxihua_007 发表于 2014-3-14 11:27
这个话题牛,现在大数据 火得狠 。

好久不见啊!

使用道具 举报

回复
论坛徽章:
0
52#
发表于 2014-3-14 11:37 | 只看该作者
广告 和推荐系统通过大数据分析实现  还可以相信 但是反恐好像不大现实啊 期待专家说明啊

使用道具 举报

回复
论坛徽章:
11
ITPUB9周年纪念徽章
日期:2010-10-08 09:31:22秀才
日期:2016-01-21 13:42:39知识
日期:2015-06-02 15:04:49懒羊羊
日期:2015-03-18 09:28:52知识
日期:2015-03-10 11:54:022015年新春福章
日期:2015-03-06 11:57:31沸羊羊
日期:2015-03-04 14:43:43技术图书徽章
日期:2014-04-04 15:09:22ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:072010广州亚运会纪念徽章:高尔夫球
日期:2010-11-12 16:47:25
53#
发表于 2014-3-14 12:19 | 只看该作者
zhusw2013 发表于 2014-3-14 11:37
广告 和推荐系统通过大数据分析实现  还可以相信 但是反恐好像不大现实啊 期待专家说明啊

不是用大数据来反恐,只是一个辅助手段,至少可以分析人的一度、二度甚至多度朋友圈,至少可以看到你在和谁聊QQ,至少知道你都去过哪里,至少知道你的资金来源,很简单的说就是发现规律,发现例外。这些手段在美国大片里面就有,真正的反恐,估计不会有“专家”出来给我们什么说明的,多敏感啊。

使用道具 举报

回复
论坛徽章:
111
ITPUB9周年纪念徽章
日期:2010-10-08 09:34:03马上有房
日期:2014-02-18 16:42:02马上有车
日期:2014-03-20 10:09:22马上有钱
日期:2014-03-20 15:53:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11马上有钱
日期:2014-03-20 16:14:11马上有对象
日期:2014-03-20 16:14:11马上加薪
日期:2014-03-20 16:14:11技术图书徽章
日期:2014-03-27 09:30:56
54#
发表于 2014-3-14 12:27 | 只看该作者
大师级别的人讨论的很有深度,学习了,晚上再详细学习

使用道具 举报

回复
求职 : 数据库管理员
招聘 : Java研发
论坛徽章:
6402
娜美
日期:2021-10-12 20:11:36技术图书徽章
日期:2021-09-30 12:11:1120周年集字徽章-年	
日期:2021-09-30 12:12:5820周年集字徽章-20	
日期:2021-09-30 12:43:0619周年集字徽章-周
日期:2021-09-30 13:18:3120周年集字徽章-20	
日期:2021-09-30 16:44:1219周年集字徽章-周
日期:2021-09-30 17:01:04技术图书徽章
日期:2021-09-30 17:59:14技术图书徽章
日期:2021-10-06 10:36:4019周年集字徽章-19
日期:2021-10-06 14:43:24
55#
发表于 2014-3-14 13:25 | 只看该作者
华孙 发表于 2014-3-14 12:19
不是用大数据来反恐,只是一个辅助手段,至少可以分析人的一度、二度甚至多度朋友圈,至少可以看到你在和 ...

这种分析手法,会让你觉得自己的圈子全都暴漏了...
譬如腾讯推出的智能寻友,能让你找到多年失散的同学..
再者,也会暴露其他的朋友圈...

使用道具 举报

回复
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
56#
 楼主| 发表于 2014-3-14 13:56 | 只看该作者
华孙 发表于 2014-3-14 12:19
不是用大数据来反恐,只是一个辅助手段,至少可以分析人的一度、二度甚至多度朋友圈,至少可以看到你在和 ...

美国这么多年在用大数据反恐的例子不少啊!

使用道具 举报

回复
招聘 : Oracle 课程老师
论坛徽章:
48
19周年集字徽章-周
日期:2019-09-03 17:47:002011数据库大会纪念章
日期:2015-04-23 10:33:192010数据库技术大会纪念徽章
日期:2015-04-23 10:33:192014年世界杯参赛球队: 俄罗斯
日期:2014-07-17 17:21:42ITPUB伯乐
日期:2014-07-17 14:45:422014年世界杯参赛球队: 希腊
日期:2014-06-20 16:01:122014年世界杯参赛球队:克罗地亚
日期:2014-06-12 16:53:56马上加薪
日期:2014-04-25 14:18:13目光如炬
日期:2014-04-21 06:00:12马上有房
日期:2014-03-31 15:10:37
57#
发表于 2014-3-14 14:17 | 只看该作者
本帖最后由 leonarding 于 2014-3-14 18:02 编辑

木有数据质量,神马数据都是浮云。数据给自己用,还是给别人用,就好比是在家做几道家常菜还是开餐厅,后者对于口味质量要求更高,毕竟食客们眼睛都在盯着呢。大数据技术在数据采集方面采用了哪些新的方法?
答:这个问题由来已久,当下企业主们采用的方式是大小通吃术,怎么讲用一个示例来说明,联通的信令监测系统,需要采集一个省份全网的3G上网数据,往往这些数据中核心价值数据并不多,大多数的数据是一些非核心的日志信息。本着宁可错杀1000也不放过1个构思理念,所有数据统统采集过来,这就需要庞大的硬件集群支持,以至于后来随着数据量的猛增,硬件的预算却没有增上去,数据采集的不全面,分析出来的指标值依据度不高,这个项目采用的方法为 各地市部署n台采集机,数据集中汇总到省会大机房通过采集软件进行数据的汇总->入库->BI呈现。这种方法缺点末端采集的数据量呈指数增长给系统带来的灾难后果。后来在项目技术交流会上,我们提出现在缺的不是数据而是如何采集到高纯度的数据,从源端就把有用数据过滤出来,如想成功就需要更巧妙的算法,更贴近业务核心,知道哪些是想要的哪些是可以放下的,鱼和熊掌不可兼得,在我们后来的系统设计中把做的“专”提高到比做的“广”更高的层面上。

尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内在这一有价值的规律的。无论是优酷还是搜狐,我们或多或少总会看到一些还不错的相关视频推荐。马云曾经说过,“淘宝胜就胜在广告联盟”,电商的数据可以怎么“玩”?海量数据挖掘有哪些常用的技术?大数据的数据库相比于传统的数据库有何变化?
答:每家公司使用的大数据技术往往都不相同,这是由其不同行业的数据结构不同导致的,传统行业更喜欢一些成熟的,效果好,有保障的技术,例如 SAS精准分析   基于oracle数据仓库系统
     而互联网行业更倾向于开源、轻量级、有针对性的技术,例如 R模型分析  基于Hadoop数据仓库系统,因为这些公司的数据结构简单、业务关联性不强、海量->实现的功能更专项
     聊一个广告投放的case,总所周知苏宁易购一直把京东作为假想敌,超越京东是其奋斗的目标之一。但从两者在不同广告领域的投放效果来看,苏宁易购往往没有抓住潜在消费者的心,总在电视,户外广告上下功夫,如果可以利用其线下商城采集信息->做一做市场大数据分析,我想势必会对其有所帮助。

目前人们对大数据可以说是又爱又恨,爱的是它提供了诸多便利和新的发展机会,恨的是它有时候会带来网络欺诈、侵犯个人隐私等现象,比如近期“棱镜门”事件折射出来的是对大数据技术的担忧。近期301中国昆明发生的恐怖袭击、国人为之揪心的马航失联事件、堪比“9·11”的曼哈顿爆炸等一系列事件让我们不断反思,也许大数据能为我们做些什么?大数据到底是天使还是魔鬼,你怎么看?
答:关于大数据是否可以反恐,我不能在这里下一个定论,如果说中国有没有斯诺登说的那种机构,答案是肯定的,因为有朋友在相关机构工作。5年前我们没有微博、没有微信、没有来往、没有LINKED IN等。如果想知道一个人的生活轨迹还是需要费一番周折的。可是现在呢,大家的生活是否会因为这些的出现而变化呢,我想答案是毋容置疑的。想想你每天可以在微博上了解周围人的最新动态、位置、正在干什么,在朋友圈中了解自己朋友的生活轨迹,想一想这5年里信息量出现了爆发式的喷井。某某大学的一个云计算实验室已经开展了“使用大数据来勾勒出整个贩毒网络的架构体系”的项目(据说获得了国家5000w经费)。我想大数据现阶段只能作为一种参考or辅助的手段,而还不能真正防止恐怖事件发生。现在国家已经逐步完善监控体系,只不过它没有说出来,你们懂得!




使用道具 举报

回复
论坛徽章:
11
ITPUB9周年纪念徽章
日期:2010-10-08 09:31:22秀才
日期:2016-01-21 13:42:39知识
日期:2015-06-02 15:04:49懒羊羊
日期:2015-03-18 09:28:52知识
日期:2015-03-10 11:54:022015年新春福章
日期:2015-03-06 11:57:31沸羊羊
日期:2015-03-04 14:43:43技术图书徽章
日期:2014-04-04 15:09:22ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:072010广州亚运会纪念徽章:高尔夫球
日期:2010-11-12 16:47:25
58#
发表于 2014-3-14 14:22 | 只看该作者
2009532140 发表于 2014-3-14 13:25
这种分析手法,会让你觉得自己的圈子全都暴漏了...
譬如腾讯推出的智能寻友,能让你找到多年失散的同学. ...

呵呵,你别介意我要说的话:“你以为呢!”。

斯诺登的事情不是假的,国家为了稳定,为了反恐,这些工作是必须的。只不过我们的数据早就筛除在外,真要想了解你,你就是个赤裸裸的人,一点隐私都不会有。你和老婆的每一句QQ上的甜言蜜语,你所在的位置,甚至是你手机上的通讯录,只要想知道,就很容易获得。

我们谈论得比较多的是企业的数据如何发挥价值,或者两个行业的数据融合在一起是否能有更大的价值。就像海关是有缉私职能的,单单看海关的数据是看不出太多这类行为的,但要是把税务的数据和银行的数据加上可就看的很清楚了。

再就是看数据能否为老百姓服务,你愿意把你自己的数据让运营商去出售么?肯定是不。是因为你已经觉得垃圾短消息和垃圾电话够多了,但如果运营商或其他企业推送给你的短消息恰恰是你现在很需要的,也就无所谓了吧,我认为这确实是可以实现的,就看国家能不能在20年内把相关法律推出来了。呵呵

使用道具 举报

回复
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
59#
 楼主| 发表于 2014-3-14 14:28 | 只看该作者
leonarding 发表于 2014-3-14 14:17
1.木有数据质量,神马数据都是浮云。数据给自己用,还是给别人用,就好比是在家做几道家常菜还是开餐厅,后 ...

专家结合自己的体验肺腑之言,相比于广度,数据采集更注重纯度的价值。

使用道具 举报

回复
招聘 : Oracle 课程老师
论坛徽章:
48
19周年集字徽章-周
日期:2019-09-03 17:47:002011数据库大会纪念章
日期:2015-04-23 10:33:192010数据库技术大会纪念徽章
日期:2015-04-23 10:33:192014年世界杯参赛球队: 俄罗斯
日期:2014-07-17 17:21:42ITPUB伯乐
日期:2014-07-17 14:45:422014年世界杯参赛球队: 希腊
日期:2014-06-20 16:01:122014年世界杯参赛球队:克罗地亚
日期:2014-06-12 16:53:56马上加薪
日期:2014-04-25 14:18:13目光如炬
日期:2014-04-21 06:00:12马上有房
日期:2014-03-31 15:10:37
60#
发表于 2014-3-14 14:38 | 只看该作者
2.尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内在这一有价值的规律的。无论是优酷还是搜狐,我们或多或少总会看到一些还不错的相关视频推荐。马云曾经说过,“淘宝胜就胜在广告联盟”,电商的数据可以怎么“玩”?海量数据挖掘有哪些常用的技术?大数据的数据库相比于传统的数据库有何变化?
答:每家公司使用的大数据技术往往都不相同,这是由其不同行业的数据结构不同导致的,传统行业更喜欢一些成熟的,效果好,有保障的技术,例如 SAS精准分析   基于oracle数据仓库系统
     而互联网行业更倾向于开源、轻量级、有针对性的技术,例如 R模型分析  基于Hadoop数据仓库系统,因为这些公司的数据结构简单、业务关联性不强、海量->实现的功能更专项
     聊一个广告投放的case,总所周知苏宁易购一直把京东作为假想敌,超越京东是其奋斗的目标之一。但从两者在不同广告领域的投放效果来看,苏宁易购往往没有抓住潜在消费者的心,总在电视,户外广告上下功夫,如果可以利用其线下商城采集信息->做一做市场大数据分析,我想势必会对其有所帮助。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表