楼主: arron刘

【话题讨论】驾驭大数据 大数据时代话题讨论

[复制链接]
论坛徽章:
57
SQL极客
日期:2013-12-09 14:13:35秀才
日期:2016-01-21 13:42:39秀才
日期:2016-01-13 12:14:26SQL大赛参与纪念
日期:2016-01-13 10:32:19SQL数据库编程大师
日期:2016-01-13 10:30:43秀才
日期:2015-12-14 14:47:54秀才
日期:2015-10-19 15:50:392015年新春福章
日期:2015-03-06 11:58:18懒羊羊
日期:2015-03-04 14:52:11优秀写手
日期:2014-11-08 06:00:14
11#
发表于 2013-4-25 20:41 | 只看该作者
新式的有r语言

使用道具 举报

回复
论坛徽章:
57
SQL极客
日期:2013-12-09 14:13:35秀才
日期:2016-01-21 13:42:39秀才
日期:2016-01-13 12:14:26SQL大赛参与纪念
日期:2016-01-13 10:32:19SQL数据库编程大师
日期:2016-01-13 10:30:43秀才
日期:2015-12-14 14:47:54秀才
日期:2015-10-19 15:50:392015年新春福章
日期:2015-03-06 11:58:18懒羊羊
日期:2015-03-04 14:52:11优秀写手
日期:2014-11-08 06:00:14
12#
发表于 2013-4-25 20:41 | 只看该作者
还有hadoop

使用道具 举报

回复
论坛徽章:
57
SQL极客
日期:2013-12-09 14:13:35秀才
日期:2016-01-21 13:42:39秀才
日期:2016-01-13 12:14:26SQL大赛参与纪念
日期:2016-01-13 10:32:19SQL数据库编程大师
日期:2016-01-13 10:30:43秀才
日期:2015-12-14 14:47:54秀才
日期:2015-10-19 15:50:392015年新春福章
日期:2015-03-06 11:58:18懒羊羊
日期:2015-03-04 14:52:11优秀写手
日期:2014-11-08 06:00:14
13#
发表于 2013-4-25 20:43 | 只看该作者
sas在数据集很大的情形下也不行了

使用道具 举报

回复
论坛徽章:
57
SQL极客
日期:2013-12-09 14:13:35秀才
日期:2016-01-21 13:42:39秀才
日期:2016-01-13 12:14:26SQL大赛参与纪念
日期:2016-01-13 10:32:19SQL数据库编程大师
日期:2016-01-13 10:30:43秀才
日期:2015-12-14 14:47:54秀才
日期:2015-10-19 15:50:392015年新春福章
日期:2015-03-06 11:58:18懒羊羊
日期:2015-03-04 14:52:11优秀写手
日期:2014-11-08 06:00:14
14#
发表于 2013-4-25 20:46 | 只看该作者
目前考虑hadoop+mathout,
我建议是hadoop+r语言,
但是同事说r语言计算需要数据在内存中计算,所以不可靠,
hadoop+r语言真的不行吗?

使用道具 举报

回复
论坛徽章:
109
ITPUB9周年纪念徽章
日期:2010-10-08 09:31:21ITPUB十周年纪念徽章
日期:2011-11-01 16:19:41ITPUB 11周年纪念徽章
日期:2012-09-28 17:34:422012新春纪念徽章
日期:2012-02-07 09:59:352013年新春福章
日期:2013-02-25 14:51:24ITPUB年度最佳技术原创精华奖
日期:2012-03-13 17:12:05现任管理团队成员
日期:2012-01-16 14:02:09版主3段
日期:2012-06-07 02:21:02蓝锆石
日期:2012-01-04 17:06:48萤石
日期:2012-01-04 17:06:48
15#
发表于 2013-4-26 08:38 | 只看该作者
支持!

1、大数据时代未来是否会成为一个信息泡沫的时代?
大数据是信息发展的趋势,与会不会成为信息泡沫没有直接的因果联系,如果管理得好,就不会。就好像说,汽车多了会不会造成塞车一样,答案当然是不一定。

2、在海量的数据面前,我们有哪些工具可以使用,处理这些数据?
在大数据时代当然需要有力的工具来进行管理,现在很多企业都在研发这类产品,拭目以待!

使用道具 举报

回复
论坛徽章:
171
ITPUB社区OCM联盟徽章
日期:2013-07-30 11:25:46最佳人气徽章
日期:2013-03-19 17:13:45ITPUB年度最佳技术原创精华奖
日期:2013-03-22 13:18:30ITPUB季度 技术新星
日期:2012-05-22 15:10:11BLOG每日发帖之星
日期:2012-02-15 16:43:07生肖徽章2007版:马
日期:2012-03-07 10:13:26蓝锆石
日期:2012-02-24 10:13:15萤石
日期:2012-02-24 10:13:15海蓝宝石
日期:2012-02-24 10:13:15紫水晶
日期:2012-03-01 21:28:36
16#
发表于 2013-4-26 14:23 | 只看该作者
大数据觉得是一个必然趋势,只是时间问题

相信这几年新的工具将层次不穷!因为有需求所以又创造,现在需求还不明朗,所以摸索的比较多

使用道具 举报

回复
招聘 : 多个岗位招聘
论坛徽章:
33
2010广州亚运会纪念徽章:跆拳道
日期:2010-11-22 15:42:39灰彻蛋
日期:2012-05-16 13:17:56参与WIN7挑战赛纪念
日期:2012-05-24 10:37:35茶鸡蛋
日期:2012-05-28 17:27:32灰彻蛋
日期:2012-06-13 18:48:14双黄蛋
日期:2012-06-14 14:32:02奥运会纪念徽章:帆船
日期:2012-07-10 09:43:29奥运会纪念徽章:足球
日期:2012-08-17 09:17:32奥运会纪念徽章:帆船
日期:2012-07-26 15:46:49奥运会纪念徽章:赛艇
日期:2012-08-20 16:23:58
17#
发表于 2013-4-27 10:02 | 只看该作者
本期讨论话题:
1、大数据时代未来是否会成为一个信息泡沫的时代?
     这是必然的,越来越多的数据,越来越多的信息。这么多信息如何筛选,哪些有用。肯定是有泡沫的。
2、在海量的数据面前,我们有哪些工具可以使用,处理这些数据?
     一般工具的就是ETL之类的。处理这些数据需要业务知识,从大量的信息中,根据规则抽取数据,供信息系统使用~

使用道具 举报

回复
论坛徽章:
25
奥运会纪念徽章:射击
日期:2013-01-28 09:12:182014年新春福章
日期:2014-02-18 16:41:11马上有车
日期:2014-02-18 16:41:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11马上有钱
日期:2014-03-20 16:14:11马上有对象
日期:2014-03-20 16:14:11马上加薪
日期:2014-03-20 16:14:11喜羊羊
日期:2015-04-09 18:46:34秀才
日期:2016-03-24 09:20:52
18#
发表于 2013-4-27 12:54 | 只看该作者
的确,大数据时代已经很近了。最近很热,公司也涉及到了大数据量的东西,怎么优化,怎么存储,都在考虑怎么做。
我想是不是应该在数据量小的时候就把有用的数据分析出来,而不是等到数据已经很大了才去做分析和挖掘呢?

使用道具 举报

回复
论坛徽章:
7
2012新春纪念徽章
日期:2012-01-04 11:58:44ITPUB 11周年纪念徽章
日期:2012-10-09 18:16:00双黄蛋
日期:2013-01-10 11:07:542013年新春福章
日期:2013-02-25 14:51:242015年新春福章
日期:2015-03-04 14:53:162015年新春福章
日期:2015-03-06 11:58:39喜羊羊
日期:2015-03-16 11:00:26
19#
发表于 2013-4-27 14:47 | 只看该作者
个人见解 大数据就是通过对数据的一些规律,来发现整个事物的运行情况,这种数据就越多发现的规律越准确。
目前 Hadoop,Nosql等存储大数据,

使用道具 举报

回复
论坛徽章:
68
林肯
日期:2013-09-12 15:57:33马自达
日期:2013-10-11 13:52:31路虎
日期:2014-01-26 14:35:49现代
日期:2013-08-29 14:39:50三菱
日期:2013-11-25 11:21:19雪佛兰
日期:2013-09-12 15:55:00一汽
日期:2013-11-28 14:15:05技术图书徽章
日期:2013-12-11 10:11:35技术图书徽章
日期:2013-12-11 10:10:51技术图书徽章
日期:2014-01-14 10:54:13
20#
发表于 2013-4-27 16:19 | 只看该作者
1、大数据时代未来是否会成为一个信息泡沫的时代?

以前大数据的特点值是 "3V特性",现在变成了"4V特性", 增加了"Veracity" ~~ 真实性!

大数据技术就是从具有"4V特性" 的 "结构化(半结构化)、非结构化" 海量数据中
, 快速获得有价值信息的能力, 通过"发掘和探索" 来获得新的洞察 (Insight ~~ 这个词现在很流行 ~~ )

特别适用于:日志处理、并行计算、ETL( 其实就是大家常说的MapReduce)、机器学习、社交媒体等

至于"信息泡沫",我觉得大数据是去从庞大而多样信息中发掘和探索,这样的数据从本身来讲,
"独立的、少量的"是毫无用处的,无法发现有用的信息。
同样的采用传统的数据处理、存储、查询的方法是很难处理这样的数据。

大数据技术正是为了去除"泡沫",发现有用的信息,特别像用最原始的方法 "淘金" 一样,
要不断的清洗、过滤掉海量的泥沙,才能发现米粒大的"真金" !

/******************************************************************************/
2、在海量的数据面前,我们有哪些工具可以使用,处理这些数据?

我推荐 IBM Infosphere 家族中的大数据平台: Infosphere Biginsight , Infosphere Streams

Infosphere Biginsight 静态海量数据存储与分析平台

基于开源 Apache Hadoop的框架实现, 在此框架上增加了IBM独
特的技术优势,如管理能力、工作流、安全管理,并融入了IBM研究实验
室的独特和领先的数据分析、机器学习技术以及文本数据分析挖掘
特点:
1、性能更好的GPFS-SNC 文件系统、IBM LZO compression 压缩技术、
2、开放性的接口和集成能力(特别是与IBM 本身产品的集成 如 CONGOS BI, SPSS)
3、企业级的高可用、高可靠性、可扩展性
   
Infosphere Streams 大数据的实时分析平台

实时分析极端大量的结构化和非结构化数据 , 高性能、并行流计算软件平
台,毫秒级数据响应级别实现"流计算"

与Infosphere Biginsight 进行集成,实现 "沉淀的数据和流动数据的无缝集成"

/******************************************************************************/

另外,大数据技术应用只是其中的一个方面,对于一个整体的解决方案,还需要其他的ETL工具(Infosphere  Information Server)
BI 等工具集成在一起,实现真正的大数据中心

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表