楼主: wangfans

[精华] 【有奖讨论一期】Hadoop VS Teradata

[复制链接]
论坛徽章:
73
2012新春纪念徽章
日期:2012-01-04 11:53:54ITPUB十周年纪念徽章
日期:2011-11-01 16:23:26罗罗诺亚·索隆
日期:2018-01-15 10:38:58马上加薪
日期:2015-01-15 12:21:00马上有钱
日期:2014-10-29 11:31:05青年奥林匹克运动会-手球
日期:2014-09-18 15:25:49马上有对象
日期:2014-07-29 13:47:20马上有房
日期:2014-05-10 18:42:23马上有钱
日期:2014-05-04 12:37:42马上有钱
日期:2014-03-03 12:33:19
21#
发表于 2011-12-20 13:09 | 只看该作者
扑通

使用道具 举报

回复
论坛徽章:
176
现任管理团队成员
日期:2011-05-07 01:45:08版主7段
日期:2012-07-05 02:21:03ITPUB长老会成员
日期:2015-05-07 15:11:10ITPUB年度最佳版主
日期:2011-04-08 18:37:09ITPUB年度最佳版主
日期:2011-12-28 15:24:18ITPUB牛人
日期:2010-10-25 12:41:322010数据库技术大会纪念徽章
日期:2015-04-23 10:33:192011数据库大会纪念章
日期:2015-04-23 10:33:192012数据库大会纪念章
日期:2015-04-23 10:33:192013数据库大会纪念章
日期:2015-04-23 10:33:19
22#
发表于 2011-12-20 13:13 | 只看该作者
本帖最后由 wangkxxe 于 2011-12-20 13:15 编辑

粉丝去把TD bynet专利搞出来啊

1024吧,好像这么个说法,具体多少个节点上限偶不是很清楚,但是每个节点下面有N多AMP,不过谁舍得上那么多呢
根据自己的情况定数据库方案,然后再根据情况定数据方案,用teradata存储n年都不看一眼的数据,岂不是太浪费啊

使用道具 举报

回复
论坛徽章:
176
现任管理团队成员
日期:2011-05-07 01:45:08版主7段
日期:2012-07-05 02:21:03ITPUB长老会成员
日期:2015-05-07 15:11:10ITPUB年度最佳版主
日期:2011-04-08 18:37:09ITPUB年度最佳版主
日期:2011-12-28 15:24:18ITPUB牛人
日期:2010-10-25 12:41:322010数据库技术大会纪念徽章
日期:2015-04-23 10:33:192011数据库大会纪念章
日期:2015-04-23 10:33:192012数据库大会纪念章
日期:2015-04-23 10:33:192013数据库大会纪念章
日期:2015-04-23 10:33:19
23#
发表于 2011-12-20 13:15 | 只看该作者
TD 50PB数据,1024节点

使用道具 举报

回复
招聘 : 数据工程师
论坛徽章:
92
生肖徽章2007版:鸡
日期:2013-11-12 07:55:03马上有房
日期:2014-02-18 16:42:02马上有钱
日期:2014-04-09 17:17:412014年世界杯参赛球队: 美国
日期:2014-06-28 21:46:122014年世界杯参赛球队:喀麦隆
日期:2014-07-07 10:46:48马上有车
日期:2014-07-21 13:04:39马上加薪
日期:2014-07-29 10:04:19马上有对象
日期:2014-07-29 10:04:53马上有车
日期:2014-07-29 10:04:20马上加薪
日期:2014-08-26 22:26:06
24#
发表于 2011-12-20 13:15 | 只看该作者
TD,我觉得还是属于传统bi阵营,hadoop是新贵,不久的将来,一些新的领域,如互联网,移动在线会被hadoop统治;
传统行业,金融,通信部分行业要求数据准确大于及时的要求还是绝定了传统bi的一席之地。

使用道具 举报

回复
论坛徽章:
66
现任管理团队成员
日期:2011-05-07 01:45:08版主9段
日期:2013-04-21 02:21:02ITPUB年度最佳版主
日期:2014-02-19 10:05:27ITPUB年度最佳版主
日期:2013-01-30 17:30:25ITPUB年度最佳技术原创精华奖
日期:2012-03-13 17:12:05优秀写手
日期:2013-12-18 09:29:15元宝章
日期:2015-02-10 19:57:54金牌徽章
日期:2015-02-10 19:59:42银牌徽章
日期:2015-02-10 19:59:42铜牌徽章
日期:2015-02-10 19:59:41
25#
 楼主| 发表于 2011-12-20 13:17 | 只看该作者
wangkxxe 发表于 2011-12-20 13:13
粉丝去把TD bynet专利搞出来啊

1024吧,好像有好几种说法,具体多少个节点上限偶不是很清楚,但是每个节 ...

不得不所bynet是TD的牛逼之处,我哪里有那个本事

其实关于数据存储多长时间并不是依赖于这个平台,而是依赖于项目。有的项目要求archive 5的数据,那5年前的数据其实可以cut掉的。。当然有的项目要所有的历史数据,那不但是Terdata有这方面的成本,任何平台都会有硬件浪费的。

使用道具 举报

回复
论坛徽章:
176
现任管理团队成员
日期:2011-05-07 01:45:08版主7段
日期:2012-07-05 02:21:03ITPUB长老会成员
日期:2015-05-07 15:11:10ITPUB年度最佳版主
日期:2011-04-08 18:37:09ITPUB年度最佳版主
日期:2011-12-28 15:24:18ITPUB牛人
日期:2010-10-25 12:41:322010数据库技术大会纪念徽章
日期:2015-04-23 10:33:192011数据库大会纪念章
日期:2015-04-23 10:33:192012数据库大会纪念章
日期:2015-04-23 10:33:192013数据库大会纪念章
日期:2015-04-23 10:33:19
26#
发表于 2011-12-20 13:20 | 只看该作者
luyi6101 发表于 2011-12-20 13:15
TD,我觉得还是属于传统bi阵营,hadoop是新贵,不久的将来,一些新的领域,如互联网,移动在线会被hadoop统治 ...

表示赞同,呵呵

使用道具 举报

回复
求职 : 技术/实施/服务顾问
论坛徽章:
182
最佳人气徽章
日期:2012-03-13 17:39:18粉钻
日期:2012-07-03 19:48:12欧洲冠军杯纪念徽章
日期:2012-05-13 13:33:34菠菜明灯
日期:2012-05-13 13:33:35股神
日期:2012-05-13 13:33:35NBA之星
日期:2012-05-13 13:33:35NBA大富翁
日期:2012-05-13 13:33:35菠菜神灯
日期:2012-05-13 13:33:35ITPUB季度 社区新星
日期:2012-02-16 14:52:31奥运纪念徽章
日期:2008-09-04 11:35:05
27#
发表于 2011-12-20 13:25 | 只看该作者
我不了解这个,所以去百度查了一下,
一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

使用道具 举报

回复
招聘 : 数据工程师
论坛徽章:
92
生肖徽章2007版:鸡
日期:2013-11-12 07:55:03马上有房
日期:2014-02-18 16:42:02马上有钱
日期:2014-04-09 17:17:412014年世界杯参赛球队: 美国
日期:2014-06-28 21:46:122014年世界杯参赛球队:喀麦隆
日期:2014-07-07 10:46:48马上有车
日期:2014-07-21 13:04:39马上加薪
日期:2014-07-29 10:04:19马上有对象
日期:2014-07-29 10:04:53马上有车
日期:2014-07-29 10:04:20马上加薪
日期:2014-08-26 22:26:06
28#
发表于 2011-12-20 13:33 | 只看该作者
TD的节点概念其实只是用到了分布式的部分思想,分而治之,这其实在很多ETL工具中都已经实现,如datastage,informatica的pipe,partition的概念,但仅仅是这个还称不上分布式。所以他还是属于传统阵营。

使用道具 举报

回复
招聘 : 数据工程师
论坛徽章:
92
生肖徽章2007版:鸡
日期:2013-11-12 07:55:03马上有房
日期:2014-02-18 16:42:02马上有钱
日期:2014-04-09 17:17:412014年世界杯参赛球队: 美国
日期:2014-06-28 21:46:122014年世界杯参赛球队:喀麦隆
日期:2014-07-07 10:46:48马上有车
日期:2014-07-21 13:04:39马上加薪
日期:2014-07-29 10:04:19马上有对象
日期:2014-07-29 10:04:53马上有车
日期:2014-07-29 10:04:20马上加薪
日期:2014-08-26 22:26:06
29#
发表于 2011-12-20 13:40 | 只看该作者
wangkxxe 发表于 2011-12-20 12:56
HADOOP是电商、互联网的发展趋势啊,其他行业的,也许就不适合了,比如业务逻辑过于复杂 ……

是的,这是hadoop的瓶颈之一,逻辑过于复杂,关系在底层不好处理,而且现在hadoop底层数据库多采用列式数据库,大规模的关系运算相对于传统数据库来说,没有丝毫优势。再加上分布式平台过多的代码重构,对逻辑关系的重写造成维护复杂,这个也是抗不住的。

使用道具 举报

回复
论坛徽章:
9
蜘蛛蛋
日期:2011-12-28 14:46:28ITPUB季度 技术新星
日期:2012-05-22 15:10:11蛋疼蛋
日期:2012-05-28 16:48:46蜘蛛蛋
日期:2012-05-28 16:54:09茶鸡蛋
日期:2012-05-28 17:27:32双黄蛋
日期:2012-05-28 17:45:17迷宫蛋
日期:2012-05-29 10:49:35蛋疼蛋
日期:2012-06-04 17:13:15优秀写手
日期:2013-12-18 09:29:11
30#
发表于 2011-12-20 14:10 | 只看该作者
Teradata在数据库分析领域不断推陈出新,但在结构化数据、半结构化数据和大部分非结构化数据领域几乎没有很大成果。这也就是为什么该公司要收购Aster Data;一家提供SQL-MapReduce框架的公司。MapReduce处理拥有广泛的市场需求,因为存在着大量的互联网点击数据、传感数据和社交媒体内容!Hadoop是一个开放源码的分布式数据处理系统架构,主要面向存储和处理结构化、半结构化或非结构化、真正意义上的大数据(通常成百上千的TB甚至PB级别数据)应用。网络点击和社交媒体分析应用,正在极大地推动应用需求。Hadoop提供的MapReduce(和其他一些环境)是处理大数据集理想解决方案!以上一个网友发表的,个人感觉hadoop以后的发展空间会越来越大,其中之一就是他可以在一些低成本的意见上保证数据的存储和数据分析方案,这点我看着比较好!由于这个是思路,就像现在的MYSQL也一样,有免费的慢慢扩大化,进一步发展出自己的产品和服务!

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表