楼主: wangfans

[精华] 【有奖讨论一期】Hadoop VS Teradata

[复制链接]
论坛徽章:
9
蜘蛛蛋
日期:2011-12-28 14:46:28ITPUB季度 技术新星
日期:2012-05-22 15:10:11蛋疼蛋
日期:2012-05-28 16:48:46蜘蛛蛋
日期:2012-05-28 16:54:09茶鸡蛋
日期:2012-05-28 17:27:32双黄蛋
日期:2012-05-28 17:45:17迷宫蛋
日期:2012-05-29 10:49:35蛋疼蛋
日期:2012-06-04 17:13:15优秀写手
日期:2013-12-18 09:29:11
61#
发表于 2012-1-9 14:33 | 只看该作者

使用道具 举报

回复
论坛徽章:
190
生肖徽章:狗
日期:2006-11-23 04:26:03生肖徽章:羊
日期:2007-09-26 17:08:21生肖徽章:马
日期:2007-09-26 17:08:49授权会员
日期:2007-12-31 19:14:41生肖徽章2007版:牛
日期:2008-03-28 10:02:30奥运会纪念徽章:柔道
日期:2008-04-30 16:28:44奥运会纪念徽章:垒球
日期:2008-05-12 21:28:28奥运会纪念徽章:体操
日期:2008-06-26 10:00:41奥运会纪念徽章:沙滩排球
日期:2008-07-27 12:41:59奥运会纪念徽章:艺术体操
日期:2008-07-30 11:09:47
62#
发表于 2012-2-14 15:46 | 只看该作者
最近刚刚被要求研究这个。头大呀。
不过从目前的形式看,hadoop似乎是大势所趋呀。
当前使用hadoop都是互联网的大头:google,yahoo,baidu,taobao等等

使用道具 举报

回复
论坛徽章:
190
生肖徽章:狗
日期:2006-11-23 04:26:03生肖徽章:羊
日期:2007-09-26 17:08:21生肖徽章:马
日期:2007-09-26 17:08:49授权会员
日期:2007-12-31 19:14:41生肖徽章2007版:牛
日期:2008-03-28 10:02:30奥运会纪念徽章:柔道
日期:2008-04-30 16:28:44奥运会纪念徽章:垒球
日期:2008-05-12 21:28:28奥运会纪念徽章:体操
日期:2008-06-26 10:00:41奥运会纪念徽章:沙滩排球
日期:2008-07-27 12:41:59奥运会纪念徽章:艺术体操
日期:2008-07-30 11:09:47
63#
发表于 2012-2-14 16:41 | 只看该作者
下图是greenplum的ppt中的,是否靠谱?

nosql.jpg (60.75 KB, 下载次数: 33)

nosql.jpg

使用道具 举报

回复
论坛徽章:
1
2010广州亚运会纪念徽章:摔跤
日期:2010-11-22 15:41:33
64#
发表于 2012-2-16 10:19 | 只看该作者
从传统企业(金融业、运营商)的角度来看,Teradata肯定是首选,有成熟的解决方案和实现路径,对其CIO来说稳定是首选,不可能会新建团队去研究和维护hadoop。

从新兴企业(电子商务企业)的角度来看,会更倾向于Hadoop,这些企业的队伍年轻,愿意接受新鲜事物的挑战;而且分析的数据及分析形式随时处于变化中。

使用道具 举报

回复
论坛徽章:
190
生肖徽章:狗
日期:2006-11-23 04:26:03生肖徽章:羊
日期:2007-09-26 17:08:21生肖徽章:马
日期:2007-09-26 17:08:49授权会员
日期:2007-12-31 19:14:41生肖徽章2007版:牛
日期:2008-03-28 10:02:30奥运会纪念徽章:柔道
日期:2008-04-30 16:28:44奥运会纪念徽章:垒球
日期:2008-05-12 21:28:28奥运会纪念徽章:体操
日期:2008-06-26 10:00:41奥运会纪念徽章:沙滩排球
日期:2008-07-27 12:41:59奥运会纪念徽章:艺术体操
日期:2008-07-30 11:09:47
65#
发表于 2012-2-16 12:30 | 只看该作者
将来数据仓库海量数据处理的趋势?
很明显了,当然是hadoop。
最明确的理由就是teradata已经看到了hadoop趋势,所以收购了aster,来弥补自己在hadoop mapreduce方面的欠缺。
看看teradata公司的新闻:
Teradata 天睿公司将收购 Aster Data - 3/7/2011

中国,北京——专注于数据仓库和企业分析方案的全球领导厂商 Teradata 天睿公司(Teradata Corporation,美国纽约证券交易所交易代码:TDC)宣布已签署收购 Aster Data Systems, Inc. 的最终协议,Aster Data 是高级分析和管理各种非结构化数据领域的市场领导者和开拓者。Teradata 天睿公司和 Aster Data 技术的结合,将帮助企业释放隐藏于不断增长的大数据中的新智能。

Teradata 天睿公司总裁兼首席执行官 Mike Koehler 表示:“Aster Data 为 Teradata 天睿公司带来的大数据分析市场商机,让我们非常振奋,加之最近收购 Aprimo 所获得的整合营销管理 (Integrated Marketing Management)能力,以及不断加大的核心数据仓库业务投资力度,提供了三个业内最佳平台,为 Teradata 天睿公司的未来发展注入了强劲动能。”

Teradata 天睿公司首席研发官 Scott Gnau 表示:“Teradata 天睿公司是数据仓库领域公认的创新者和领导者,此次收购Aster Data 将使我们跃升至新兴大数据市场的领导地位。这是一个绝佳的契机,也是客户一直以来的期待。衷心地欢迎 Aster Data 的精英人才加盟 Teradata 天睿公司,能够在交易完成后使用 Aster Data 的精细分析和创新大数据处理技术,也让我感到非常高兴。”

在此新兴市场,大数据通常定义为:数量非常庞大,结构化数据和非结构化数据并存,包含复杂的交互关系,使用现今的传统技术,无法对其进行分析。因此,捕获、存储、管理和分析大数据极其艰巨。某些新型、多样的非关联式数据源包括:Web 应用程序、传感器网络、社交网络、基因组、视频和照片

Gartner 近日在一份新闻稿中指出:“数据仓库将在 2011 年迎来它自问世后的一个最重要的转折点。Gartner 坚信数据仓库“理想”正在发生变化,它将朝向一种可以应对更加极端类型信息资产的新型数据仓库发展。因此,数据仓库数据库管理系统 (DBMS) 厂商必须开始应对大量的、新的信息资产类型,否则将在未来降级成支持者的角色。实际上,我们认为截至 2015 年,如果某一企业将各种极具价值的新信息类型和资源,整合到一个一致的信息管理基础架构,则会在财政方面至少领先业界同行20%。”

Teradata 天睿公司一直被公认为是数据仓库领导厂商,Aster Data 则擅长利用新分析功能(例如图解分析),让新型数据发挥更大价值。此外,数据仓库中的各种非结构化数据可与结构化数据相集成,提供更深入的业务洞察力,提升公司利用其所有海量数据促进利润增长的能力。

Aster Data 首席技术官兼联合创始人 Tasso Argyros 表示:“能够成为 Teradata 天睿公司的一员,我们感到非常兴奋。通过合作,我们能够加速客户驾驭大量数据的能力,帮助企业充分利用那些必须进行处理和分析的多样化数据。”

Aster Data 首席客户官兼联合创始人 Mayank Bawa 表示:“我们正引入新一类数据驱动应用程序,该应用程序利用了正在申请专利的 SQL-MapReduce 分析技术的优势,以及与非关联数据处理相关的创新技术,同时附加一系列极具灵活性和易用性的工具。我们将携手 Teradata 天睿公司向全球客户提供 Aster Data 解决方案,展望合作前景,我们非常兴奋。”

Teradata 天睿公司拟通过合并交易收购 Aster Data 的业务,包括其知识产权和技术产品系列。Teradata 天睿公司计划为 Aster Data 客户提供支持服务,并于收购结束后立即开展人力资源整合工作,预计将在 2011 年第二季度进行。Teradata 天睿公司在 2010 年 9 月的时候收购了 Aster Data 公司 11% 的所有者权益,并同意追加 2.63 亿美元以用于剩余的所有者权益、负债净额和其他费用。从Aster Data 的资产负债表来看,交易结束时,预计Teradata 天睿公司将从该公司手中获得约 2100 万美元的现金。

Aster Data 简介
Aster Data 是数据管理和各种大数据复杂分析领域的市场领导者,致力于打造经济高效存储和关联数据与非关联数据超速分析的强势组合。Aster Data nCluster 是一款分析平台,采用大规模并行处理 (MPP) 行列混合型数据库,拥有集成式分析引擎,支持用数据执行应用程序逻辑,以提供突破性的性能和可扩展性。Aster Data 解决方案利用 Aster Data 正在申请专利的 SQL-MapReduce 来并行处理数据和应用程序,可在大范围内提供丰富的分析洞察力。Barnes & Noble、Intuit、LinkedIn、InsightExpress、Akamai、Full Tilt Poker 和 MySpace 等公司都在使用 Aster Data 的应用程序来深入分析点击流量、社交网络连接、推荐和个性化设置、实时欺诈检测和客户流失率分析等等。欲知详情,请登录 www.asterdata.com

Teradata 天睿公司简介
Teradata天睿公司(Teradata Corporation,美国纽约证券交易所交易代码:TDC)是全球领先的数据仓库,大数据分析和整合营销管理解决方案供应商,专注于数据库软件,数据仓库专用平台及企业分析方案。客户信赖Teradata的创新产品和专业服务以助其实现可衡量的商业价值。欲了解更多详情,请登录www.teradata.com

使用道具 举报

回复
招聘 : SAP实施
论坛徽章:
9
ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:442010新春纪念徽章
日期:2010-03-01 11:20:53SQL大赛参与纪念
日期:2011-04-13 12:08:17ITPUB十周年纪念徽章
日期:2011-11-01 16:20:282012新春纪念徽章
日期:2012-01-04 11:50:44茶鸡蛋
日期:2012-02-29 11:04:04鲜花蛋
日期:2012-03-13 13:54:13蛋疼蛋
日期:2012-05-28 16:48:46
66#
发表于 2012-3-8 19:10 | 只看该作者
Teradata是和oracle同时代的产品,已经非常成熟了,不过太贵,普及不起来。Hadoop仍处于快速发展期,它的初衷是分析半结构化数据,如csv文件,后来逐渐出现了HIVE这种定位于数据仓库和OLAP的产品,以解决MapReduce编写的复杂性,更好的利用普通开发人员对SQL的掌握能力。

个人认为Hadoop更能代表未来海量数据处理的方向,MapReduce天生支持分布式计算,只是软件的成熟度和相关的产业链需要还不是那么完备,不过近一两年的发展势头非常好,在互联网企业几乎成为必备品,大的数据库厂商微软、oracle、emc都开始支持hadoop,前景应该还是很不错的。

使用道具 举报

回复
论坛徽章:
1
2011新春纪念徽章
日期:2011-02-18 11:43:35
67#
发表于 2012-3-12 15:43 | 只看该作者
看好HADOOP,经济基础决定上层建筑,HADOOP的低成本,势必会引领非结构化数据处理方案,再与一般分布式RDBMS结合,优势远大于TERADATA.不过对安全事务要求更高的高端客户,可能目前还是会选TERADATA.但利益驱动,肯定会考虑HADOOP架构的适时配合

使用道具 举报

回复
论坛徽章:
25
ITPUB元老
日期:2005-02-28 12:57:00咸鸭蛋
日期:2013-02-07 11:51:42咸鸭蛋
日期:2013-02-08 09:48:51蜘蛛蛋
日期:2013-02-21 15:47:392013年新春福章
日期:2013-02-25 14:51:24咸鸭蛋
日期:2013-02-28 17:08:42蜘蛛蛋
日期:2013-03-29 16:17:14双黄蛋
日期:2013-04-11 16:11:04咸鸭蛋
日期:2013-05-07 11:55:14咸鸭蛋
日期:2013-05-28 10:46:24
68#
发表于 2012-3-13 10:03 | 只看该作者
我觉得将来他们是并存的,如果非要说有缺点,我觉得hadoop更加适合做ETL的缓冲和细粒度的数据库仓库等偏前面的工作, TD适合做数据集市等偏后面的工作。

使用道具 举报

回复
论坛徽章:
625
奥运会纪念徽章:铁人三项
日期:2012-11-13 21:13:47奥运会纪念徽章:铁人三项
日期:2012-11-13 21:13:47奥运会纪念徽章:花样游泳
日期:2012-10-20 22:12:29奥运会纪念徽章:垒球
日期:2012-10-20 22:12:29奥运会纪念徽章:足球
日期:2012-10-25 09:22:46奥运会纪念徽章:赛艇
日期:2012-08-31 23:22:39奥运会纪念徽章:摔跤
日期:2012-09-01 11:49:03奥运会纪念徽章:跆拳道
日期:2012-09-01 11:49:03奥运会纪念徽章:垒球
日期:2012-09-01 11:49:03奥运会纪念徽章:棒球
日期:2012-09-01 16:17:53
69#
发表于 2012-3-14 20:31 | 只看该作者
学习!

使用道具 举报

回复
论坛徽章:
0
70#
发表于 2012-3-24 12:10 | 只看该作者
不知道这个比较的目的是什么
我来说说我的看法:
1)他们不是一种东西
terdata是典型的关系型数据库,它不是分布式数据库,因为每个节点上没有数据库copy,但它的原理是数据分布,hadoop是个分布式并行计算的框架
hadoop 可以利用廉价的硬件堆积起强大的并行计算能力,它可以应用目的明确的应用比如google,淘宝
hadoop 没有索引,没有视图,也没有事务,约束,典型的书库对象都没有,所以说它不是数据库


terdata相对于其他关系型数据库的优势在于海量数据的处理,在业界处于领先地位,share-nothing , MPP结构
无数个虚拟计算单元构成了并行计算能力,PE+AMP构成VPROC ,可以理解为一个计算单元
最新的BYNET4 可以扩展到4096个节点
加入每个节点上采用2 Intel Six-core Westmere CPUs (具有超线程),那就逻辑上意味着可以达到4096 ×2 × 12= 98304个计算单元的能力
也就是说98304个计算单元并行计算
最新的BYNET4 最高传输可以达到960M/second,
支持线性扩展 可以轻松的达到TB、PB 甚至更高
支持sas,sata,ssd等多种硬盘格式
最新发布的14版本,有很多新的特性,详见
http://tech.it168.com/a2012/0319/1326/000001326832.shtml

hadoop的优点和应用我就不细说了,无数的互联网应用已经证明其个非常出色的架构,在非结构化数据方面,更是传统数据库不能比拟的


其实,teradata 最初的版本 也是集成硬件和软件的,不是像现在的一体机。不准确的理解,可以说,起步也是把PC Server或小型机拼在一起
,后来发展了就放到机柜里成了一体机,呵呵,这点跟hadoop现在是不是很相似,书出同源啊,并行计算的理论 MPP share-nothing

还有现在的greenplum,嘿嘿,个人很看好,尤其EMC结合后,有了强大的存储技术支持

可是东西好也要有行业的积累,solution,这些greenplum比老牌的td,oracle,ibm还差了些

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表