12
返回列表 发新帖
楼主: beingman

[参考文档] Exadata V2 is Still Oracle---- teradata咨询顾问对exadata的评价

[复制链接]
论坛徽章:
2
2011新春纪念徽章
日期:2011-02-18 11:42:48咸鸭蛋
日期:2012-05-31 14:30:16
11#
 楼主| 发表于 2011-2-15 16:01 | 只看该作者

回复 #10 wolfop 的帖子

呵呵,楼上,Greenplum在上月gartner发布的DW领域DBMS魔力象限中已经位于领导者象限了。我并没有
刻意忽略DB2的MPP架构产品,只是根据几年前使用DB2的经验,似乎没有楼主说的这么玄乎,我们都是技术
人员,楼主不妨把那个著名公司测试的具体环境配置(软、硬件及环境参数)和使用的测试用例跟大家分享一
下,毕竟简单的相同硬件对我们技术人员来说,想象的空间还是很大的。

使用道具 举报

回复
论坛徽章:
78
ITPUB15周年纪念
日期:2020-08-28 17:23:53双鱼座
日期:2016-03-19 19:38:31秀才
日期:2016-02-18 09:31:52秀才
日期:2016-01-25 15:02:04双子座
日期:2016-01-19 20:35:54秀才
日期:2016-01-13 12:14:26秀才
日期:2015-12-25 15:31:10秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:56:09秀才
日期:2015-12-14 14:51:16
12#
发表于 2011-2-15 20:13 | 只看该作者
原帖由 beingman 于 2011-2-15 16:01 发表
呵呵,楼上,Greenplum在上月gartner发布的DW领域DBMS魔力象限中已经位于领导者象限了。我并没有
刻意忽略DB2的MPP架构产品,只是根据几年前使用DB2的经验,似乎没有楼主说的这么玄乎,我们都是技术
人员,楼主不妨把那个著名公司测试的具体环境配置(软、硬件及环境参数)和使用的测试用例跟大家分享一
下,毕竟简单的相同硬件对我们技术人员来说,想象的空间还是很大的。

Gartner与其说是一个技术评价机构,不如说是一个股票评价机构,他写的东西有多少技术含量?
greenplum这样原来几乎为0的公司当然对投资者更有吸引力。
附件是测试报告的PDF版本,关键客户名称我肯定是替换了。此外还有一个亚信对比几种DSS的RDBMS的对比图表,至于怎么解释,自己先看看。
要是GP那么牛,也不会在Huawei的DSS对比测试输掉。
Greenplum目前生产最大的案例是多少?有多少节点?单个数据库有效数据量有多大?一个网站都不提供官方文档的公司,看个文档还要先签NDA的公司,一个连TPCH都没有测试结果的公司,有多大的技术含量? DB2_Benchmark.pdf (200.29 KB, 下载次数: 69)

使用道具 举报

回复
论坛徽章:
2
2011新春纪念徽章
日期:2011-02-18 11:42:48咸鸭蛋
日期:2012-05-31 14:30:16
13#
 楼主| 发表于 2011-2-16 20:38 | 只看该作者

回复 #12 wolfop 的帖子

诚然,Gartner的魔力象限报告不是纯技术的报告,它看问题的角度更广,更专业,很多大厂商象IBM、Oracle都在自己的网站上引用以证明自己在相应领域的价值,正因为如此,它才对我们这些搞技术人员有相当大的参考价值,让我们学会看问题更理性,我转载了一份在数据仓库与数据挖掘版块,楼上不妨静下心来细细看看,链接在这里 http://www.itpub.net/thread-1396432-1-1.html

如果说greenplum对投资者更有吸引力,那只能说明他它给数据仓库的数据管理领域带来了新的活力,一个以高科技起家的公司,只能是以技术实力赢得投资者的青睐,我们数据库从业人员应该避免产生定式思维,需要关注新兴企业及其技术,以便跟上行业发展的步伐。

另外,我想说的是处于领先地位并不一定要在每次测试中都要处于第一的位置,何况又有测试人员的技术水平,软件硬件本身的配置及优化设置,以及具体工作负荷的适用情况等等复杂因素的制约,实际上说它领先只是说它在统计规模上总体有比较好的表现。

这里也可以提供一份数据Greenplum的案例参考数据,截至2009年5月,eBay采用GreenPlum管理的数据集市的数据量是6.5PB,系统有96节点,这个数据量不知道是不是案例中最大的,不过应该不算小了吧。

记得Greenplum的软件安装包里包含一个TPCH测试包,应该是对这种测试很有信心,非常遗憾的是自从被EMC收购以后似乎不再提供产品文档了,
只有一些白皮书和一个节点数量受限的社区版软件提供下载,对我们的学习和研究确实形成了一定的障碍,也不知道它现在的版本是不是更好用。

感谢楼上提供的DB2和Greenplum的基准测试报告,我以前接触DB2不深,尤其是基于Linux和X86平台的案例,你的报告让我受益很深,谢谢你。
你很热心,和你讨论问题也很愉快,希望有更多的朋友参与进来。

[ 本帖最后由 beingman 于 2011-2-16 20:41 编辑 ]

使用道具 举报

回复
论坛徽章:
78
ITPUB15周年纪念
日期:2020-08-28 17:23:53双鱼座
日期:2016-03-19 19:38:31秀才
日期:2016-02-18 09:31:52秀才
日期:2016-01-25 15:02:04双子座
日期:2016-01-19 20:35:54秀才
日期:2016-01-13 12:14:26秀才
日期:2015-12-25 15:31:10秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:56:09秀才
日期:2015-12-14 14:51:16
14#
发表于 2011-2-16 22:34 | 只看该作者
原帖由 beingman 于 2011-2-16 20:38 发表
诚然,Gartner的魔力象限报告不是纯技术的报告,它看问题的角度更广,更专业,很多大厂商象IBM、Oracle都在自己的网站上引用以证明自己在相应领域的价值,正因为如此,它才对我们这些搞技术人员有相当大的参考价值,让我们学会看问题更理性,我转载了一份在数据仓库与数据挖掘版块,楼上不妨静下心来细细看看,链接在这里 http://www.itpub.net/thread-1396432-1-1.html

如果说greenplum对投资者更有吸引力,那只能说明他它给数据仓库的数据管理领域带来了新的活力,一个以高科技起家的公司,只能是以技术实力赢得投资者的青睐,我们数据库从业人员应该避免产生定式思维,需要关注新兴企业及其技术,以便跟上行业发展的步伐。

另外,我想说的是处于领先地位并不一定要在每次测试中都要处于第一的位置,何况又有测试人员的技术水平,软件硬件本身的配置及优化设置,以及具体工作负荷的适用情况等等复杂因素的制约,实际上说它领先只是说它在统计规模上总体有比较好的表现。

这里也可以提供一份数据Greenplum的案例参考数据,截至2009年5月,eBay采用GreenPlum管理的数据集市的数据量是6.5PB,系统有96节点,这个数据量不知道是不是案例中最大的,不过应该不算小了吧。

记得Greenplum的软件安装包里包含一个TPCH测试包,应该是对这种测试很有信心,非常遗憾的是自从被EMC收购以后似乎不再提供产品文档了,
只有一些白皮书和一个节点数量受限的社区版软件提供下载,对我们的学习和研究确实形成了一定的障碍,也不知道它现在的版本是不是更好用。

感谢楼上提供的DB2和Greenplum的基准测试报告,我以前接触DB2不深,尤其是基于Linux和X86平台的案例,你的报告让我受益很深,谢谢你。
你很热心,和你讨论问题也很愉快,希望有更多的朋友参与进来。

greenplum网站根本没有e-Bay的案例,网络流言是:http://www.dbms2.com/2010/10/06/ ... ome-value-and-more/
此外,单个RDBMS的大小和总共管理的数据量大小是两回事。我不相信greenplum那种架构能让单个DB过大。greenplum对TPCH的信心,估计还不如ParAccel,起码后者还是测试结果。

使用道具 举报

回复
论坛徽章:
2
2011新春纪念徽章
日期:2011-02-18 11:42:48咸鸭蛋
日期:2012-05-31 14:30:16
15#
 楼主| 发表于 2011-2-17 14:45 | 只看该作者

回复 #14 wolfop 的帖子

打开greenplum的主页,在站内搜索框内输入ebay,有很多地方都提到ebay使用了他们的数据库,不知道楼上为什么这么确定greenplum网站根本没有e-Bay的案例。

我提供的案例数据不是从楼上提供的所谓网络流言链接引用的,不过细细看看dbms2上的这篇文章确实很有意思,作者说采访了ebay的负责人,说是GP出局(thrown out )了,然后ebay的负责人跟帖澄清,说作者夸大了他的原意。

楼上说的单个RDBMS的大小是什么意思,是指单节点的大小吗,这个可能不适合GP,单节点对它来说不具有完整的业务意义,它的所有节点在主节点的协调下对外以一个数据库系统提供服务;

看了一下TPC网站上TPC-H的排在前10名的数据库软硬件系统组合,6个数据库大小级别(100GB,300GB,1,000 GB,3,000 GB,
10,000 GB,30,000 GB)上确实都没有GP。

“不相信greenplum那种架构能让单个DB过大”,可以详细谈谈依据吗?

使用道具 举报

回复
论坛徽章:
78
ITPUB15周年纪念
日期:2020-08-28 17:23:53双鱼座
日期:2016-03-19 19:38:31秀才
日期:2016-02-18 09:31:52秀才
日期:2016-01-25 15:02:04双子座
日期:2016-01-19 20:35:54秀才
日期:2016-01-13 12:14:26秀才
日期:2015-12-25 15:31:10秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:56:09秀才
日期:2015-12-14 14:51:16
16#
发表于 2011-2-18 18:39 | 只看该作者
原帖由 beingman 于 2011-2-17 14:45 发表
打开greenplum的主页,在站内搜索框内输入ebay,有很多地方都提到ebay使用了他们的数据库,不知道楼上为什么这么确定greenplum网站根本没有e-Bay的案例。

我提供的案例数据不是从楼上提供的所谓网络流言链接引用的,不过细细看看dbms2上的这篇文章确实很有意思,作者说采访了ebay的负责人,说是GP出局(thrown out )了,然后ebay的负责人跟帖澄清,说作者夸大了他的原意。

楼上说的单个RDBMS的大小是什么意思,是指单节点的大小吗,这个可能不适合GP,单节点对它来说不具有完整的业务意义,它的所有节点在主节点的协调下对外以一个数据库系统提供服务;

看了一下TPC网站上TPC-H的排在前10名的数据库软硬件系统组合,6个数据库大小级别(100GB,300GB,1,000 GB,3,000 GB,
10,000 GB,30,000 GB)上确实都没有GP。

“不相信greenplum那种架构能让单个DB过大”,可以详细谈谈依据吗?

单个数据库的意思是指可以跨多节点的的单一数据库映象。管理的数据量可能是多个数据库单一映象实现的,很容易误导。比如,ORACLE可以吹在CMCC ORACLE管理的数据量达到20PB。问题这实际上是多个数据库,物理也分布在多个地方,功能也是多个。对于EBAY的data market,从那上面也没法分清楚到底是一个单一数据库映象到那么大,还是多个数据库达到那么大的数据量。
GREENPLUM目前的设计有一个master 节点负责太多的工作,容易成为瓶颈。在greenplum的方向上似乎4.0要重点解决的这个问题,就是解决这个瓶颈,但能到什么水平不知道。
个人并不看好这种列式数据库,其优点只在于汇总/groupby这种操作,join之类的效率也不高。而汇总和groupby这类操作,最低成本高效的解决方式恐怕是院士mapreduce,最多加一个HIVE/PIG之类的玩意。当然,这类解决方案有这类解决方案的问题,开发困难(需要低级编码),或者成熟性更差,HIVE/PIG的bug之严重,某个测试用同样数据做数据挖掘测试,竟然挖掘出结果不一致。相比之下IBM有个让DB2和mapreduce结合的东西,biginsight,不过也没测过,不知道可靠性稳定性如何。不过方向还是比较好,可惜IBM在转型,变成咨询+服务,产品可能越来越不受重视。
对于现在,除互联网行业外大量的行业DSS已经不再是纯粹的DSS,往往混合ODS操作,甚至直接驱动前台的CRM的营销活动实现即时营销和冲动营销等。这时候column BASE的问题就更加严重,类OLTP查询会搞死column的方式。甚至存MPP的RDBMS也会遇到类似的问题,这几乎是teradata的噩梦,在某个行业中遇到了很严重失败教训。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表