楼主: Yong Huang

RAC increases points of failure

[复制链接]
论坛徽章:
190
生肖徽章:狗
日期:2006-11-23 04:26:03生肖徽章:羊
日期:2007-09-26 17:08:21生肖徽章:马
日期:2007-09-26 17:08:49授权会员
日期:2007-12-31 19:14:41生肖徽章2007版:牛
日期:2008-03-28 10:02:30奥运会纪念徽章:柔道
日期:2008-04-30 16:28:44奥运会纪念徽章:垒球
日期:2008-05-12 21:28:28奥运会纪念徽章:体操
日期:2008-06-26 10:00:41奥运会纪念徽章:沙滩排球
日期:2008-07-27 12:41:59奥运会纪念徽章:艺术体操
日期:2008-07-30 11:09:47
11#
发表于 2014-3-7 14:35 | 只看该作者
wolfop 发表于 2014-3-7 11:11
我再强调一点,Extend RAC导致双站点数据库紧耦合,根本不能用来做容灾。
所谓的双活就是双死

兄台觉得vplex如何?

使用道具 举报

回复
论坛徽章:
78
ITPUB15周年纪念
日期:2020-08-28 17:23:53双鱼座
日期:2016-03-19 19:38:31秀才
日期:2016-02-18 09:31:52秀才
日期:2016-01-25 15:02:04双子座
日期:2016-01-19 20:35:54秀才
日期:2016-01-13 12:14:26秀才
日期:2015-12-25 15:31:10秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:56:09秀才
日期:2015-12-14 14:51:16
12#
发表于 2014-3-7 22:34 | 只看该作者
jieyancai 发表于 2014-3-7 14:35
兄台觉得vplex如何?

你去找找EMC的白皮书,原来写的很清楚要三台存储,voting需要不通过vplex管理,发在三个站点,三份拷贝(asm normal redundancy)才能保证单纯的站点故障,存储故障的RTO=0。结果给人忽悠的时候改了,为了节约成本,变成全部通过VPLEX管理,如果单存储故障、站点故障等情况,很大几率集群会重启,RTO!=0。
更要命的是解决不了我说的Extend RAC双死的问题,如果数据库逻辑故障,SCN不一致而无法实例恢复,全部完蛋。
非要做extend RAC,ASM normal redundancy足以,但是我仍然认为extend RAC不是容灾方案。更多是噱头。某个超大级别的移动发生过两次核心系统关键数据损坏无法实例恢复,最近又一个中等规模的省发生了,基于存储复制的容灾完全无能为力。
其实自己试试就知道,要容灾,可以模拟以下步骤,看看你的容灾能否解决。dd if=/dev/zero of=system表空间或者undo或者active的redolog所用的存储。
别给我说这种情况不能发生,你能保证你CPU或者内存故障的时候写到磁盘上的东西100%正确?
死的例子比比皆是。

使用道具 举报

回复
论坛徽章:
190
生肖徽章:狗
日期:2006-11-23 04:26:03生肖徽章:羊
日期:2007-09-26 17:08:21生肖徽章:马
日期:2007-09-26 17:08:49授权会员
日期:2007-12-31 19:14:41生肖徽章2007版:牛
日期:2008-03-28 10:02:30奥运会纪念徽章:柔道
日期:2008-04-30 16:28:44奥运会纪念徽章:垒球
日期:2008-05-12 21:28:28奥运会纪念徽章:体操
日期:2008-06-26 10:00:41奥运会纪念徽章:沙滩排球
日期:2008-07-27 12:41:59奥运会纪念徽章:艺术体操
日期:2008-07-30 11:09:47
13#
发表于 2014-3-7 23:07 | 只看该作者
wolfop 发表于 2014-3-7 22:34
你去找找EMC的白皮书,原来写的很清楚要三台存储,voting需要不通过vplex管理,发在三个站点,三份拷贝(a ...

来张官方图,问题出在哪里?

使用道具 举报

回复
论坛徽章:
78
ITPUB15周年纪念
日期:2020-08-28 17:23:53双鱼座
日期:2016-03-19 19:38:31秀才
日期:2016-02-18 09:31:52秀才
日期:2016-01-25 15:02:04双子座
日期:2016-01-19 20:35:54秀才
日期:2016-01-13 12:14:26秀才
日期:2015-12-25 15:31:10秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:56:09秀才
日期:2015-12-14 14:51:16
14#
发表于 2014-3-8 12:01 | 只看该作者
两个问题
1)最严重的情况,VPLEX这种东西是不理解数据库的,上面写什么,就向磁盘写什么。如果发生严重错误,把redo log/system table space/undo写坏,两边都坏,双死。请从备份恢复,RTO肯定很长0,RPO估计也难是0。自己测试用我上面的方式模拟一下看看。这个的本质问题和基于存储复制的数据库容灾是一样的SRDF/S, PPRC同步,TRUE COPY同步解决不了的问题,vplex一样不行。DG没有这个问题,不是紧密耦合。
2)如果其中一个站但完蛋或者一个站点的存储完蛋或者一个站点的VPLEX完蛋,其写必须重试超时才放弃。这段期间写可能超时,数据文件还好,control file肯定不行,voting访问也可能超时,CRS会重启节点,导致RTO!=0.
自己去找他白皮书的一句话“In the case of VPLEX interconnect partitioning (or a true site failure) VPLEX immediately suspends IOs at both clusters while VPLEX Witness resolves which of them should continue to service IOs (based on detach rules and site availability). The Oracle cluster nodes will therefore have access to voting disks only where VPLEX resumes IO, and Oracle clusterware will therefore reconfigure the cluster in accordance.”
然后请他解释一下"The Oracle cluster nodes will therefore have access to voting disks only where VPLEX resumes IO, and Oracle clusterware will therefore reconfigure the cluster in accordance."到底会发生什么
3)跨站点的cache fusion,明显VPLEX是把这个问题留给ORACLE,反正除了问题也不管,也可以说不关他事。

使用道具 举报

回复
论坛徽章:
190
生肖徽章:狗
日期:2006-11-23 04:26:03生肖徽章:羊
日期:2007-09-26 17:08:21生肖徽章:马
日期:2007-09-26 17:08:49授权会员
日期:2007-12-31 19:14:41生肖徽章2007版:牛
日期:2008-03-28 10:02:30奥运会纪念徽章:柔道
日期:2008-04-30 16:28:44奥运会纪念徽章:垒球
日期:2008-05-12 21:28:28奥运会纪念徽章:体操
日期:2008-06-26 10:00:41奥运会纪念徽章:沙滩排球
日期:2008-07-27 12:41:59奥运会纪念徽章:艺术体操
日期:2008-07-30 11:09:47
15#
发表于 2014-3-8 19:46 | 只看该作者
wolfop 发表于 2014-3-8 12:01
两个问题
1)最严重的情况,VPLEX这种东西是不理解数据库的,上面写什么,就向磁盘写什么。如果发生严重错 ...

使用道具 举报

回复
论坛徽章:
47
蒙奇·D·路飞
日期:2017-03-27 08:04:23马上有车
日期:2014-02-18 16:41:112014年新春福章
日期:2014-02-18 16:41:11一汽
日期:2013-09-01 20:46:27复活蛋
日期:2013-03-13 07:55:232013年新春福章
日期:2013-02-25 14:51:24ITPUB 11周年纪念徽章
日期:2012-10-09 18:03:322012新春纪念徽章
日期:2012-02-13 15:13:202012新春纪念徽章
日期:2012-02-13 15:13:202012新春纪念徽章
日期:2012-02-13 15:13:20
16#
 楼主| 发表于 2014-3-8 23:33 | 只看该作者
wolfop 发表于 2014-3-6 21:11
我再强调一点,Extend RAC导致双站点数据库紧耦合,根本不能用来做容灾。
所谓的双活就是双死

I don't quite understand why a 紧耦合 (some kind of tight coupling?) cannot be used for DR. I understand DR to be the case where one data center is destroyed and all users are switched to the other data center. Why do you think extended RAC can't do that?

My posting here is about users experiencing temporary disconnections when some RAC instances crash. You brought up a discussion of DR, which is a separate issue. Maybe we need to open a new thread for that topic.

使用道具 举报

回复
论坛徽章:
78
ITPUB15周年纪念
日期:2020-08-28 17:23:53双鱼座
日期:2016-03-19 19:38:31秀才
日期:2016-02-18 09:31:52秀才
日期:2016-01-25 15:02:04双子座
日期:2016-01-19 20:35:54秀才
日期:2016-01-13 12:14:26秀才
日期:2015-12-25 15:31:10秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:56:09秀才
日期:2015-12-14 14:51:16
17#
发表于 2014-3-9 12:22 | 只看该作者
Kamus 发表于 2014-3-8 23:30
1. 我了解你说的双死是有逻辑损坏,或者人为故障。这一点确实没错,Extend RAC说到底是RAC,RAC自身本来就 ...

对于同步DG对网络的需求,肯定是有一定要求的。现在的问题主要在于FC采用的dark fiber或者DWDM质量比较一般基于IP的网络会比较好。
如果按照FC网络的要求要求专门建设DG的IP网络,减少之间的路由器、交换机个数确保低的延迟<5ms,提供足够的带宽,比如10GE,是完全没有问题的。最近的一个测试,最大可用性模式下,采用10GE+1ms的延迟,logfile sync不过从2ms增加到8-9ms而已。相比之下,采用extend RAC,由于存储在远程也必须写成功,尤其vplex还是write through的cache,其log file sync延迟增加可能更可怕。虽然我没有直接的VPLEX做extend RAC导致log file sync的延迟增加,我手上有一个用SRDF/S做同步容灾的,其log file sync平均达到20-3ms
另外,如果你的网络带宽和延迟均够的情况下如果DG还有比较严重的log file sync,恐怕要考虑是特定版本的BUG,有相应patch。

使用道具 举报

回复
论坛徽章:
78
ITPUB15周年纪念
日期:2020-08-28 17:23:53双鱼座
日期:2016-03-19 19:38:31秀才
日期:2016-02-18 09:31:52秀才
日期:2016-01-25 15:02:04双子座
日期:2016-01-19 20:35:54秀才
日期:2016-01-13 12:14:26秀才
日期:2015-12-25 15:31:10秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-14 14:56:09秀才
日期:2015-12-14 14:51:16
18#
发表于 2014-3-9 12:22 | 只看该作者
Yong Huang 发表于 2014-3-8 23:33
I don't quite understand why a 紧耦合 (some kind of tight coupling?) cannot be used for DR. I unde ...

Yes, it is really another topic. Just about extend RAC which is I will never use it for DR。

使用道具 举报

回复
论坛徽章:
47
蒙奇·D·路飞
日期:2017-03-27 08:04:23马上有车
日期:2014-02-18 16:41:112014年新春福章
日期:2014-02-18 16:41:11一汽
日期:2013-09-01 20:46:27复活蛋
日期:2013-03-13 07:55:232013年新春福章
日期:2013-02-25 14:51:24ITPUB 11周年纪念徽章
日期:2012-10-09 18:03:322012新春纪念徽章
日期:2012-02-13 15:13:202012新春纪念徽章
日期:2012-02-13 15:13:202012新春纪念徽章
日期:2012-02-13 15:13:20
19#
 楼主| 发表于 2014-3-11 00:04 | 只看该作者
What you described is high latency causing long log file sync (or other wait events) in case of extended RAC. That has nothing to do with DR (and also not related to the original topic of this discussion thread). But your point makes sense: extended RAC may have log file sync longer than that in a local non-extended RAC or single instance database.

使用道具 举报

回复
论坛徽章:
2
2013年新春福章
日期:2013-02-25 14:51:24懒羊羊
日期:2015-03-28 12:52:25
20#
发表于 2014-3-22 02:55 | 只看该作者
本帖最后由 mike79 于 2014-3-22 02:59 编辑
wolfop 发表于 2014-3-7 22:34
你去找找EMC的白皮书,原来写的很清楚要三台存储,voting需要不通过vplex管理,发在三个站点,三份拷贝(a ...


这个未必是忽悠。用了vplex,还将三个vote disk放在三个站点可能是有问题的:一旦中间链路断开,vplex可能和RAC做出不同的仲裁。比如vplex将站点A上的存储挂起,而RAC将站点B上的节点踢出去。这样整个RAC就挂了。
“An acknowledgement of the write I/O needs to be received in 200 seconds under normal operations (long disk timeout) and 27 seconds during a reconfiguration in the cluster (short disk timeout).”
“In other words, the connectivity to the third location should ensure that the Voting File write I/O can be acknowledged in 27/2 seconds (approx. 14 seconds)”
14秒时间给vplex做仲裁一般应该足够了。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表