楼主: xiete

[范例] 一个双节点RAC的故障案例

[复制链接]
论坛徽章:
59
狮子座
日期:2016-03-26 13:35:402013年新春福章
日期:2013-02-25 14:51:24双黄蛋
日期:2013-02-25 11:06:15ITPUB 11周年纪念徽章
日期:2012-10-09 18:06:20灰彻蛋
日期:2012-04-25 13:19:33紫蛋头
日期:2012-03-14 11:16:09最佳人气徽章
日期:2012-03-13 17:39:18玉石琵琶
日期:2012-02-21 15:04:38鲜花蛋
日期:2011-11-30 14:13:01ITPUB十周年纪念徽章
日期:2011-11-01 16:21:15
发表于 2010-9-19 12:46 | 显示全部楼层
原帖由 ccsnmoracle 于 2010-9-19 11:42 发表


我想问问,为什末不建议心跳线采用直连的方式???

Is crossover cable supported as an interconnect with RAC on any platform ?
NO. CROSS OVER CABLES ARE NOT SUPPORTED. The requirement is to use a switch:

Detailed Reasons:

1) cross-cabling limits the expansion of RAC to two nodes

2) cross-cabling is unstable:

a) Some NIC cards do not work properly with it. They are not able to negotiate the DTE/DCE clocking, and will thus not function. These NICS were made cheaper by assuming that the switch was going to have the clock. Unfortunately there is no way to know which NICs do not have that clock.

b) Media sense behaviour on various OS's (most notably Windows) will bring a NIC down when a cable is disconnected. Either of these issues can lead to cluster instability and lead to ORA-29740 errors (node evictions).

Due to the benefits and stability provided by a switch, and their afforability ($200 for a simple 16 port GigE switch), and the expense and time related to dealing with issues when one does not exist, this is the only supported configuration.

From a purely technology point of view Oracle does not care if the customer uses cross over cable or router or switches to deliver a message. However, we know from experience that a lot of adapters misbehave when used in a crossover configuration and cause a lot of problems for RAC. Hence we have stated on certify that we do not support crossover cables to avoid false bugs and finger pointing amongst the various parties: Oracle, Hardware vendors, Os vendors etc...

使用道具 举报

回复
论坛徽章:
59
狮子座
日期:2016-03-26 13:35:402013年新春福章
日期:2013-02-25 14:51:24双黄蛋
日期:2013-02-25 11:06:15ITPUB 11周年纪念徽章
日期:2012-10-09 18:06:20灰彻蛋
日期:2012-04-25 13:19:33紫蛋头
日期:2012-03-14 11:16:09最佳人气徽章
日期:2012-03-13 17:39:18玉石琵琶
日期:2012-02-21 15:04:38鲜花蛋
日期:2011-11-30 14:13:01ITPUB十周年纪念徽章
日期:2011-11-01 16:21:15
发表于 2010-9-19 12:48 | 显示全部楼层
上面这段话出处来自
RAC: Frequently Asked Questions (Doc ID 220970.1)

使用道具 举报

回复
论坛徽章:
5
授权会员
日期:2005-10-30 17:05:33会员2006贡献徽章
日期:2006-04-17 13:46:34ITPUB9周年纪念徽章
日期:2010-10-08 09:28:522011新春纪念徽章
日期:2011-02-18 11:43:35迷宫蛋
日期:2011-11-02 16:14:29
 楼主| 发表于 2010-9-19 15:28 | 显示全部楼层
谢谢各位,目前的问题依旧,虽然网卡重启次数降低,但问题依然,很是头疼

使用道具 举报

回复
论坛徽章:
98
2009日食纪念
日期:2009-07-22 09:30:002010新春纪念徽章
日期:2010-03-01 11:05:012010年世界杯参赛球队:美国
日期:2010-05-02 21:32:232010数据库技术大会纪念徽章
日期:2010-05-13 09:34:23ITPUB季度 技术新星
日期:2010-05-17 15:53:17数据库板块每日发贴之星
日期:2010-05-24 01:01:072010年世界杯参赛球队:意大利
日期:2010-05-31 20:55:432010年世界杯参赛球队:巴拉圭
日期:2010-07-03 13:06:582010世博会纪念徽章
日期:2010-08-18 23:53:44ITPUB9周年纪念徽章
日期:2010-10-08 09:28:51
发表于 2010-9-20 14:34 | 显示全部楼层
网卡的负载大不大?
如果负载不小的话,可以考虑加几块网卡绑定。

是固定的一块网卡重启吗?换块试试看。

使用道具 举报

回复
论坛徽章:
5
授权会员
日期:2005-10-30 17:05:33会员2006贡献徽章
日期:2006-04-17 13:46:34ITPUB9周年纪念徽章
日期:2010-10-08 09:28:522011新春纪念徽章
日期:2011-02-18 11:43:35迷宫蛋
日期:2011-11-02 16:14:29
 楼主| 发表于 2010-9-20 14:42 | 显示全部楼层
用NLOAD持续观察过,不知是不是版本BUG,有时流量能达到10-100GBIT!!!服务器都是板载网卡,加网卡有难度。
就是内网网卡重启,目前换到交换机上后,重启现象明显减少,但OCSS.LOG中仍旧有大量心跳检测故障错误,仍旧导致重启

使用道具 举报

回复
论坛徽章:
98
2009日食纪念
日期:2009-07-22 09:30:002010新春纪念徽章
日期:2010-03-01 11:05:012010年世界杯参赛球队:美国
日期:2010-05-02 21:32:232010数据库技术大会纪念徽章
日期:2010-05-13 09:34:23ITPUB季度 技术新星
日期:2010-05-17 15:53:17数据库板块每日发贴之星
日期:2010-05-24 01:01:072010年世界杯参赛球队:意大利
日期:2010-05-31 20:55:432010年世界杯参赛球队:巴拉圭
日期:2010-07-03 13:06:582010世博会纪念徽章
日期:2010-08-18 23:53:44ITPUB9周年纪念徽章
日期:2010-10-08 09:28:51
发表于 2010-9-20 20:55 | 显示全部楼层
10-100Gbit,这也太夸张了吧。
如果真是网络负载大的话,就考虑加网卡吧。只有有I/O槽位就行。

还有,如果cache fusion特别多的话,可以考虑做做应用负载分割。

[ 本帖最后由 五“宅”一生 于 2010-9-20 20:57 编辑 ]

使用道具 举报

回复
论坛徽章:
5
授权会员
日期:2005-10-30 17:05:33会员2006贡献徽章
日期:2006-04-17 13:46:34ITPUB9周年纪念徽章
日期:2010-10-08 09:28:522011新春纪念徽章
日期:2011-02-18 11:43:35迷宫蛋
日期:2011-11-02 16:14:29
 楼主| 发表于 2010-9-21 09:22 | 显示全部楼层
应用负载暂时不用考虑,因为应用是财务类的,在设计的时候并非同时使用两个节点,而是只反问一个节点,当此节点故障后才切换。
我有一个疑问,我的心跳网卡是千兆带宽,为何可以有如此高的流量呢?按说跑满也不至有这么高啊?! 按我的理解,跑满了也只应该是千兆流量,何来的GBIT?

12eth1.JPG

[ 本帖最后由 xiete 于 2010-9-21 09:31 编辑 ]

使用道具 举报

回复
论坛徽章:
5
授权会员
日期:2005-10-30 17:05:33会员2006贡献徽章
日期:2006-04-17 13:46:34ITPUB9周年纪念徽章
日期:2010-10-08 09:28:522011新春纪念徽章
日期:2011-02-18 11:43:35迷宫蛋
日期:2011-11-02 16:14:29
 楼主| 发表于 2010-9-21 09:52 | 显示全部楼层
假如有eth0 eth1 eth2三块网卡,如何实现eth2 和eth1共同承担心跳及节点通信?

使用道具 举报

回复
论坛徽章:
5
授权会员
日期:2005-10-30 17:05:33会员2006贡献徽章
日期:2006-04-17 13:46:34ITPUB9周年纪念徽章
日期:2010-10-08 09:28:522011新春纪念徽章
日期:2011-02-18 11:43:35迷宫蛋
日期:2011-11-02 16:14:29
 楼主| 发表于 2010-9-21 10:57 | 显示全部楼层
哦 可以用bonding

使用道具 举报

回复
论坛徽章:
1
2009日食纪念
日期:2009-07-22 09:30:00
发表于 2010-9-21 18:54 | 显示全部楼层
1,oracle 不建议心跳线采用直连的方式,不是不建议,根本就说不行,看SG中提到不能用cross线直接连网卡
2.看日志上的确没有什么重要的信息,都是因为达到了mistime后,另一个节点被干掉了.
3,网线,交换机可以和网管协商,不要把问题出在这种细节上
4,与供应商沟通,尽量使用最新的驱动方案;

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 
京ICP备09055130号-4  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表