查看: 11373|回复: 16

[精华] [共享] AIX RAC swap 不足, 实例down --解决

[复制链接]
论坛徽章:
97
ITPUB元老
日期:2008-06-30 12:48:39暖羊羊
日期:2015-03-04 14:50:372015年新春福章
日期:2015-03-06 11:57:312010数据库技术大会纪念徽章
日期:2015-04-23 10:33:192011数据库大会纪念章
日期:2015-04-23 10:33:192012数据库大会纪念章
日期:2015-04-23 10:33:192013数据库大会纪念章
日期:2015-04-23 10:33:192014数据库大会纪念章
日期:2015-04-23 10:33:19林肯
日期:2013-10-31 12:31:382013年新春福章
日期:2013-02-25 14:51:24
跳转到指定楼层
1#
发表于 2008-9-1 11:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
os : aix 5.3 + hacmp 5.4.1
db : 10.2.0. 3 rac

alert.log
Mon Sep  1 03:49:17 2008
Process startup failed, error stack:
Mon Sep  1 03:49:17 2008
Errors in file /app/oracle/admin/racdb/bdump/racdb1_psp0_479298.trc:
ORA-27300: OS system dependent operation:fork failed with status: 12
ORA-27301: OS failure message: Not enough space
ORA-27302: failure occurred at: skgpspawn3
Mon Sep  1 03:49:18 2008
Process PZ96 died, see its trace file


trace.log
Redo thread mounted by this instance: 1
Oracle process number: 4
Unix process pid: 479298, image: oracle@racdb1 (PSP0)

*** SERVICE NAMESYS$BACKGROUND) 2008-09-01 03:46:42.179
*** SESSION ID553.1) 2008-09-01 03:46:42.179
*** 2008-09-01 03:46:42.179
Process startup failed, error stack:
ORA-27300: OS system dependent operation:fork failed with status: 12
ORA-27301: OS failure message: Not enough space
ORA-27302: failure occurred at: skgpspawn3
*** 2008-09-01 03:47:41.144
Process startup failed, error stack:
ORA-27300: OS system dependent operation:fork failed with status: 12
ORA-27301: OS failure message: Not enough space
ORA-27302: failure occurred at: skgpspawn3
*** 2008-09-01 03:49:15.684

分析:
   1. 发现alert.log 发现很多ORA-27301: OS failure message: Not enough space 以为是 磁盘空间不足, 检查磁盘发现没有满.
   2. 检查trace.log , 发现是process PSP0 启动不了,  process-spawner (PSP0): spawns Oracle processes , 为oracle主要后台进程.
   3. crs_stat -t  发现数据库实例1已经down 掉,各个rac1资源已经offline..说明PSP0已经启动不了. 由此可知 ORA-27301: OS failure message: Not enough space 可能是由于系统内存不足的原因.
   4. metalink 查询. Doc ID:  Note:560309.1
      正是由于ram/swap 不足导致, 建议设置.
      RAM                              SWAP
      1GB to 2GB                   1.5 times RAM
      > 2GB and <= 8GB             1 times RAM
      > 8GB                      .75 times RAM
     而当前aix 系统的ram:8G, swap: 4G 可知远小于需要设置的swap.
   5. 查到原因 ,修改就很简单了. 利用smitty chps 修改系统的swap 即可. 然后利用 lsps -a 或者topas 查看swap .
   6. 系统运行3.4个月一直很正常,修改swap 以后需要继续观察.

附录: Doc ID:  Note:560309.1   
Applies to:
Oracle Server - Enterprise Edition - Version: 10.2.0.1 to 10.2.0.3
This problem can occur on any platform.

Symptoms
The database can not start up due to the following errors:

*** SERVICE NAMESYS$BACKGROUND) 2008-03-24 17:02:34.855
*** SESSION ID1104.1) 2008-03-24 17:02:34.855
*** 2008-03-24 17:02:34.855
Process startup failed, error stack:
ORA-27300: OS system dependent operation:fork failed with status: 12
ORA-27301: OS failure message: Not enough space
ORA-27302: failure occurred at: skgpspawn3
*** 2008-03-24 17:02:38.158
Process startup failed, error stack:
ORA-27300: OS system dependent operation:fork failed with status: 12
ORA-27301: OS failure message: Not enough space
ORA-27302: failure occurred at: skgpspawn3

Cause
This issue is mainly caused by lack of memory / swap. Checking the memory configuration on the server, we have found the following:

Total Physical Memory 38912 MB
Swap: Max Size 17664 MiB
So, RAM is 38 GB, SWAP space is only 17 GB

Solution
-We should increase the server swap space (paging space) . The general rule of thumb is that swap space should be:
RAM                              SWAP
1GB to 2GB                   1.5 times RAM
> 2GB and <= 8GB          1 times RAM
> 8GB                            .75 times RAM

So in our case, the recommended swap space is @28 GB .

We can also try to increase physical memory, if possible.

We should also check the ulimits for Oracle user.:
memory - unlimited
data       - unlimited
cpu        - unlimited
stack      - at least 32768
nofile      - OS dependent

We should also check memory parameters in the pfile/spfile that add more load to the memory consumption on the server.  In our issue, we found these settings which added more pressure to the memory:
-lock_sga=true
-large db_keep_cache_size=14000m.
2#
发表于 2008-9-1 11:37 | 只看该作者
不错的案例,建议关键字改成

ORA-27300: OS system dependent operation:fork failed with status: 12
ORA-27301: OS failure message: Not enough space
ORA-27302: failure occurred at: skgpspawn3

使用道具 举报

回复
招聘 : 数据库管理员
论坛徽章:
25
生肖徽章2007版:龙
日期:2008-05-06 11:07:48咸鸭蛋
日期:2011-10-19 10:09:12ITPUB十周年纪念徽章
日期:2011-11-01 16:20:282012新春纪念徽章
日期:2012-01-04 11:49:542013年新春福章
日期:2013-02-25 14:51:24
3#
发表于 2008-9-1 11:39 | 只看该作者

好文

使用道具 举报

回复
论坛徽章:
11
ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44生肖徽章2007版:马
日期:2009-03-10 21:35:10生肖徽章2007版:鼠
日期:2009-03-10 21:26:28生肖徽章2007版:鼠
日期:2009-03-10 21:19:05生肖徽章2007版:龙
日期:2009-03-10 21:14:14授权会员
日期:2008-08-27 09:44:06奥运会纪念徽章:拳击
日期:2008-08-26 18:09:38奥运会纪念徽章:排球
日期:2008-08-20 10:44:26奥运会纪念徽章:沙滩排球
日期:2008-08-14 13:17:472008新春纪念徽章
日期:2008-02-13 12:43:03
4#
发表于 2008-9-1 11:43 | 只看该作者
看了LZ的文章,我想到我们的rac也经常出问题,
内存是8g的,swap却是16g,
rac大概每个月都需要重启一次,不知道是不是和swap的设置有关,
按照LZ所说的,我的swap应该是8g才对吗?

使用道具 举报

回复
论坛徽章:
138
19周年集字徽章-19
日期:2020-06-08 08:30:56马上加薪
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-18 16:42:022014年新春福章
日期:2014-02-18 16:42:02路虎
日期:2013-11-22 12:26:18问答徽章
日期:2014-05-08 12:15:31
5#
发表于 2008-9-1 11:49 | 只看该作者
ORA-27300: OS system dependent operation:fork failed with status: 12

问个问题,我想查aix上,status :12代表什么信息去哪个网站查呢

使用道具 举报

回复
6#
发表于 2008-9-1 12:38 | 只看该作者
原帖由 棉花糖ONE 于 2008-9-1 11:49 发表
ORA-27300: OS system dependent operation:fork failed with status: 12

问个问题,我想查aix上,status :12代表什么信息去哪个网站查呢

我都是去METALINK上和GOOGLE查的

使用道具 举报

回复
论坛徽章:
25
授权会员
日期:2007-08-20 23:44:422011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-02-18 11:42:49管理团队成员
日期:2011-05-07 01:45:082012新春纪念徽章
日期:2012-01-04 11:49:54咸鸭蛋
日期:2012-02-06 17:15:202012新春纪念徽章
日期:2012-02-13 15:11:362012新春纪念徽章
日期:2012-02-13 15:11:362012新春纪念徽章
日期:2012-02-13 15:11:362012新春纪念徽章
日期:2012-02-13 15:11:36
7#
发表于 2008-9-1 12:41 | 只看该作者
是否用了过多的内存,导致交换区不足?
就算只有4G swap,如果内存不是用得特别厉害,也应该会够的。

使用道具 举报

回复
论坛徽章:
97
ITPUB元老
日期:2008-06-30 12:48:39暖羊羊
日期:2015-03-04 14:50:372015年新春福章
日期:2015-03-06 11:57:312010数据库技术大会纪念徽章
日期:2015-04-23 10:33:192011数据库大会纪念章
日期:2015-04-23 10:33:192012数据库大会纪念章
日期:2015-04-23 10:33:192013数据库大会纪念章
日期:2015-04-23 10:33:192014数据库大会纪念章
日期:2015-04-23 10:33:19林肯
日期:2013-10-31 12:31:382013年新春福章
日期:2013-02-25 14:51:24
8#
 楼主| 发表于 2008-9-1 13:25 | 只看该作者
原帖由 magic007 于 2008-9-1 12:41 发表
是否用了过多的内存,导致交换区不足?
就算只有4G swap,如果内存不是用得特别厉害,也应该会够的。


当时的情况看不到了. .在出问题后 , 系统自动reboot了. ..

ram:8g ,  sga 4g 自动管理 , swap 4g

使用道具 举报

回复
论坛徽章:
68
2012新春纪念徽章
日期:2012-01-04 11:51:22奥运会纪念徽章:举重
日期:2012-08-02 22:17:14ITPUB 11周年纪念徽章
日期:2012-10-09 18:07:312013年新春福章
日期:2013-02-25 14:51:24慢羊羊
日期:2015-03-04 14:51:352015年新春福章
日期:2015-03-06 11:57:312015年新春福章
日期:2015-06-11 12:54:06
9#
发表于 2008-9-1 13:29 | 只看该作者
自动REBOOT有可能是CRS造成的

使用道具 举报

回复
论坛徽章:
11
ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44生肖徽章2007版:马
日期:2009-03-10 21:35:10生肖徽章2007版:鼠
日期:2009-03-10 21:26:28生肖徽章2007版:鼠
日期:2009-03-10 21:19:05生肖徽章2007版:龙
日期:2009-03-10 21:14:14授权会员
日期:2008-08-27 09:44:06奥运会纪念徽章:拳击
日期:2008-08-26 18:09:38奥运会纪念徽章:排球
日期:2008-08-20 10:44:26奥运会纪念徽章:沙滩排球
日期:2008-08-14 13:17:472008新春纪念徽章
日期:2008-02-13 12:43:03
10#
发表于 2008-9-1 14:23 | 只看该作者
原帖由 oradbHome 于 2008-9-1 13:25 发表


当时的情况看不到了. .在出问题后 , 系统自动reboot了. ..

ram:8g ,  sga 4g 自动管理 , swap 4g


LZ,swap设置不是应该是ram的2倍吗????
我的ram为8g,swap设置的16g,sga设置3g,使用自动管理,2个节点的rac。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表