ITPUB论坛-中国最专业的IT技术社区

 找回密码
 注册
查看: 583|回复: 9

oracle 10g数据库挂起 ksvcreate: Process(m001) creation failed

[复制链接]
论坛徽章:
1
雪佛兰
日期:2013-12-11 10:58:39
发表于 2017-5-17 16:33 | 显示全部楼层 |阅读模式
本帖最后由 zbhero2010 于 2017-5-17 16:42 编辑

linux服务器上装有oracle 10g,最近报了一次错,alert日志中有:
Mon May 15 10:02:18 2017
ksvcreate: Process(m001) creation failed
Mon May 15 10:13:06 2017
kkjcre1p: unable to spawn jobq slaveprocess
Mon May 15 10:13:06 2017
Errors in file/u01/app/oracle/admin/ora10g/bdump/ora10g_cjq0_15919.trc:


导致数据库挂起,sqlplus无法进入。查网上的资料说可能是跟以下原因有关:
1、参数job_queue_processes设置过小。
2、参数sessionprocesses设置的会话数及连接数不能满足业务需求。
3、参数pga_aggregate_target被耗尽。
4OS资源被耗尽。

现在基本可以排除以上3点,第4点资源耗尽。现在分析可能跟资源耗尽有关。
直接kill -9 smon进程,再启动oracle
file:///C:/Users/Think/AppData/Local/Temp/msohtmlclip1/01/clip_image006.jpg
内存使用率一直在增长。
ORACLE的内存分配:
SQL> show parameter sga

NAME                                     TYPE         VALUE
------------------------------------ ----------- ------------------------------
lock_sga                             boolean         FALSE
pre_page_sga                             boolean         FALSE
sga_max_size                             big integer 80G
sga_target                             big integer 80000M
SQL> show parameter pga

NAME                                     TYPE         VALUE
------------------------------------ ----------- ------------------------------
pga_aggregate_target                     big integer 9657M
file:///C:/Users/Think/AppData/Local/Temp/msohtmlclip1/01/clip_image008.jpg
操作系统内存:98G.

请大神分析下是什么原因导致了数据库的挂起,以及为什么内存一直在增长,担心某一天用到SWAP的一定程序又引进挂起!

出问题时的TOP

出问题时的TOP

启动后的TOP

启动后的TOP

两天后的TOP

两天后的TOP
论坛徽章:
1
雪佛兰
日期:2013-12-11 10:58:39
 楼主| 发表于 2017-5-17 16:45 | 显示全部楼层
ora10g_cjq0_15919.trc文件的部分内容:

*** 2017-05-15 10:12:04.438
Waited for process J003 to initialize for 60 seconds
*** 2017-05-15 10:12:04.444
Dumping diagnostic information for J003:
OS pid = 4540
loadavg : 0.01 0.19 0.24
memory info: free memory = 0.00M
swap info:   free = 0.00M alloc = 0.00M total = 0.00M
F S UID        PID  PPID  C PRI  NI ADDR SZ WCHAN  STIME TTY          TIME CMD
0 S oracle    4540     1  0  78   0 - 21008800 semtim 10:11 ?     00:00:00 ora_j003_ora10g
[Thread debugging using libthread_db enabled]
warning: no loadable sections found in added symbol-file system-supplied DSO at 0x7fffa25fc000
0x00000039830d5497 in semop () from /lib64/libc.so.6
#0  0x00000039830d5497 in semop () from /lib64/libc.so.6
#1  0x0000000003c18752 in sskgpwwait ()
#2  0x0000000003bfb748 in skgpwwait ()
#3  0x000000000079fd6d in kslges ()
#4  0x000000000079f710 in kslgetl ()
#5  0x00000000007abcee in ksfglt ()
#6  0x0000000003b7727d in kghfrunp ()
#7  0x0000000003b9888a in kghfnd ()

使用道具 举报

回复
论坛徽章:
116
现任管理团队成员
日期:2011-05-07 01:45:08娜美
日期:2017-08-29 10:15:28
发表于 2017-5-17 17:08 | 显示全部楼层
memory info: free memory = 0.00M
swap info:   free = 0.00M alloc = 0.00M total = 0.00M

trace里面写的好诡异

使用道具 举报

回复
论坛徽章:
116
现任管理团队成员
日期:2011-05-07 01:45:08娜美
日期:2017-08-29 10:15:28
发表于 2017-5-17 17:20 | 显示全部楼层
warning: no loadable sections found in added symbol-file system-supplied DSO at

这段明显在做croe dump,操作系统上的segment fault。。。
应该是个bug

你的数据库什么版本,这样的bug应该不会出现在10.2.0.5上

使用道具 举报

回复
论坛徽章:
1
雪佛兰
日期:2013-12-11 10:58:39
 楼主| 发表于 2017-5-17 17:24 | 显示全部楼层
zergduan 发表于 2017-5-17 17:20
warning: no loadable sections found in added symbol-file system-supplied DSO at

这段明显在做croe ...

数据库是10.2.0.4的。这是个BUG?  
我的问题跟OS资源有关吗?

使用道具 举报

回复
论坛徽章:
116
现任管理团队成员
日期:2011-05-07 01:45:08娜美
日期:2017-08-29 10:15:28
发表于 2017-5-17 17:31 | 显示全部楼层
zbhero2010 发表于 2017-5-17 17:24
数据库是10.2.0.4的。这是个BUG?  
我的问题跟OS资源有关吗?

嗯bug,升级到10.2.0.5或者10.2.0.4.2

使用道具 举报

回复
论坛徽章:
1
雪佛兰
日期:2013-12-11 10:58:39
 楼主| 发表于 2017-5-17 17:34 | 显示全部楼层
zergduan 发表于 2017-5-17 17:31
嗯bug,升级到10.2.0.5或者10.2.0.4.2

那我升级下。是什么原因触发了这个BUG呢,该数据库运行了2年多了,一直没出现这问题。

使用道具 举报

回复
论坛徽章:
1
雪佛兰
日期:2013-12-11 10:58:39
 楼主| 发表于 2017-5-17 17:35 | 显示全部楼层
zergduan 发表于 2017-5-17 17:31
嗯bug,升级到10.2.0.5或者10.2.0.4.2

另外,你知道是哪个BUG吗?多谢您!

使用道具 举报

回复
论坛徽章:
116
现任管理团队成员
日期:2011-05-07 01:45:08娜美
日期:2017-08-29 10:15:28
发表于 2017-5-17 17:44 | 显示全部楼层
Bug 8426816 - PMON may hang cleaning up a dead process (rare) (Doc ID 8426816.8)

Database goes in hang mode.
No new connections are able to connect or able to perform any operations on existing connections
The alert.log shows enteries like following:
ksvcreate: Process(m001) creation failed
Thu Oct 7 22:17:37 2010
kkjcre1p: unable to spawn jobq slave process
Thu Oct 7 22:17:37 2010
Systemstate dump shows following errorstack by PMON:
OSD pid info: Unix process pid: 1519850, image: oracle@wpcdbqa (PMON)

errorstack
kksLockWait+01fc<-kgxWait+0168<-kgxExclusive+00bc<-kksFreeHeapGetMutex+0228<-kksCursorFreeCallBack+0088<-kgllccl+13cc<-kgllcu+01b4
waiting for 'cursor: pin X' blocking sess=0x0 seq=8166 wait_time=0 seconds since wait started=0
     idn=6e0a6074, value=20600000000, where|sleeps=b003c1e3a
Dumping Session Wait History

使用道具 举报

回复
论坛徽章:
1
雪佛兰
日期:2013-12-11 10:58:39
 楼主| 发表于 2017-5-17 17:57 | 显示全部楼层
zergduan 发表于 2017-5-17 17:44
Bug 8426816 - PMON may hang cleaning up a dead process (rare) (Doc ID 8426816.8)

Database goes in ...

多谢多谢!

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

TOP技术积分榜 社区积分榜 徽章 电子杂志 团队 统计 虎吧 老博客 知识索引树 读书频道 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档 | IT博客
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛 | SAP ERP系统
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 网站律师 隐私政策 知识产权声明
京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表