查看: 46213|回复: 6

ASM磁盘超过disk_repair_time导致磁盘状态为forcing

[复制链接]
论坛徽章:
0
发表于 2015-12-3 15:40 | 显示全部楼层 |阅读模式
今天一大早来单位一看,两个asm磁盘超过disk_repair_time被干掉了

SQL> select group_number,disk_number,STATE,PATH,NAME,failgroup from v$asm_disk;

GROUP_NUMBER DISK_NUMBER STATE    PATH                                     NAME                           FAILGROUP
------------ ----------- -------- ---------------------------------------- ------------------------------ ------------------------------
           0           0 NORMAL   /dev/mapper/mpathg
           0           1 NORMAL   /dev/mapper/mpathf
           2           1 NORMAL                                            OCR_0001                       OCR_0001
           1           1 FORCING                                           _DROPPED_0001_DATA             DATA_0001
           1           0 FORCING                                           _DROPPED_0000_DATA             DATA_0000
           0           2 NORMAL   /dev/mapper/mpathcp2
           0           3 NORMAL   /dev/mapper/mpathdp2
           0           8 NORMAL   /dev/mapper/mpathe
           0           9 NORMAL   /dev/mapper/mpathc
           0          10 NORMAL   /dev/mapper/mpathd
           0          11 NORMAL   /dev/mapper/mpathb

GROUP_NUMBER DISK_NUMBER STATE    PATH                                     NAME                           FAILGROUP
------------ ----------- -------- ---------------------------------------- ------------------------------ ------------------------------
           0          12 NORMAL   /dev/mapper/vg_rac01-lv_swap
           2           2 NORMAL   /dev/mapper/mpathdp1                     OCR_0002                       OCR_0002
           1           2 NORMAL   /dev/mapper/mpathbp2                     DATA_0002                      DATA_0002
           2           0 NORMAL   /dev/mapper/mpathbp1                     OCR_0000                       OCR_0000
           2           3 NORMAL   /dev/mapper/mpathcp1                     OCR_0003                       OCR_0003


幸好我的磁盘组是high冗余的。
试着online一下不管用

SQL> ALTER DISKGROUP DATA ONLINE DISKS IN FAILGROUP DATA_0001 NOWAIT;
ALTER DISKGROUP DATA ONLINE DISKS IN FAILGROUP DATA_0001 NOWAIT
*
ERROR at line 1:
ORA-15032: not all alterations performed
ORA-15281: not all specified disks were brought ONLINE
ORA-15284: ASM terminated ALTER DISKGROUP ONLINE


查了一下v$asm_disk 的官方文档说明

FORCING - Disk is being removed from the disk group without attempting to offload its data. The data will be recovered from redundant copies, where possible.

难道我这个情况是impossible?

网上查了一些资料,并没有找到有用的方法,只能使用最简单粗暴的dd了!

[root@rac01 ~]#  dd if='/dev/zero' of='/dev/mapper/mpathdp2' bs=20000 count=10000;
[root@rac01 ~]#  dd if='/dev/zero' of='/dev/mapper/mpathcp2' bs=20000 count=10000;

然后加回磁盘


SQL> alter diskgroup data add FAILGROUP DATA_0000 disk '/dev/mapper/mpathdp2' name DATA_0000 FAILGROUP DATA_0001 DISK '/dev/mapper/mpathcp2' name DATA_0001;

Diskgroup altered.


此时已完成了加回,但是_DROPPED开头的磁盘仍然存在,感觉就像痔疮。。
SQL> select GROUP_NUMBER,STATE,name,path,REPAIR_TIMER from v$asm_disk;

GROUP_NUMBER STATE    NAME                           PATH                                     REPAIR_TIMER
------------ -------- ------------------------------ ---------------------------------------- ------------
           0 NORMAL                                  /dev/mapper/mpathg                                  0
           0 NORMAL                                  /dev/mapper/mpathf                                  0
           2 NORMAL   OCR_0001                                                                       27630
           1 FORCING  _DROPPED_0001_DATA                                                                 0
           1 FORCING  _DROPPED_0000_DATA                                                                 0
           0 NORMAL                                  /dev/mapper/vg_rac01-lv_swap                        0
           0 NORMAL                                  /dev/mapper/mpathb                                  0
           0 NORMAL                                  /dev/mapper/mpathe                                  0
           0 NORMAL                                  /dev/mapper/mpathc                                  0
           0 NORMAL                                  /dev/mapper/mpathd                                  0
           2 NORMAL   OCR_0002                       /dev/mapper/mpathdp1                                0

GROUP_NUMBER STATE    NAME                           PATH                                     REPAIR_TIMER
------------ -------- ------------------------------ ---------------------------------------- ------------
           1 NORMAL   DATA_0002                      /dev/mapper/mpathbp2                                0
           2 NORMAL   OCR_0000                       /dev/mapper/mpathbp1                                0
           1 NORMAL   DATA_0001                      /dev/mapper/mpathcp2                                0
           1 NORMAL   DATA_0000                      /dev/mapper/mpathdp2                                0
           2 NORMAL   OCR_0003                       /dev/mapper/mpathcp1                                0


查看 v$asm_operation
SQL> select * from v$asm_operation;

GROUP_NUMBER OPERA STAT      POWER     ACTUAL      SOFAR   EST_WORK   EST_RATE
------------ ----- ---- ---------- ---------- ---------- ---------- ----------
EST_MINUTES ERROR_CODE
----------- --------------------------------------------
           1 REBAL RUN           1          1       4101     246529      15573
         15

待operation完成后再查询v$asm_disk

SQL> select GROUP_NUMBER,STATE,name,path,failgroup,REPAIR_TIMER from v$asm_disk where group_number=1;


GROUP_NUMBER STATE    NAME                           PATH                                     FAILGROUP                      REPAIR_TIMER
------------ -------- ------------------------------ ---------------------------------------- ------------------------------ ------------
           1 NORMAL   DATA_0002                      /dev/mapper/mpathbp2                     DATA_0002                                 0
           1 NORMAL   DATA_0001                      /dev/mapper/mpathcp2                     DATA_0001                                 0
           1 NORMAL   DATA_0000                      /dev/mapper/mpathdp2                     DATA_0000                                 0



_drop 开头的磁盘已经被oracle标记为不可用从v$asm_disk干掉了。


那么问题来了:
1:除了dd还有木有别的方法?
2:大家的disk_repair_time 一般设置多久?感觉要是你盘坏了,24小时都不一定够换的。
3:FORCING - Disk is being removed from the disk group without attempting to offload its data. The data will be recovered from redundant copies, where possible. 这句话到底怎么理解? 啥叫where possible









论坛徽章:
120
现任管理团队成员
日期:2011-05-07 01:45:08乌索普
日期:2019-02-14 23:54:04
发表于 2015-12-7 16:15 | 显示全部楼层
1. 没有
2. disk repair time是给计划性offline磁盘使用的,不是给磁盘损坏用的~
3.前面是逗号,翻译后: 数据库会从可能的位置上通过冗余副本来进行恢复~

使用道具 举报

回复
论坛徽章:
0
 楼主| 发表于 2015-12-14 17:03 | 显示全部楼层
zergduan 发表于 2015-12-7 16:15
1. 没有
2. disk repair time是给计划性offline磁盘使用的,不是给磁盘损坏用的~
3.前面是逗号,翻译后: ...

感觉forcing后一般都恢复不了。。。这个where possible就像impossible一样

使用道具 举报

回复
认证徽章
论坛徽章:
6
暖羊羊
日期:2015-03-04 14:53:002015年新春福章
日期:2015-03-06 11:58:39ITPUB社区OCM联盟徽章
日期:2015-03-30 12:59:19现任管理团队成员
日期:2016-02-27 02:09:57版主1段
日期:2016-02-27 02:09:58火眼金睛
日期:2016-02-29 22:00:01
发表于 2015-12-23 11:25 | 显示全部楼层
超过repair的时间后,只能通过全量同步这张盘的数据进行恢复,否则没有其他办法

使用道具 举报

回复
认证徽章
论坛徽章:
25
咸鸭蛋
日期:2012-04-19 22:15:41技术图书徽章
日期:2016-11-05 10:34:54弗兰奇
日期:2016-12-04 22:53:10托尼托尼·乔巴
日期:2016-12-29 12:51:28蒙奇·D·路飞
日期:2017-03-17 17:18:21罗罗诺亚·索隆
日期:2017-03-17 17:24:44山治
日期:2017-04-21 13:55:28娜美
日期:2017-05-19 14:49:04技术图书徽章
日期:2017-07-10 17:12:09托尼托尼·乔巴
日期:2018-02-01 10:07:45
发表于 2016-1-22 12:38 | 显示全部楼层
从新执行alter diskgroup data add disk 'xxxxx' force;多执行几次就成功了,有类似这样的经历。

使用道具 举报

回复
论坛徽章:
0
发表于 2016-11-25 16:34 | 显示全部楼层
desert_xu 发表于 2016-1-22 12:38
从新执行alter diskgroup data add disk 'xxxxx' force;多执行几次就成功了,有类似这样的经历。

又强制一次成功加上去了,但是那块处于forcing状态的还存在。
请问,你那里也是这样子么?

使用道具 举报

回复
论坛徽章:
120
现任管理团队成员
日期:2011-05-07 01:45:08乌索普
日期:2019-02-14 23:54:04
发表于 2016-11-25 16:43 | 显示全部楼层
白头叶猴 发表于 2016-11-25 16:34
又强制一次成功加上去了,但是那块处于forcing状态的还存在。
请问,你那里也是这样子么?

等! 等rebalance完成,foceing_dropped_的信息就会消失

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 
京ICP备09055130号-4  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表