楼主: 丸喵喵

【大话IT】炉石传说数据库事故,敲响新年的警钟

[复制链接]
论坛徽章:
27
狮子座
日期:2015-11-13 11:39:31海蓝宝石
日期:2017-04-06 13:47:50祖母绿
日期:2017-04-06 13:48:00萤石
日期:2017-04-06 13:48:10蓝锆石
日期:2017-04-06 13:48:19秀才
日期:2017-04-06 18:09:28秀才
日期:2017-05-09 11:37:55秀才
日期:2017-07-11 13:54:02秀才
日期:2017-07-11 14:19:35秀才
日期:2017-08-18 11:04:35
31#
发表于 2017-2-3 14:30 | 只看该作者
1结合案例,评估一下你自己的系统会不会出现这种情况,你的备份安全吗?你的备份检查过了吗?
个人认为,暂时不会出现这种情况。没有一个备份是安全的吧,只是定期检查,在测试机恢复测试。
2站在你自己的角度分析(仅仅分析而不做评论),这个可能是什么原因导致的。
仅仅是本地备份,未做远程备份,磁盘损坏就无法恢复
3对于预防这类问题你现在的公司是怎么设计和规避的?
公司数据量很小,只是分磁盘备份,没有做这些方面的设计和规避措施

使用道具 举报

回复
论坛徽章:
30
2010新春纪念徽章
日期:2010-03-01 11:08:34喜羊羊
日期:2015-03-16 11:00:26秀才
日期:2015-10-26 09:55:08秀才
日期:2015-11-23 10:17:19秀才
日期:2015-11-30 09:13:06秀才
日期:2015-12-14 15:02:13秀才
日期:2015-12-14 15:09:38秀才
日期:2015-12-25 15:31:10秀才
日期:2016-01-05 09:35:58秀才
日期:2016-01-25 15:02:04
32#
发表于 2017-2-4 17:25 | 只看该作者
DBA最近买了本书叫《教你数据库从入门到删库跑路》

使用道具 举报

回复
论坛徽章:
82
33#
发表于 2017-2-6 08:08 | 只看该作者
让你不给dba涨工资发年终奖

使用道具 举报

回复
论坛徽章:
317
季节之章:春
日期:2012-06-20 17:38:14季节之章:夏
日期:2012-06-12 10:49:25季节之章:秋
日期:2012-06-12 10:49:25季节之章:冬
日期:2012-06-12 10:49:25马上有钱
日期:2014-06-16 15:59:19蓝色妖姬
日期:2012-05-19 11:02:10蓝色妖姬
日期:2012-06-12 11:21:48蓝色妖姬
日期:2012-06-12 11:21:48玉兔
日期:2012-07-27 11:00:12玉兔
日期:2012-08-05 10:00:09
34#
发表于 2017-2-6 09:14 | 只看该作者
1、结合案例,评估一下你自己的系统会不会出现这种情况,你的备份安全吗?你的备份检查过了吗?
理论上没有人敢100%保证自己的系统不出问题,但是,在可承受范围之内,还是有很多功课可以做。
首先是,数据库备份,以及备份集的验证,确保数据库出问题的时候,有可用的备份集恢复。
另外,对于重要的数据库要做双活,灾备,异地灾备,对于不同级别的故障场景,设计不同级别的灾备方案。确保故障发生时,把损失降到最低。
任何时候都不是平时备份,建好灾备就可以高枕无忧。平时的巡检是确保灾难发生时,灾备方案可以及时被按原计划启动。
平时备份的检查,定期切换演练,都是恢复方案可随时启用的关键保证。

2、站在你自己的角度分析(仅仅分析而不做评论),这个可能是什么原因导致的。
事情发展到这一步,已经不能单单只去分析为什么会发生数据库故障。更值得考虑的时,平时制定的应急方案为什么都不可用了?
为了确保数据库故障时可以及时恢复,我们做了备份,以便在数据库需要恢复时从备份集恢复数据;那数据库备份不可用时,应急方案是什么,或者说,如果制定有效的方案确保保留的备份集是可用的?
数据库异常断电,带病工作了2天,没有做有效的补救,是不是存在一定的侥幸心理。

3、对于预防这类问题你现在的公司是怎么设计和规避的?
其实大家用的技术和方案都是差不多的,都是备份、灾备、双活灯方案。
只不过有的工作做的比较规范,确保所做的每一步都是有效的。而有些公司做的比较肤浅,只知期然不知所以然。
只知道每天备份,却不知道备份集是否可用?备份集存放了一周后是否可用?备份集转移了存储后是否可用?
只知道做了灾备,不知道一年后灾备是否可以正常切换,不知道一年前的灾备切换手册,一年后是否正常可用。

使用道具 举报

回复
论坛徽章:
190
生肖徽章:狗
日期:2006-11-23 04:26:03生肖徽章:羊
日期:2007-09-26 17:08:21生肖徽章:马
日期:2007-09-26 17:08:49授权会员
日期:2007-12-31 19:14:41生肖徽章2007版:牛
日期:2008-03-28 10:02:30奥运会纪念徽章:柔道
日期:2008-04-30 16:28:44奥运会纪念徽章:垒球
日期:2008-05-12 21:28:28奥运会纪念徽章:体操
日期:2008-06-26 10:00:41奥运会纪念徽章:沙滩排球
日期:2008-07-27 12:41:59奥运会纪念徽章:艺术体操
日期:2008-07-30 11:09:47
35#
发表于 2017-2-6 09:17 | 只看该作者
迷倪小魏 发表于 2017-1-20 11:37
关于炉石传说的Oracle数据库故障不要以为你也可以幸免

备份重于一切!!!最近公司也在主导灾备演练事项 ...

按理即使出现坏库,也应该可以通过不完全恢复+14日到16日的归档来追到最新时刻。
文中说故障只恢复到14日,说明归档都坏掉了或者说根本没有备份归档日志?

使用道具 举报

回复
论坛徽章:
2110
亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18亚特兰大老鹰
日期:2015-01-05 11:33:18
36#
发表于 2017-2-6 09:19 | 只看该作者
年底不发红包,大家心情都不好。。。。

使用道具 举报

回复
论坛徽章:
5
ITPUB 11周年纪念徽章
日期:2012-10-09 18:16:00秀才
日期:2017-02-22 15:18:00秀才
日期:2017-03-02 10:35:32秀才
日期:2017-04-06 13:41:23秀才
日期:2017-04-06 13:42:06
37#
发表于 2017-2-6 15:52 | 只看该作者
1结合案例,评估一下你自己的系统会不会出现这种情况,你的备份安全吗?你的备份检查过了吗?
数据库备份工作肯定要做好的。
2站在你自己的角度分析(仅仅分析而不做评论),这个可能是什么原因导致的。
数据异常需要修复这个情况肯定是有遇到过的,但是案例中没有及时发现是比较严重的。
3对于预防这类问题你现在的公司是怎么设计和规避的?
同城双活、异地容灾。

使用道具 举报

回复
论坛徽章:
59
2013年新春福章
日期:2013-02-25 11:02:12双鱼座
日期:2015-07-31 08:13:07秀才
日期:2015-08-24 09:44:20秀才
日期:2015-08-24 09:51:48秀才
日期:2015-10-19 15:50:39ITPUB14周年纪念章
日期:2015-10-26 17:23:44秀才
日期:2015-11-30 09:59:23秀才
日期:2015-12-14 15:02:13秀才
日期:2015-12-21 09:48:11秀才
日期:2016-01-21 13:37:04
38#
发表于 2017-2-7 13:43 | 只看该作者
感觉像是误操作了

使用道具 举报

回复
论坛徽章:
512
2012新春纪念徽章
日期:2012-01-04 11:53:54ITPUB十周年纪念徽章
日期:2011-11-01 16:23:26股神
日期:2012-01-05 10:29:02天枰座
日期:2015-09-16 09:05:30指数菠菜纪念章
日期:2015-07-01 16:40:43喜羊羊
日期:2015-06-30 09:06:18指数菠菜纪念章
日期:2015-04-02 09:22:462015年新春福章
日期:2015-03-06 11:58:18懒羊羊
日期:2015-03-04 14:52:11指数菠菜纪念章
日期:2015-01-04 11:09:18
39#
发表于 2017-2-8 09:25 | 只看该作者
感觉是一连串的误操作引发的杯具。猜测开始的时候只是存储出了一点小故障,存储维护人员按照例行的流程进行处理,但是操作过程又出了错,导致存储出现不可逆转的故障,接着导致整个数据库的不一致,然后试图通过DG做切换,结果然并卵,然后就没有然后了。发现这么大的事故的原因,人为因素应该占了比较大的部分,责任心、担当不到位,其次是系统的架构设计,好比前面多位都提到的RAC、DG、备份应该使用独立的存储等等,最后就是应急预案、故障切换演练、备份有效性检查这些应该都是比较欠缺的。

使用道具 举报

回复
论坛徽章:
2
优秀写手
日期:2015-02-13 06:00:15秀才
日期:2017-02-22 15:18:00
40#
发表于 2017-2-9 11:35 | 只看该作者
是放在同一个存储上的吧,不然怎么备份都不行了呢

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表