楼主: 丸喵喵

【大话IT】炉石传说数据库事故,敲响新年的警钟

[复制链接]
论坛徽章:
19
秀才
日期:2015-12-14 15:02:13秀才
日期:2017-05-09 11:37:55秀才
日期:2017-04-06 18:09:28秀才
日期:2017-03-28 15:59:38秀才
日期:2017-03-28 15:11:09秀才
日期:2017-03-27 17:42:03秀才
日期:2017-03-20 13:42:20秀才
日期:2017-03-01 13:53:39秀才
日期:2017-02-22 15:18:00秀才
日期:2017-02-22 15:16:26
21#
发表于 2017-1-22 14:09 | 只看该作者
这个问题的发生我认为和公司管理有很大关系,许多公司根本不重视运维,一出现问题就傻眼了

使用道具 举报

回复
论坛徽章:
4
2017金鸡报晓
日期:2017-02-08 14:09:13秀才
日期:2017-02-22 15:14:12秀才
日期:2017-02-22 15:18:00秀才
日期:2017-03-28 15:59:38
22#
发表于 2017-1-22 21:37 | 只看该作者
年终奖没有了

使用道具 举报

回复
论坛徽章:
77
20周年集字徽章-周
日期:2020-10-28 14:51:04秀才
日期:2017-03-28 15:11:09秀才
日期:2017-03-20 13:42:20秀才
日期:2017-03-01 13:53:39秀才
日期:2017-02-22 15:18:00秀才
日期:2017-02-22 15:16:26秀才
日期:2017-02-22 15:14:12进士
日期:2017-02-20 09:43:02举人
日期:2017-02-20 09:42:18进士
日期:2017-02-20 09:42:18
23#
发表于 2017-1-22 23:31 | 只看该作者
dba还是有价值的

使用道具 举报

回复
论坛徽章:
836
状元
日期:2015-11-12 10:18:05榜眼
日期:2015-11-12 10:18:05探花
日期:2015-11-12 10:18:05进士
日期:2015-11-12 10:18:05举人
日期:2015-09-11 13:42:08秀才
日期:2015-09-17 09:11:05至尊黑钻
日期:2015-11-20 18:17:09紫钻
日期:2015-11-20 18:18:06粉钻
日期:2015-11-20 18:17:23绿钻
日期:2015-11-20 18:17:48
24#
发表于 2017-1-23 11:19 | 只看该作者
备份肯定很大,然后就不搞还原测试了呗

使用道具 举报

回复
论坛徽章:
82
2013系统架构师大会纪念章
日期:2015-07-31 17:48:20探花
日期:2015-08-17 14:58:32榜眼
日期:2015-08-17 14:59:28进士
日期:2015-08-17 15:00:55举人
日期:2015-08-17 15:00:55秀才
日期:2015-08-19 09:36:37秀才
日期:2015-08-20 08:50:41嫦娥
日期:2015-08-21 09:11:54秀才
日期:2015-08-24 09:48:07进士
日期:2015-08-17 14:58:18
25#
发表于 2017-1-23 14:55 | 只看该作者
1结合案例,评估一下你自己的系统会不会出现这种情况,你的备份安全吗?你的备份检查过了吗?
根据对目前产品DB备份的了解,应该是不会出现这种问题,备份与db不在统一环境,相对安全。
2站在你自己的角度分析(仅仅分析而不做评论),这个可能是什么原因导致的。
如上面各位所说,肯定是备份机制不完善导致;切换演练不够充分,没有预见危险发生并制定充分的补救方案

3对于预防这类问题你现在的公司是怎么设计和规避的?
目前是有专职的dba负责数据备份、恢复的,并有相对完善的报警通知机制,并制定了相对完整的恢复预案,尽可能充分考虑可能遇到的问题并及时进行恢复

使用道具 举报

回复
论坛徽章:
7
秀才
日期:2015-12-14 15:02:13秀才
日期:2016-02-18 09:31:522016猴年福章
日期:2016-02-23 09:58:342017金鸡报晓
日期:2017-02-08 14:09:13秀才
日期:2017-02-22 15:18:00秀才
日期:2017-09-18 17:01:19秀才
日期:2017-12-12 10:15:55
26#
发表于 2017-1-24 14:37 | 只看该作者
备份ADG库应该在第一时间站出来抗顶。备份ADG有问题,服务器可能是位于同一机房,存储位于同一存储,
备份盘没有很好的功能划分,日常确认有效的融灾功能测试,烦此种种。
备份终于泰山,即使日常的备份无法做到异地,多版本的备份和容灾演练还是需要的,此次也算亡羊补牢吧。

使用道具 举报

回复
论坛徽章:
571
NBA季后赛纪念徽章
日期:2012-06-25 12:19:11洛杉矶快船
日期:2014-06-16 11:45:27NBA常规赛纪念章
日期:2013-04-22 11:49:35NBA季后赛纪念徽章
日期:2011-06-13 11:34:51NBA常规赛纪念章
日期:2011-04-15 13:34:11NBA季后赛纪念徽章
日期:2013-06-21 14:52:05NBA常规赛纪念章
日期:2012-04-27 16:07:05生肖徽章:羊
日期:2014-08-15 14:12:01ITPUB9周年纪念徽章
日期:2016-10-28 17:00:11ITPUB9周年纪念徽章
日期:2016-10-28 17:00:11
27#
发表于 2017-1-24 15:07 | 只看该作者
銀行這樣玩不是要死?

使用道具 举报

回复
论坛徽章:
54
秀才
日期:2017-02-22 15:18:002015年新春福章
日期:2015-03-06 11:57:31懒羊羊
日期:2015-03-04 14:48:16马上有对象
日期:2014-10-24 17:37:552014年世界杯参赛球队: 比利时
日期:2014-08-05 11:35:382014年世界杯参赛球队: 阿根廷
日期:2014-07-15 10:49:33马上有车
日期:2014-02-18 16:41:112014年新春福章
日期:2014-02-18 16:41:11路虎
日期:2014-01-02 12:55:56ITPUB社区12周年站庆徽章
日期:2013-10-08 15:00:34
28#
发表于 2017-1-25 09:32 | 只看该作者
1结合案例,评估一下你自己的系统会不会出现这种情况,你的备份安全吗?你的备份检查过了吗?
安全,不定时有恢复(比如找误删除数据,或某个时间点数据状态),有DBA的场景不会出现这样的低级错误,除非受非技术因素所影响

2站在你自己的角度分析(仅仅分析而不做评论),这个可能是什么原因导致的。
管理问题,也可以说是政治问题。不太相信其公司没有DBA,不太相信其公司的DBA没有备份这么一个最基本的观念、习惯
可能是老板(可能是部门领导或者是负责预算的人)觉得系统运行得好好的,干嘛要投入备份存储资源,或灾备资源,这属于认知层面

3对于预防这类问题你现在的公司是怎么设计和规避的?
就是个最基本的异机备份而已,全备(可能含差异)+日志
如果要防单点(公司内或一个IDC内)故障,那就是异机
如果要防单地区故障,那就异地,比如银行及BAT、国防的数据等,防止如地震、火灾类似的情况
安全级别不同,投入成本也不同

使用道具 举报

回复
论坛徽章:
111
ITPUB9周年纪念徽章
日期:2010-10-08 09:34:03马上有房
日期:2014-02-18 16:42:02马上有车
日期:2014-03-20 10:09:22马上有钱
日期:2014-03-20 15:53:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11马上有钱
日期:2014-03-20 16:14:11马上有对象
日期:2014-03-20 16:14:11马上加薪
日期:2014-03-20 16:14:11技术图书徽章
日期:2014-03-27 09:30:56
29#
发表于 2017-1-26 15:32 | 只看该作者

先说说官方给的电力问题的解释

如果归因在电力问题,那可以解释过去,不过也存在一些问题,先说说解释的问题

1.  电力故障是机房中最严重的故障问题,不仅仅涉及到数据库,同时涉及到其他的业务,比如前台访问均出现问题,并且由于机房电力故障,对于正在高速读写的存储来说灾难性比较大,
这也就造成了,数据可能会丢失。
     举例:我们机房原来发生过一个机柜出现断电,造成数据库对应的部分数据变成不可读,好在是OLAP系统,数据可以再生成,影响不大。

2.  由于异常断电,可能灾备会出现问题,数据没有及时同步过去,造成数据丢失,同时如果没有灾备,数据绝对就会丢失了,但是灾备和生产是在一个机房么? 这是需要考虑的?


除官方给的说明外,我觉得也有几方面造成这样的问题
1. 数据被误操作,包含灾备的数据,同时被误操作。
2. 数据容灾或者备份不到位,真正要启动备份,发现根本不可行。
...................

使用道具 举报

回复
30#
发表于 2017-1-27 16:40 | 只看该作者
2.站在你自己的角度分析(仅仅分析而不做评论),这个可能是什么原因导致的。
  没有验证备份的有有效性,导致出问题时,应用备份出现问题。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表