|
1、结合案例,评估一下你自己的系统会不会出现这种情况,你的备份安全吗?你的备份检查过了吗?
理论上没有人敢100%保证自己的系统不出问题,但是,在可承受范围之内,还是有很多功课可以做。
首先是,数据库备份,以及备份集的验证,确保数据库出问题的时候,有可用的备份集恢复。
另外,对于重要的数据库要做双活,灾备,异地灾备,对于不同级别的故障场景,设计不同级别的灾备方案。确保故障发生时,把损失降到最低。
任何时候都不是平时备份,建好灾备就可以高枕无忧。平时的巡检是确保灾难发生时,灾备方案可以及时被按原计划启动。
平时备份的检查,定期切换演练,都是恢复方案可随时启用的关键保证。
2、站在你自己的角度分析(仅仅分析而不做评论),这个可能是什么原因导致的。
事情发展到这一步,已经不能单单只去分析为什么会发生数据库故障。更值得考虑的时,平时制定的应急方案为什么都不可用了?
为了确保数据库故障时可以及时恢复,我们做了备份,以便在数据库需要恢复时从备份集恢复数据;那数据库备份不可用时,应急方案是什么,或者说,如果制定有效的方案确保保留的备份集是可用的?
数据库异常断电,带病工作了2天,没有做有效的补救,是不是存在一定的侥幸心理。
3、对于预防这类问题你现在的公司是怎么设计和规避的?
其实大家用的技术和方案都是差不多的,都是备份、灾备、双活灯方案。
只不过有的工作做的比较规范,确保所做的每一步都是有效的。而有些公司做的比较肤浅,只知期然不知所以然。
只知道每天备份,却不知道备份集是否可用?备份集存放了一周后是否可用?备份集转移了存储后是否可用?
只知道做了灾备,不知道一年后灾备是否可以正常切换,不知道一年前的灾备切换手册,一年后是否正常可用。 |
|