楼主: 440活在梦里

【大话IT】阿里云误删文件是哪一环节出了错?

[复制链接]
论坛徽章:
18
秀才
日期:2015-07-30 08:52:40秀才
日期:2016-02-18 10:08:14秀才
日期:2016-02-18 09:24:30秀才
日期:2016-01-25 15:02:04秀才
日期:2016-01-13 12:14:26SQL大赛参与纪念
日期:2016-01-13 10:32:19秀才
日期:2015-12-25 15:31:10秀才
日期:2015-11-23 10:17:19秀才
日期:2015-11-11 10:22:49秀才
日期:2015-11-11 10:07:14
41#
发表于 2015-9-7 08:43 | 只看该作者
6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
强化各种针对边界异常的测试,找出隐藏的BUG。 加强单元测试、集成测试、验收测试。 加强模拟现场演练测试。 这明显是测试疏忽导致。

使用道具 举报

回复
论坛徽章:
22
ITPUB 11周年纪念徽章
日期:2012-10-09 18:09:19秀才
日期:2015-09-21 11:16:42秀才
日期:2015-10-08 15:07:00秀才
日期:2015-10-08 17:57:58秀才
日期:2015-10-19 15:49:55秀才
日期:2015-11-11 10:22:49秀才
日期:2015-11-12 17:43:40秀才
日期:2015-11-23 10:17:19秀才
日期:2015-11-30 09:59:23秀才
日期:2015-12-14 15:02:13
42#
发表于 2015-9-7 10:31 | 只看该作者
话题讨论:
1:你认为此次事件的根本原因是什么?
一些组织者的责任心不够 ,对操作风险预估不足。。

使用道具 举报

回复
论坛徽章:
22
问答徽章
日期:2014-01-06 16:50:41秀才
日期:2015-10-26 09:55:08秀才
日期:2015-11-11 09:48:44秀才
日期:2015-11-11 10:22:49秀才
日期:2015-11-12 17:43:40秀才
日期:2015-12-14 15:02:13秀才
日期:2016-01-21 13:42:39秀才
日期:2016-01-25 14:55:31秀才
日期:2016-02-18 10:08:14秀才
日期:2016-03-24 09:20:52
43#
发表于 2015-9-7 11:16 | 只看该作者
1:你认为此次事件的根本原因是什么?
      缺乏云运维经验
2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
     应该有备份,但回滚到任何时间都有可能有用户数据丢失。这不是根本解决之道
3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
     缺乏应急处理能力,也有可能是人为,携程的事过去不远
4:如果你是此事件对应的技术人员,你会如何应对此事件?
     上报,请上级出对策
5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
    被黑了吧
6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
     产品上线、升级,经过充分测试

使用道具 举报

回复
论坛徽章:
95
秀才
日期:2015-10-08 17:57:58法拉利
日期:2013-12-30 15:11:23问答徽章
日期:2013-12-26 12:24:32优秀写手
日期:2013-12-18 09:29:13本田
日期:2013-12-09 10:02:28兰博基尼
日期:2013-11-18 17:44:52宝马
日期:2013-11-06 11:34:13雪佛兰
日期:2013-11-01 18:36:15宝马
日期:2013-10-25 08:22:20路虎
日期:2014-01-20 14:09:03
44#
发表于 2015-9-7 15:10 | 只看该作者
wufzui grliwft

使用道具 举报

回复
论坛徽章:
71
ITPUB元老
日期:2009-11-30 15:55:11授权会员
日期:2009-11-30 11:36:17ITPUB季度 技术新星
日期:2010-08-31 10:47:25优秀写手
日期:2014-12-24 06:00:14ITPUB8周年纪念徽章
日期:2009-09-27 10:21:20祖国60周年纪念徽章
日期:2009-10-09 08:28:00奔驰
日期:2013-10-20 13:32:09数据库板块每日发贴之星
日期:2008-10-03 01:02:14数据库板块每日发贴之星
日期:2009-11-23 01:01:03数据库板块每日发贴之星
日期:2010-07-27 01:01:02
45#
发表于 2015-9-7 16:55 | 只看该作者
云出了问题,云中的客户就都受影响,所以客户一定要自己备份。

使用道具 举报

回复
论坛徽章:
71
ITPUB元老
日期:2009-11-30 15:55:11授权会员
日期:2009-11-30 11:36:17ITPUB季度 技术新星
日期:2010-08-31 10:47:25优秀写手
日期:2014-12-24 06:00:14ITPUB8周年纪念徽章
日期:2009-09-27 10:21:20祖国60周年纪念徽章
日期:2009-10-09 08:28:00奔驰
日期:2013-10-20 13:32:09数据库板块每日发贴之星
日期:2008-10-03 01:02:14数据库板块每日发贴之星
日期:2009-11-23 01:01:03数据库板块每日发贴之星
日期:2010-07-27 01:01:02
46#
发表于 2015-9-7 16:56 | 只看该作者
搞运维的,三思而后行。

使用道具 举报

回复
论坛徽章:
737
季节之章:春
日期:2015-07-31 17:16:29ITPUB季度 技术新星
日期:2014-07-17 14:37:00季节之章:秋
日期:2015-07-31 17:16:14季节之章:夏
日期:2015-07-31 17:16:29股神
日期:2014-10-15 09:23:31衰神
日期:2014-10-20 22:47:12季节之章:冬
日期:2015-07-31 17:16:14红钻
日期:2014-12-16 17:51:41洛杉矶湖人
日期:2016-09-23 08:18:15布鲁克林篮网
日期:2016-09-23 08:17:18
47#
发表于 2015-9-8 09:09 | 只看该作者
漏洞总会有的,谁也保证一直100%不会出现问题

使用道具 举报

回复
论坛徽章:
21
2014年世界杯参赛球队: 英格兰
日期:2014-06-13 15:55:46秀才
日期:2015-12-14 15:09:38秀才
日期:2015-12-18 09:28:57秀才
日期:2015-12-21 09:48:11秀才
日期:2016-01-21 13:42:39秀才
日期:2016-01-25 14:55:31秀才
日期:2016-02-18 09:24:18秀才
日期:2016-02-18 09:24:30秀才
日期:2016-02-18 10:08:14秀才
日期:2015-12-14 15:02:13
48#
发表于 2015-9-8 09:46 | 只看该作者
系统规模太大,无法充分地测试,升级过程触发BUG导致的吧,这样的情况应该很难避免。

使用道具 举报

回复
论坛徽章:
187
状元
日期:2016-04-28 14:18:17榜眼
日期:2016-04-28 14:18:17探花
日期:2016-04-28 14:18:17进士
日期:2016-04-28 14:18:17举人
日期:2016-04-28 14:18:17红宝石
日期:2012-04-13 17:18:06蓝锆石
日期:2012-02-20 12:20:11紫水晶
日期:2012-04-19 12:49:17祖母绿
日期:2012-02-27 22:10:14海蓝宝石
日期:2012-02-27 16:58:24
49#
发表于 2015-9-8 19:43 | 只看该作者
1:你认为此次事件的根本原因是什么?
可以认为系统升级后的测试不到位,存在BUG,导致大量误删。当然,这只是表象原因,不一定是根本原因。

使用道具 举报

回复
论坛徽章:
2
生肖徽章2007版:鼠
日期:2008-01-02 17:35:53秀才
日期:2015-10-08 17:57:58
50#
发表于 2015-9-9 10:51 | 只看该作者

1:你认为此次事件的根本原因是什么?
      误操作。

2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
     没有百分之百的数据还原。

3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
     还是经不起考验。大家都知道宣传与实际能力不是一一对等的。

4:如果你是此事件对应的技术人员,你会如何应对此事件?
      划分误操作的破坏等级,有二次确认动作。

5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
     完全虚拟化和透明化,都懂得,只是看透明度高低的问题。

6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
      在自动化操作中划分出来误操作的范围,及增加二次确认的命令和管理人员的授权。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表