楼主: 440活在梦里

【大话IT】阿里云误删文件是哪一环节出了错?

[复制链接]
论坛徽章:
4
秀才
日期:2015-09-10 17:13:35秀才
日期:2015-09-10 17:18:24秀才
日期:2015-09-21 13:16:32秀才
日期:2015-10-08 17:57:58
21#
发表于 2015-9-3 14:19 | 只看该作者
事在人为, 基本责任是管理层

使用道具 举报

回复
论坛徽章:
4
ITPUB 11周年纪念徽章
日期:2012-10-09 18:13:33itpub13周年纪念徽章
日期:2014-11-06 15:29:09蓝色妖姬
日期:2015-01-05 16:32:47秀才
日期:2015-10-08 17:57:58
22#
发表于 2015-9-3 14:50 来自手机 | 只看该作者
管理层树大招风,感觉被针对了

使用道具 举报

回复
论坛徽章:
65
生肖徽章2007版:兔
日期:2011-01-20 12:58:49秀才
日期:2016-12-21 16:55:07秀才
日期:2016-03-24 09:10:242016猴年福章
日期:2016-02-23 09:58:34秀才
日期:2015-10-08 17:57:58双子座
日期:2015-09-17 10:07:092015年新春福章
日期:2015-03-06 11:57:312015年新春福章
日期:2015-03-04 14:19:11马上有车
日期:2014-02-18 16:41:112014年新春福章
日期:2014-02-18 16:41:11
23#
发表于 2015-9-3 18:40 | 只看该作者
云, 就是个飘忽的东东。
对于关键业务应用, 自然不建议放在公有云上,将自己业务数据交由别人主宰。

使用道具 举报

回复
论坛徽章:
1
秀才
日期:2015-10-08 17:57:58
24#
发表于 2015-9-3 22:03 | 只看该作者
1:你认为此次事件的根本原因是什么?
   没有做好测试和演练,大的升级必须先演练的
2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
   如果有备份,按说应该可以。这么大的平台,全备有困难。
3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
不好说了。
4:如果你是此事件对应的技术人员,你会如何应对此事件?
  事前做好演练,如果失败,能否回退?回退的时长?怎么备份?有个充分的估计。
5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
   完全可以。因为虚拟机的操作系统比如win2008,centos 7这样的系统,它整体升级了一下,导致故障
6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
    不能。因为这萝卜种在人家的地里呢

使用道具 举报

回复
论坛徽章:
15
嫦娥
日期:2015-07-24 15:04:18天枰座
日期:2016-04-25 21:01:43秀才
日期:2016-03-01 09:57:08双子座
日期:2016-02-05 15:31:24秀才
日期:2015-11-23 10:00:44秀才
日期:2015-11-11 09:48:44秀才
日期:2015-10-30 10:04:49秀才
日期:2015-10-19 15:49:55秀才
日期:2015-10-10 11:14:21秀才
日期:2015-10-08 17:57:58
25#
发表于 2015-9-3 23:43 | 只看该作者
我觉得大部分的问题还是管理上的原因吧,猜肯定猜不出的,这么大的事技术上肯定能避免,唯一要找的就是哪个环节上的管理出问题,就类似去年华为的某款手机的固件竟然升错版本,导致很多用户的手机变砖头一样。所以根本原因就是管理环节出了问题,只要找到问题点,技术上解决问题应该不大

使用道具 举报

回复
论坛徽章:
4756
季节之章:冬
日期:2019-07-13 22:29:26季节之章:春
日期:2019-07-13 22:29:26季节之章:夏
日期:2019-07-13 22:29:26季节之章:秋
日期:2019-07-13 22:29:26嫦娥
日期:2019-08-03 07:05:29玉石琵琶
日期:2019-08-03 08:17:02铁扇公主
日期:2019-08-03 21:12:36九尾狐狸
日期:2019-08-05 21:05:25玉石琵琶
日期:2019-08-06 06:36:05玉兔
日期:2019-08-06 16:05:50
26#
发表于 2015-9-4 08:19 | 只看该作者
1:你认为此次事件的根本原因是什么?
测试不充分。
2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
基本可以。
3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
不清楚。
4:如果你是此事件对应的技术人员,你会如何应对此事件?
按照预案执行。
5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
不清楚。
6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
测试。

使用道具 举报

回复
论坛徽章:
220
状元
日期:2015-08-13 09:42:33榜眼
日期:2015-08-03 13:57:54探花
日期:2015-07-31 13:44:02举人
日期:2015-07-01 15:00:51秀才
日期:2015-07-27 09:45:52进士
日期:2015-07-27 11:26:492015年中国系统架构师大会纪念徽章
日期:2015-07-23 09:58:092014系统架构师大会纪念章
日期:2015-07-23 09:58:092013系统架构师大会纪念章
日期:2015-07-23 09:58:092012系统架构师大会纪念章
日期:2015-07-23 09:58:09
27#
发表于 2015-9-4 09:09 | 只看该作者
1:你认为此次事件的根本原因是什么?
应该是操作过程中出现了问题。导致文件被删除。

2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
需要找备份或者磁盘恢复。

3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
应该是有其他的原因。

4:如果你是此事件对应的技术人员,你会如何应对此事件?
在任何大型操作之前最好是做好备份。

5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
有可能是虚拟机都被删除了啊。

6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
备份。

使用道具 举报

回复
论坛徽章:
20
奥运会纪念徽章:马术
日期:2008-10-24 13:03:43咸鸭蛋
日期:2012-05-05 20:56:55奥运会纪念徽章:乒乓球
日期:2012-06-14 21:11:232013年新春福章
日期:2013-02-25 14:51:24ITPUB社区千里马徽章
日期:2013-06-09 10:15:342014年新春福章
日期:2014-02-18 16:42:02马上有房
日期:2014-02-18 16:42:022014年世界杯参赛球队: 澳大利亚
日期:2014-06-13 23:17:24马上加薪
日期:2014-10-25 22:18:44鲜花蛋
日期:2012-03-20 21:38:22
28#
发表于 2015-9-4 14:37 | 只看该作者
1:你认为此次事件的根本原因是什么?
制度原因,人为放松。道哥说是一个程序员粗心大意,多写了一行代码,会删除系统监控到新启动的任何OBJ,但是这么明显的BUG为何没测试出来,这还是阿里这么大一个公司的产品么?

2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
没法回滚,好像是新写程序恢复的。

3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?

官方原因见1,2。是新写程序恢复目标的。
4:如果你是此事件对应的技术人员,你会如何应对此事件?
辞职滚蛋。

5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
自家系统,想监控啥不能监控的。
6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
仿真环境的充分测试。或者小范围投产验证,稳定后再全平台推广。

使用道具 举报

回复
论坛徽章:
55
秀才
日期:2016-02-18 10:06:46技术图书徽章
日期:2014-08-28 15:59:45技术图书徽章
日期:2014-08-28 15:59:45蓝色妖姬
日期:2014-08-28 15:17:25技术图书徽章
日期:2014-08-22 13:56:58海蓝宝石
日期:2014-08-06 14:09:322014系统架构师大会纪念章
日期:2014-08-04 09:33:532013系统架构师大会纪念章
日期:2014-08-04 09:33:532012系统架构师大会纪念章
日期:2014-08-04 09:33:532011系统架构师大会纪念章
日期:2014-08-04 09:33:53
29#
发表于 2015-9-4 15:08 | 只看该作者
这个不好说,删除了。。。

使用道具 举报

回复
论坛徽章:
57
秀才
日期:2016-03-24 09:20:52秀才
日期:2015-12-14 14:47:54秀才
日期:2015-11-30 09:59:23秀才
日期:2015-11-30 09:13:06秀才
日期:2015-11-23 10:17:19秀才
日期:2015-11-23 09:48:22秀才
日期:2015-11-12 17:43:40秀才
日期:2015-11-11 10:22:49秀才
日期:2015-11-11 10:07:14秀才
日期:2015-11-11 09:58:34
30#
发表于 2015-9-4 16:59 | 只看该作者
1:你认为此次事件的根本原因是什么?
    我们看到的只是现象,只是表面的东西,除非你对这个系统特别了解,才能知道导致这个现象的原因,测试肯定是没做到位的。

2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
    一般升级都是有预案的,升级不成功,就得回滚。回滚操作后是否能解决根本的问题,这个是很难回答的,因为不了解他们内部的东西。

3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
    出现故障,首先要做的就是定位问题的原因,找到原因才能提出解决方案,至于修复用多长时间,那得看出的是什么问题,外人就不得而知了。

4:如果你是此事件对应的技术人员,你会如何应对此事件?
    首先定位问题的原因,其次就是找到正确的解决方案,决定是回退还是修复。

5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
    既然是个平台的工具,你做什么,都会有日志,留下痕迹的,平台肯定要对日志进行监控的。就像我们发短信,只要有权限,在移动运营商系统那里都是能查得到的,像聊天工具,聊天记录都会有记录的,只要有权限,都能查得到日志。

6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
   只能多测试,谁也不能保证不出故障,谁也不愿意出故障,像马航370似的,谁愿意出事呀。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表