楼主: 440活在梦里

【大话IT】阿里云误删文件是哪一环节出了错?

[复制链接]
论坛徽章:
651
生肖徽章:鼠
日期:2014-07-24 09:00:11生肖徽章2007版:鼠
日期:2009-03-19 21:39:41股神
日期:2012-09-29 10:14:59红钻
日期:2012-11-30 10:49:33至尊黑钻
日期:2019-01-19 11:43:58季节之章:秋
日期:2012-04-23 12:44:40季节之章:秋
日期:2012-01-05 14:00:54季节之章:冬
日期:2011-07-11 18:30:40季节之章:冬
日期:2012-05-20 13:22:14NBA季后赛大富翁
日期:2018-06-13 16:07:24
31#
发表于 2015-9-4 20:41 | 只看该作者
根本原因是管理水平

使用道具 举报

回复
论坛徽章:
249
Jeep
日期:2013-09-04 19:17:57Jeep
日期:2013-10-08 09:46:02Jeep
日期:2013-10-08 16:38:27Jeep
日期:2013-11-22 14:53:46Jeep
日期:2013-11-08 23:59:45Jeep
日期:2013-11-22 17:15:17Jeep
日期:2013-11-22 17:15:17Jeep
日期:2013-11-17 09:59:04季节之章:夏
日期:2015-01-28 14:58:51季节之章:春
日期:2014-12-25 16:20:50
32#
发表于 2015-9-5 11:07 | 只看该作者
人为故障

使用道具 举报

回复
论坛徽章:
1
秀才
日期:2015-10-08 17:57:58
33#
发表于 2015-9-5 13:37 | 只看该作者
官方自己已经回应称 云盾升级触发bug,那么引起这个问题的关键事件在于是云盾升级导致的,解决办法在于升级的过程中有哪些更新会引起所关联所导致bug的产生!这个还得看这个升级的策略和方法了~

使用道具 举报

回复
论坛徽章:
1
秀才
日期:2015-10-08 17:57:58
34#
发表于 2015-9-5 15:11 | 只看该作者
非常吃惊 ~

使用道具 举报

回复
论坛徽章:
1
秀才
日期:2015-10-08 17:57:58
35#
发表于 2015-9-5 16:34 | 只看该作者

1:你认为此次事件的根本原因是什么?
个人觉得到这个程度了,管理的问题会占主要原因,比如人员没有严格执行操作步骤

2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
这个从理论上可以,实际上还是不断人工参与的过程,如果文件敏感的用户,近期要求恢复,不敏感的用户,删了也就无所谓了,根本问题回滚是解决不了的。

3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
必然另有原因,至于什么原因只能看后续的报道了。

4:如果你是此事件对应的技术人员,你会如何应对此事件?
不懂

5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
360还号称安全呢。

6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
里面啥内幕,只能等后续报道

使用道具 举报

回复
论坛徽章:
38
管理团队2006纪念徽章
日期:2006-04-16 22:44:452012新春纪念徽章
日期:2012-02-13 15:11:522012新春纪念徽章
日期:2012-02-13 15:11:522012新春纪念徽章
日期:2012-02-13 15:11:52版主2段
日期:2012-05-15 15:24:11ITPUB 11周年纪念徽章
日期:2012-09-28 17:34:42ITPUB 11周年纪念徽章
日期:2012-10-09 18:03:32现任管理团队成员
日期:2012-10-18 17:00:062013年新春福章
日期:2013-02-25 14:51:24凯迪拉克
日期:2013-09-12 15:56:12
36#
发表于 2015-9-5 20:56 | 只看该作者
最近互联网公司IT故障不断,最后公关手段补救,记得支付宝中断那次后边搞出个反思日,但是查查旧闻,半年前各位大牛信誓旦旦,牛气冲天;阿里云香港节点中断赖当地不让进机房,这个规定当天才知道?预案呢?
如果按照这个节奏,以后类似的事情会更多,幻想有万无一失的技术,是因为运维的坑掉下去的次数不够多。

使用道具 举报

回复
论坛徽章:
14
ITPUB元老
日期:2011-12-19 12:17:46秀才
日期:2015-11-30 09:59:23金牛座
日期:2016-03-03 18:30:16妮可·罗宾
日期:2017-01-10 08:24:43娜美
日期:2017-03-10 17:49:05乌索普
日期:2017-11-22 09:58:19托尼托尼·乔巴
日期:2019-02-01 10:41:05罗罗诺亚·索隆
日期:2019-09-03 20:34:09山治
日期:2024-04-20 16:48:40
37#
发表于 2015-9-6 10:25 | 只看该作者
1:你认为此次事件的根本原因是什么?
管理失策,没有进行升级预案,回滚机制。或者对于自己的技术过于自信。

2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
如果没有备份并快速切回误删点,恢复将是很难的。因为有不一致性。

3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
云平台的核心是安全问题,脱离了安全,一切都是空谈。无论在内的软件安全,还是防护安全。

4:如果你是此事件对应的技术人员,你会如何应对此事件?
升级做好预案,做好备份。

5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
这个不好讲,也许云平台做了审计。阿里要做解释,否则安全隐私是个问题。

6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
多做测试,做预升级。做好备份

使用道具 举报

回复
论坛徽章:
176
20周年集字徽章-20	
日期:2020-10-28 14:31:21ITPUB十周年纪念徽章
日期:2011-11-01 16:24:04ITPUB 11周年纪念徽章
日期:2012-09-28 17:34:42ITPUB社区12周年站庆徽章
日期:2013-08-13 16:52:38itpub13周年纪念徽章
日期:2014-10-08 15:21:35ITPUB14周年纪念章
日期:2015-10-26 17:23:44ITPUB15周年纪念
日期:2018-02-09 14:12:58ITPUB18周年纪念章
日期:2018-09-17 10:09:4919周年集字徽章-庆
日期:2019-08-27 15:07:44状元
日期:2015-11-19 12:58:23
38#
发表于 2015-9-6 10:46 | 只看该作者
这次事件是好事,让大家知道“云”是有风险的。
善后工作就是赠送免费服务时间,以抚慰现有客户;发布公告,保证类似事件不会发生,加强稳定性保证,多少挽回新客户的信心。

使用道具 举报

回复
论坛徽章:
5
秀才
日期:2015-09-14 10:08:30秀才
日期:2015-09-21 13:21:08秀才
日期:2015-10-08 17:57:58秀才
日期:2015-11-12 17:43:40秀才
日期:2015-11-23 09:48:22
39#
发表于 2015-9-6 11:27 | 只看该作者
1:你认为此次事件的根本原因是什么?

人员管控不严。没有按标准流程去走。说到底还是管理问题,技术完全是能避免 的

2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?

回滚是解决不了的,特别是提数据这一块的。如果有误删。数据一回滚。。就会有丢失,解决不了根本问题

3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?

数据丢失。修复比较困难,然后更有种说是中毒。他们云牵涉比较广,排除修复比较 久

4:如果你是此事件对应的技术人员,你会如何应对此事件?

上线发布建立严格的流程,任何产品必须灰度,合格后才能上线,人员管控必须建议审核制度,这样能避免发生类似事件

5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?

要么就中毒所致被别人放了脚本文件。要么就是是宿 主机损坏

6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?

产口上线前必须灰度,模拟环境测试,上线严格审核,密切观察,可有效避免

使用道具 举报

回复
论坛徽章:
101
itpub13周年纪念徽章
日期:2014-11-06 15:29:09itpub13周年纪念徽章
日期:2014-10-08 15:19:55秀才
日期:2015-10-08 17:57:58水瓶座
日期:2015-10-13 16:00:20ITPUB14周年纪念章
日期:2015-10-26 17:23:44秀才
日期:2015-12-14 15:02:13天蝎座
日期:2016-02-02 13:28:27秀才
日期:2016-02-18 09:24:302016猴年福章
日期:2016-02-18 09:31:30天枰座
日期:2016-02-22 14:38:02
40#
发表于 2015-9-6 15:24 | 只看该作者
1:你认为此次事件的根本原因是什么?
云服务中最为担心的就是安全问题,在这块各大厂商的关注力度根本不够

2:此次阿里云文件与进程的误删事件,回滚操作后是否能解决根本的问题?
这事回滚解决不了吧!毕竟文件和进程被删除了。

3:阿里云是一个大型的云平台,相应的技术支持应该有充足的应对问题的能力,为何此次修复用了长达6个小时,依旧没有结果?此次故障是否另有原因?
涉及的面太广了,部署在云平台上的服务也比较多,这个过程肯定很漫长

4:如果你是此事件对应的技术人员,你会如何应对此事件?
不干这一块,不懂怎么弄

5:一网友说自己在虚机中执行什么,就会被删掉什么。一个云平台级工具怎么能知道用户虚机执行什么且怎么能删掉虚机内数据呢?
平台可以理解为一个大商场,那么用户虚机就是每个柜台。这就清晰了!

6:这次大批量删除用户文件的时间是因为云盾升级触发BUG导致的,那么有没有办法避免此类事情发生呢?
避免很困难,降低应该是可以的,但是大批量删除操作这事应该是很严重,在系统升级中一直避免使用删除操作

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表