楼主: 丸喵喵

【大话IT】创业破产,腾讯云的锅?

[复制链接]
认证徽章
论坛徽章:
5
秀才
日期:2018-06-21 10:08:00ITPUB18周年纪念章
日期:2018-09-17 10:09:49ITPUB18周年纪念章
日期:2018-09-17 10:12:57ITPUB18周年纪念章
日期:2018-11-13 15:31:24ITPUB18周年纪念章
日期:2018-11-13 15:40:45
发表于 2018-8-8 23:32 | 显示全部楼层
1、针对以上腾讯云的官方回复,你怎么看待此次事件,是北京清博数控科技有限公司运维人员工作失误,还是腾讯云的责任?
针对此次事件,我认为毫无疑问腾讯云是要负主要责任的,但北京清博数控科技有限公司运维人员也过分信任腾讯云了,居然不做任何备份。另外北京清博数控科技有限公司开发人员本地的机器会没有原代码吗?你说用户数据没备份完全丢了,我相信,但你说连原始代码都丢了的话,就有点说不过去了吧。

2、所谓的CVM搭载云硬盘提供三副本存储策略此时为何没有任何作用?针对丢失的数据,你认为如何进行补救能够帮助企业挽回呢?
腾讯云针对此次事件的最新回复也承认了,造成三副本存储策略没起不作用的原因,除了磁盘静默错误之外,还有在数据迁移过程中的两次不规范的操作。
针对丢失的数据,我认为腾讯云除了吸取此次教训,优化现有巡检机制,尽早发现磁盘静默错误,以及在涉及数据安全的流程自动化闭环,降低人工干预外,还应该向阿里云学习,派遣专业的团队帮助北京清博数控科技有限公司对其业务架构进行优化及建议,让他们能够更好地使用腾讯云。

3、我们反复强调,备份、数据安全,难道上云就能绝对安全么?企业要如何警醒?
从此次事件及之前的若干类似的事件可以看出,上云并不是绝对安全。企业的关键业务要上云的话,一定要做好备份,建立容灾备份机制。核心数据一定要做异地备份,要永久增量保存。它可以备份到存储,可以备份到磁带库,也可以备份到其他云,防患于未然。

使用道具 举报

回复
认证徽章
论坛徽章:
1
ITPUB18周年纪念章
日期:2018-09-17 10:09:49
发表于 2018-8-9 11:42 | 显示全部楼层
做产品的还是需要大气点,把人家创业公司搞破产了,怎么都得赔点。13万多也太少了吧。不过如果你oracle数据库丢数据了,估计oracle一样不会陪你。还是想想备份的招吧。

使用道具 举报

回复
认证徽章
论坛徽章:
1
ITPUB18周年纪念章
日期:2018-09-17 10:09:49
发表于 2018-8-9 16:02 | 显示全部楼层
这个确实是腾讯的责任。

总结起来三句话:管理员在迁移数据时违反规程关闭了校验(比如大家熟知的md5和sha1),数据传递到新空间之后,没等24小时就把原有副本删除了。结果发现迁移过来的数据出现了问题。这个过程具体的细节这里就不再追了。

下面全方位论述一下数据安全,云上的用户到底该怎么做才能保证自己的数据安全。

1 数据损毁的几种类型

1.1 介质物理损坏。比如磁盘扇区磁畴分布出了问题,介质出现各种不稳定问题,直接读不出来了。这种即便是找开盘恢复数据的公司,就算再牛逼,比如这家,也无能为力了。据说FBI有种技术,可以通过磁力显微镜,通过磁畴的分布状况,经过各种复杂分析,探测出该区域之前的数据,而且还不是100%。

1.2 盘内部物理部件损坏。比如机械硬盘的磁头定位出了问题,音圈无法校准,电机出现机械故障,转速不稳或者不转,各种传感器出了问题,等等。固态硬盘PCB上的电容出了问题,供电部分出了问题,等等。这种损毁,是可以通过开盘修复数据的,数据恢复公司可以承接这类业务。

1.3 硬盘内部软件崩溃或bug。比如硬盘固件崩溃,启动参数错误导致固件无法启动。或者固件bug、硬件bug导致数据逻辑上的静默损毁。

1.4 数据上层逻辑层面的损毁。最典型的比如误删了数据,中了病毒等。误删数据和中病毒纯属人为导致,与系统无关。

1.5 数据底层逻辑层面的损坏。出现不可修复乱码,文件系统丢失或者文件错乱,卷丢失或者容量错乱,等。这些就属于底层系统问题。冬瓜哥的两篇文章大家可以扩展阅读:原子写,静默损毁。

2 数据的恢复方法

数据丢了就得恢复,如果你没有快照和备份的话,就只能用下面方式尝试恢复数据。

2.1 软件修复逻辑错误。一些误删除的数据,只要对应文件所在的区域还没有被分配给其他文件并写入新数据,一些数据恢复软件可以通过扫描文件系统元数据的方式来将文件恢复出来。一些更专业的恢复工具(一般都是数据恢复公司自己开发的)可以识别更精细深度的数据,做更智能的分析,从而将数据恢复出来,还有可能提供多个不同的恢复出来的副本供用户选择那个正确率最高的。

2.2 开盘修复物理损毁。发生盘内固件等损毁时,整个硬盘已经无法正常工作,此时一般需要返厂,或者找专业数据恢复公司,通过特殊接口恢复固件,或者直接做开盘修复,绕过原生固件,直接控制。

2.3 各种Raid。Raid可以防止单盘数据的部分或者整体的数据物理损坏以及由于系统层导致的逻辑损坏,比如某个硬盘写入时发生静默损毁,但是Raid组中其他盘上的数据依然是完好的,此时,读出数据时发现校验有误,就可以从Raid条带中其他数据块读出数据恢复出目标数据。但是Raid无法防止上层的逻辑损坏,比如误删、中病毒等,因为这种数据是在源头就被损毁了,已经被损毁的数据写入到Raid系统之后,后者对这种层面的损毁无法感知。

2.4 多副本(Raid1)。多副本是大型互联网厂商惯用的架构,由于普遍采用分布式系统,跨网络做校验型Raid的话不适合随即写入场景,只适合大块顺序写入,而且写一次读多次场景比如网盘之类。而更多场景只能采用跨网络的非校验型Raid,那就是Raid1了,或者说多副本,存三份,一主两副。多副本的本质还是Raid,所以无法防止上层逻辑层面的损毁,也就是说,无法防止源头上的数据损毁。
所以,多副本和Raid基本上只能防止硬盘级的物理故障,和底层逻辑层面故障。显然,只靠这两个操作,数据仍然是不安全的。

3 多副本和Raid顶不了快照备份容灾

数据逻辑层损毁,这是被很多用户完全忽略掉的。很不幸,多数用户依然认为Raid和多副本,数据安心无忧。那么到底如何防止数据源头上的损毁?无法防止,这种损毁永远都是存在的,比如中了勒索病毒,黑客入侵,腾讯云的这次人为操作失误,不过腾讯云这次也的确加强了这方面管理。虽然无法做到事前防止,但是可以做到事后恢复。有2个技术可以做到:快照、备份。

3.1 快照的重要性。快照相当于对用户的数据拍了一张历史照片,用户可以做多个不同时间点的快照,将那些数据没有损坏的时刻的数据映像保存下来。快照有个特点就是它的尺寸会随着数据更改的量而增加,如果数据不更改,则快照占用的空间只是那些记录表等元数据空间,可忽略不计。所以,只要数据没有在底层发生逻辑或者物理损坏,那么历史快照就可以被用于快速恢复或者回滚。

3.2 备份的重要性。快照可以用于快速回滚数据,但是快照本身并不是备份。快照本质上是:指针表+增量数据块。它保存的只是增量数据块,而如果基础数据块有任何逻辑或者物理错误,快照就会一损俱损。此时,必须将数据完完整整的复制出一份或者多份保存,与生产数据完全脱离。但是备份和恢复数据时,由于存在完整拷贝,需要更长时间,架构也更复杂,比如块级备份、CDP、文件极、数据库级等等。

3.3 容灾的重要性。数据备份一般与生产数据放在同一个数据中心,在发生大型灾难时,整个数据中心可能被损毁。所以需要容灾,而容灾一般是实时的,生产系统的写I/O数据会被实时的复制到远端的数据中心。目前有些做备份容灾一体机的厂商,都支持云-本地、多云容灾。

4 云用户的数据保障

对于云用户而言,多副本、快照、备份,最好都用,起码做到快照不要停,这是你唯一的速效后悔药。


使用道具 举报

回复
认证徽章
论坛徽章:
4
秀才
日期:2018-04-08 14:37:33ITPUB18周年纪念章
日期:2018-09-17 10:09:49ITPUB18周年纪念章
日期:2018-09-17 10:12:5719周年集字徽章-19
日期:2019-09-06 18:39:57
发表于 2018-8-10 11:59 | 显示全部楼层
1、针对以上腾讯云的官方回复,你怎么看待此次事件,是北京清博数控科技有限公司运维人员工作失误,还是腾讯云的责任?
此事腾讯云得负主要责任。在没有经过反复测试、没有完全掌控故障处理技术核心之前,就推出产品,造成的一切后果都是未知的。
产品有BUG,不能怪运维人员工作失误。

2、所谓的CVM搭载云硬盘提供三副本存储策略此时为何没有任何作用?针对丢失的数据,你认为如何进行补救能够帮助企业挽回呢?
部署的存储策略没起作用,归根结底还是因为技术不成熟。为了防止数据丢失,我认为在本地端和云端都建立灾备机制,将企业
数据不仅要在本地进行备份,还要在云端进行备份。如果条件允许,均采用raid技术构建磁盘阵列的方式来存储、备份。

3、我们反复强调,备份、数据安全,难道上云就能绝对安全么?企业要如何警醒?
这个世界上万事都没有绝对。企业要想保障数据的安全、备份,只能建立完善的访问、备份机制来解决。否则,又会发生上述的
这类事情,这是所有发展中企业都不愿看到的。

使用道具 举报

回复
论坛徽章:
1
ITPUB18周年纪念章
日期:2018-09-17 10:09:49
发表于 2018-8-10 14:32 | 显示全部楼层
oracle8019 发表于 2018-8-10 11:59
1、针对以上腾讯云的官方回复,你怎么看待此次事件,是北京清博数控科技有限公司运维人员工作失误,还是腾 ...

C:\Users\HP\Desktop\新建位图图像

使用道具 举报

回复
认证徽章
论坛徽章:
19
秀才
日期:2017-03-20 13:42:2019周年集字徽章-19
日期:2019-09-06 18:39:04ITPUB18周年纪念章
日期:2019-03-12 14:03:46ITPUB18周年纪念章
日期:2018-11-13 15:40:45ITPUB18周年纪念章
日期:2018-11-13 15:31:24ITPUB18周年纪念章
日期:2018-09-17 10:12:57ITPUB18周年纪念章
日期:2018-09-17 10:09:49秀才
日期:2018-04-08 14:48:31秀才
日期:2018-04-08 14:37:33娜美
日期:2018-03-28 14:24:56
发表于 2018-8-11 10:49 | 显示全部楼层
1、针对以上腾讯云的官方回复,你怎么看待此次事件,是北京清博数控科技有限公司运维人员工作失误,还是腾讯云的责任?
腾讯云付主要责任,清博的运维和大数据根本没有考虑本地备份,也要付一定责任

2、所谓的CVM搭载云硬盘提供三副本存储策略此时为何没有任何作用?针对丢失的数据,你认为如何进行补救能够帮助企业挽回呢?
在冗余机制正常工作的情况下是不可能丢失数据的,那么就很可能是冗余备份程序出现bug,这种事情很常见。另外现在硬盘的使用寿命很长,质量相对而言也是没有问题的,但盘阵同时坏多块盘的情况也会发生,所以即使是完全周密的保障也不能百分百安全。

3、我们反复强调,备份、数据安全,难道上云就能绝对安全么?企业要如何警醒?
上云不是绝对安全的,但是大服务商提供的专业的运维工程师和昂贵的设备肯定比小公司自己搭建的草台班子服务器更安全。

使用道具 举报

回复
论坛徽章:
151
授权会员
日期:2005-11-16 17:49:25世界杯纪念徽章
日期:2006-07-20 13:19:20ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44生肖徽章2007版:龙
日期:2008-11-25 11:15:28生肖徽章2007版:羊
日期:2009-06-02 18:18:38生肖徽章2007版:鼠
日期:2009-06-17 22:01:192010新春纪念徽章
日期:2010-03-01 11:04:582010年世界杯参赛球队:科特迪瓦
日期:2010-06-11 19:25:562010广州亚运会纪念徽章:网球
日期:2010-12-31 16:37:522010广州亚运会纪念徽章:藤球
日期:2011-01-02 15:47:20
发表于 2018-8-12 19:43 | 显示全部楼层
1、针对以上腾讯云的官方回复,你怎么看待此次事件,是北京清博数控科技有限公司运维人员工作失误,还是腾讯云的责任?
双方都有责任,北京清博数控科技有限公司的决策人员责任最大,腾讯云的责任第二,北京清博数控科技有限公司运维人员责任最小。
二十年的客户数据,不妥善保护,盲目相信服务商的服务水平,那不是手拎现金逛大街购物有什么区别,这种情况你就别怪保安和你说过他们商场可以夜不闭户,责任无疑决策者最大。运维人员最小是人有只是技术人员,业务提了备份需求而技术人员没备份才有责任,业务部门没有提业务需求,指望技术人员主动备份,这要求虽然合理,但稍微有点高了。

2、所谓的CVM搭载云硬盘提供三副本存储策略此时为何没有任何作用?针对丢失的数据,你认为如何进行补救能够帮助企业挽回呢?
   数据如果丢失了,三个存储副本也会全部丢失,VM搭载云硬盘还是要有另外需要在非同一故障区手工存储一份且不被新数据覆盖才有用。
   要挽回损失只有两种情况,一是有备份可恢复数据,损失有限;二是买过保险有赔偿,服务商的赔偿极其有限,你不可能指望买个奥拓人家赔你奥迪,即使坐奥拓的人身份亿万。
3、我们反复强调,备份、数据安全,难道上云就能绝对安全么?企业要如何警醒?
首先,没有绝对的安全,企业的业务对数据安全要求高,就得加大信息安全方面的投资,在市场经济环境下,想使小钱办大事不太可能。
其次,千万不要盲目轻信服务商的承诺,小概率事件对服务商是几万分之一,对创业公司就是全部。

使用道具 举报

回复
求职 : ERP实施
论坛徽章:
22
2013年新春福章
日期:2013-02-25 14:51:24秀才
日期:2017-02-22 15:18:00秀才
日期:2017-03-20 13:42:20秀才
日期:2017-03-28 15:59:38秀才
日期:2017-05-09 11:37:55秀才
日期:2017-08-18 11:02:47秀才
日期:2018-04-08 14:48:31秀才
日期:2018-06-21 10:08:00ITPUB18周年纪念章
日期:2018-09-17 10:09:49ITPUB18周年纪念章
日期:2018-09-17 10:12:57
发表于 2018-8-14 11:05 | 显示全部楼层

完全不同是什么情况,随便掺和下

本帖最后由 轩辕小珂 于 2018-8-20 13:10 编辑

1、针对以上腾讯云的官方回复,你怎么看待此次事件,是北京清博数控科技有限公司运维人员工作失误,还是腾讯云的责任?
大体了解到的情况是客户没有做本地备份,云服务有副本,但是在恢复过程中云服务的员工两次不规范的操作造成数据无法恢复。
如果我的理解没错的话,腾讯云的责任是肯定的。但有限责任还是无限责任是要先区分下。
举个例子,飞机失事了,人没了。
航空公司说我赔你机票钱加里程券,这叫逃避责任;
按合同和法律法规的标准,赔偿一定的金额,这叫有限责任;
家属说俺们花几百上千万才培养出这么个继承人,如果不出事,以后家族企业发展几万个亿,你才赔这么几十万不行,这叫无限责任。
至于运维人员的失误,真的没备份,还是以没本地备份来咬一口还不好说。如果是我,肯定说没本分,就算咬不到,炒作一番至少多点名气吧。
2、所谓的CVM搭载云硬盘提供三副本存储策略此时为何没有任何作用?
ERP 不也是这样吗,业务签单的时候,说的天花乱坠,实际实施的时候,就是另外一个鬼样子了。企业没有辨别真假的能力,就只能任凭别人忽悠了。
看腾讯的声明,是不是那谁没开启那个免费的快照功能啊。猜测三副本备份,功能免费,但是空间、容量不免费。所以为了省钱,就没买备份的空间,自然就没开启了。
针对丢失的数据,你认为如何进行补救能够帮助企业挽回呢?
找奇异博士来看看,说不定能恢复呢^_^
3、我们反复强调,备份、数据安全,难道上云就能绝对安全么?
整体来说,上云比本地小企业的网管是安全一些。但总有个案出现。 对于企业来说,上云而不做本地备份,就是赌了。
企业要如何警醒?

狡兔三窟,不要把鸡蛋放同一个篮子。讲的再多,比不上“省事”二字。
看看腾讯云的说方法:“为了加速完成搬迁任务”,为了“尽快降低仓库使用率”是操作人员违规,还是管理人员施加压力导致的违规。
当外行说,“不效验了,快点处理好客户半小时一个电话催着呢”,“没事,出了责任我担”,我们一线操作人员到底怎么做?
死撑着效验完再做恢复,如果效验没问题,肯定会被骂浪费时间;如果发现问题,也不会因为做了效验而被表扬吧。
只想着多和快,忘了好和省,怎么可能不出事。管理人员不要为了一时的方便,打破自己制定的流程。熟练工也不要用以前的经验,“以前都问题,这次也不用效验了”。
对于企业来说,只花3569来保护自己价值上千万的数据。这和买了几十万的古董,发几块钱快递但不保价有多大区别。

总的来说,腾讯的责任跑不掉了,但是那谁几千万的赔偿也别想。按合同条款,该多少是多少。
运维没做备份的话,自己先引咎辞职吧。

使用道具 举报

回复
认证徽章
论坛徽章:
18
秀才
日期:2017-06-14 16:27:23ITPUB18周年纪念章
日期:2018-09-17 10:12:57ITPUB18周年纪念章
日期:2018-09-17 10:09:49秀才
日期:2018-06-21 10:08:00秀才
日期:2018-04-08 14:48:31秀才
日期:2018-04-08 14:37:33秀才
日期:2017-12-12 09:50:56秀才
日期:2017-12-12 09:50:10秀才
日期:2017-12-12 09:49:20秀才
日期:2017-09-18 17:33:59
发表于 2018-8-15 13:23 | 显示全部楼层
本帖最后由 kasabulanka888 于 2018-8-16 08:52 编辑

1、针对以上腾讯云的官方回复,你怎么看待此次事件,是北京清博数控科技有限公司运维人员工作失误,还是腾讯云的责任?

答:单方面看腾讯云的公告,有些片面,从清博数控人员的网上诉说公开经过了解到大体状况。
               
从事实主观上讲腾讯有主要的责任,因为腾讯云在推广客户时就有提到保证数据的99.999%不会丢失,
      
       次要责任是清博数控。他们应该了解到现在云还不是成熟的界段,应该要有危机意识,保留重要数据在线下时时备份。
      
       另一方面了解到合约上是有玄机,从而有法律的保护和法律的制约,但前提是一定要确认好双方每一条款再签合约。

2、所谓的CVM搭载云硬盘提供三副本存储策略此时为何没有任何作用?针对丢失的数据,你认为如何进行补救能够帮助企业挽回呢?
   
    答:人为的原因很大,从单方面腾讯云所说硬盘的bug导致,那么可以说是bug来背锅!无论是快照备份,CVM搭载硬盘存储备份已经很成熟,除非没有实质的操作,
         
          才能造成此次灾难!另外从恢复时可以看到腾讯云的做法很不专业,没有保护并备份灾难现场,直接进行了不确定成功的尝试恢复却造成了破坏,这点很不应该!!!
           
          针对数据丢失,我认为这种情况对于DBA和法人代表来讲一定不允许出现这种情况或者说就不该出现。在任何条件下都要考虑备份,否则DBA可以跑路了。

3、我们反复强调,备份、数据安全,难道上云就能绝对安全么?企业要如何警醒?

   答:去年前年国外云也出现几个案例,今年也出现几起案例。从案例得出结论上云并非百分百安全,凡事还是有一个万一。
   
          从这次事件来看,对于企业惊醒的是不要盲目的跟风上云(我国国情的人喜欢跟风),首先要考虑上云的必要性,还要考虑备份的重要性。
           
           如果已经上云后,就要重新检查确认一下备份的及时有效方案,对于企业而言有些数据就是生存之本。









使用道具 举报

回复
论坛徽章:
622
生肖徽章:鼠
日期:2014-07-24 09:00:11生肖徽章2007版:鼠
日期:2009-03-19 21:39:41股神
日期:2012-09-29 10:14:59红钻
日期:2012-11-30 10:49:33至尊黑钻
日期:2019-01-19 11:43:58季节之章:秋
日期:2012-04-23 12:44:40季节之章:秋
日期:2012-01-05 14:00:54季节之章:冬
日期:2011-07-11 18:30:40季节之章:冬
日期:2012-05-20 13:22:14NBA季后赛大富翁
日期:2017-06-15 09:15:27
发表于 2018-8-19 08:19 | 显示全部楼层
参与奖:站庆徽章1枚

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 
京ICP备09055130号-4  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表