【大话IT】网站服务器频宕机：营销手段or业务积累？

hai503 · 发表于 2015-9-8 10:29

1. 爱奇艺的事故毫无疑问引起了微博上对该剧的讨论热潮以及强烈关注度，因此也让人捉摸不透：此次事故是耍噱头还是真宕机?对此你怎么看？
噱头的可能性很大，IT也玩炒作，被娱乐圈带坏了……

2. 如果是因为技术上的因素，那么你认为此次宕机是因为服务器超负荷运行，后面的请求无法得到及时的响应？又或者是因为硬件配置不够导致应用运行异常？或者你还有其他的看法？
阀值没有设置，没考虑最大容量，说到底就是没有这样的预案。

3. 对于如今网络发达的社会现状，这种事故的集中爆发，你认为是否与前期的系统架构有关？是否是这些网站平时对业务细节的不注意导致业务积累造成的严重后果？
或许真的是架构“落后”了……

4. 你认为应该如何维护服务器从而降低宕机几率？比如提高高系统和应用的可用性？
实时监控，预警机制的制定。对高并发的提前准备，比如大型活动期间。

5.众所周知HA系统是目前企业防止核心计算机系统因故障停机的最有效手段，那么你对HA了解多少？它是否真如我们所说那样有着重大作用？你是否认为HA也存在某些缺憾？
缺憾就是维护成本高，HA的复杂导致故障处理时间过长。

houbao408 · 发表于 2015-9-9 09:11

1. 爱奇艺的事故毫无疑问引起了微博上对该剧的讨论热潮以及强烈关注度，因此也让人捉摸不透：此次事故是耍噱头还是真宕机?对此你怎么看？
个人认为是噱头，提高关注度。

2. 如果是因为技术上的因素，那么你认为此次宕机是因为服务器超负荷运行，后面的请求无法得到及时的响应？又或者是因为硬件配置不够导致应用运行异常？或者你还有其他的看法？
服务器超负荷运载和硬件配置都有可能，另外是否有检查机制

3. 对于如今网络发达的社会现状，这种事故的集中爆发，你认为是否与前期的系统架构有关？是否是这些网站平时对业务细节的不注意导致业务积累造成的严重后果？
或多或少都有关系，当初架构的可能没有考虑这么多用户吧

4. 你认为应该如何维护服务器从而降低宕机几率？比如提高高系统和应用的可用性？
实时监控检查，提到系统的可用性以及架构设计。

5.众所周知HA系统是目前企业防止核心计算机系统因故障停机的最有效手段，那么你对HA了解多少？它是否真如我们所说那样有着重大作用？你是否认为HA也存在某些缺憾？
这个没有了解过

renxiao2003 · 发表于 2015-9-9 10:28

这人话题好像有重复了。为了秀才我参加。
1. 爱奇艺的事故毫无疑问引起了微博上对该剧的讨论热潮以及强烈关注度，因此也让人捉摸不透：此次事故是耍噱头还是真宕机?对此你怎么看？
我觉得不是真宕机，应该是在耍噱头。以此事件提高知名度。

2. 如果是因为技术上的因素，那么你认为此次宕机是因为服务器超负荷运行，后面的请求无法得到及时的响应？又或者是因为硬件配置不够导致应用运行异常？或者你还有其他的看法？
我觉得不是技术问题。是商家炒作。

3. 对于如今网络发达的社会现状，这种事故的集中爆发，你认为是否与前期的系统架构有关？是否是这些网站平时对业务细节的不注意导致业务积累造成的严重后果？
可以租用云服务。这点12306做得比较好，在2015年春运中基本没出现宕机的情况。

4. 你认为应该如何维护服务器从而降低宕机几率？比如提高高系统和应用的可用性？
这个采用云租用更好。

5.众所周知HA系统是目前企业防止核心计算机系统因故障停机的最有效手段，那么你对HA了解多少？它是否真如我们所说那样有着重大作用？你是否认为HA也存在某些缺憾？
不是太了解。

2491流量营销 · 发表于 2015-9-9 10:50

这个让我想起当年某美优品，前期那么多的广告，结果活动当天网站无法访问。

nail78 · 发表于 2015-9-9 11:07

1. 爱奇艺的事故毫无疑问引起了微博上对该剧的讨论热潮以及强烈关注度，因此也让人捉摸不透：此次事故是耍噱头还是真宕机?对此你怎么看？
很难说，都有可能，只有他们内部人清楚怎么回事

2. 如果是因为技术上的因素，那么你认为此次宕机是因为服务器超负荷运行，后面的请求无法得到及时的响应？又或者是因为硬件配置不够导致应用运行异常？或者你还有其他的看法？
可能是对并发的支持不够，有可能设计初期就埋下了隐患，对峰值的估计不足，对这种高峰值的情况没进行高强度的压力测试

3. 对于如今网络发达的社会现状，这种事故的集中爆发，你认为是否与前期的系统架构有关？是否是这些网站平时对业务细节的不注意导致业务积累造成的严重后果？
有可能设计初期就埋下了隐患，对峰值的估计不足

hh7yx · 发表于 2015-9-9 16:06

支持。。。。。

phoenix1981 · 发表于 2015-9-9 16:58

占位待更新……

xkf01 · 发表于 2015-9-10 08:05

1. 爱奇艺的事故毫无疑问引起了微博上对该剧的讨论热潮以及强烈关注度，因此也让人捉摸不透：此次事故是耍噱头还是真宕机?对此你怎么看？
什么都有可能……从人性黑暗面的角度出发，我觉得还真有可能是前者

lbj06 · 发表于 2015-9-11 08:40

营销而已

wangwenan6 · 发表于 2015-9-11 09:45

1. 爱奇艺的事故毫无疑问引起了微博上对该剧的讨论热潮以及强烈关注度，因此也让人捉摸不透：此次事故是耍噱头还是真宕机?对此你怎么看？
耍噱头:真宕机，个人觉得55开吧

2. 如果是因为技术上的因素，那么你认为此次宕机是因为服务器超负荷运行，后面的请求无法得到及时的响应？又或者是因为硬件配置不够导致应用运行异常？或者你还有其他的看法？
各种情况都有可能，在业务平稳运行的时候，很容易因为松懈而忽略了高峰期带来的瞬间压力，高峰期的压力如果不能很好的处理，就很容易堆积请求/阻塞连接/等等，分分钟拖垮服务器

3. 对于如今网络发达的社会现状，这种事故的集中爆发，你认为是否与前期的系统架构有关？是否是这些网站平时对业务细节的不注意导致业务积累造成的严重后果？
架构级别的调整，影响和牵扯的人员都很广吧，为了KPI/绩效之类的东西，决策层不见得会在没宕过机的时候，投入资源去做，“不见棺材不掉泪”
架构没问题的话，那就是业务或者技术都有可能存在不足的地方咯，具体业务具体分析呗

4. 你认为应该如何维护服务器从而降低宕机几率？比如提高高系统和应用的可用性？
细致的监控；尤其是负载相关的数据，多去观察这些数据和时间的走向，是不是有什么异常的增长 or 其他，做好多活和HA

5.众所周知HA系统是目前企业防止核心计算机系统因故障停机的最有效手段，那么你对HA了解多少？它是否真如我们所说那样有着重大作用？你是否认为HA也存在某些缺憾？
少量的了解吧，HA的作用很“重大”，尤其是出问题的时候.....基于集群的HA，所有节点都是平等的，挂一个or几个的影响相对比较小；如果HA里面的节点有类似于主-从这种身份的话，主节点挂了，选举某个从节点为新的主节点的时间开销，在这种用秒来计算的互联网行业，是个大问题吧（个人看法）.....