查看: 29943|回复: 21

【名人堂访谈】大师对话:领悟网易云架构之美(已公布)

[复制链接]
认证徽章
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
发表于 2014-6-25 17:04 | 显示全部楼层 |阅读模式

各位网友大家好,欢迎做客本期的名人堂访谈,我是主持人皮皮,本期访谈我们很荣幸邀请到了网易杭州研究院前台技术中心总监陈谔老师,为大家坐镇解答疑惑。谈到网易,大家会想起耳熟能详的网易邮箱;而说到网易云,大家又会很自然地联想到网易云音乐、云课堂,云笔记、云阅读等产品,但隐藏在这背后的网易云架构又有多少人知晓呢? 在7*24小时不间断的服务背后,网易是如何利用自主研发的监控平台来应对异常情况?作为2014中国系统架构师大会的专家顾问,陈谔老师又有哪些心得体会呢?本期名人堂将为大家一一揭晓谜团,与大师近距离对话,让您领悟网易云之架构之美。



2014中国系统架构师大会以“发现架构之美”为主题,其中特别开设了“网易私有云以及网易云存储”的专场,欢迎大家踊跃报名,大会官网http://sacc.it168.com/。与陈谔大师的深度对话机会,请大家抓住机会,赶紧提问吧!无论是大会工作还是生活,您都可以敞开心扉,与我们交流心得。截止7月25日,我们将在ITPUB和ChinaUnix社区评选会员三名,各赠送图书徽章一枚,可以用于兑换图书。


皮皮(Q1):陈谔老师,欢迎做客本期名人堂访谈活动,请简要介绍下自己,和我们社区的网友打个招呼。



陈谔(A1):我于2006年加入网易进入网易杭州研究院,先后参与和负责了网易博客服务端架构设计与开发、网易消息推送平台架构设计、网易私有云计算与网络虚拟化架构设计工作,目前负责网易云计算项目整体规划工作及网易能力开放平台的设计规划工作。技术上对分布式系统设计开发、各类编程语言与编程模型充满兴趣。生活中的我是名IT技术宅男、喜欢自驾旅游、也是一名伪球迷和伪影迷。





皮皮(Q2):2014中国系统架构师大会以“发现架构之美”为主题,其中也有关于“网易私有云以及网易云存储”的专场,能否为我们谈谈什么是网易云架构?


陈谔(A2)网易云从形式上来看与AWS、阿里云等类似,是IaaS+PaaS的云计算平台,但和公有云有所不同。网易云从诞生起,就立足于为网易的自己各类互联网产品而服务,因此在性能、稳定性方面有很高的要求。此外,考虑到我们需要对已有机房网络实现融合,因此在设计开发网易云期间,我们对最基础的计算、网络、存储服务都做了大量的概念验证、性能测试工作,并对于各类异常状况的处理做了充分的运维应对措施。与此同时,我们还根据机房网络融合和网络访问安全保障的需求专门设计了融合方案,这一方案也将在本届中国系统架构师大会上进行分享。



网络架构上SDN的逐步实施也是网易云的一大特点,通过基于L3 Overlay的方案,网易云极大的降低了与数据中心网络拓扑的耦合,并为用户带来了租户间二层隔离的更为安全的私有网络。网易云的上层服务也颇具特色,例如除了传统的单节点关系数据库,我们还支持可水平扩展的分布式数据库,这也使得运行在网易云之上的产品在关系数据库访问性能上获得了极大的弹性。目前网易云已在公司内广泛使用,自今年以来,规模也在迅速扩大中,不久后网易的一些第三方合作方也将从高性能低成本的网易云解决方案中受益。



皮皮(Q3):作为本届中国系统架构师大会的专家顾问,您觉得有哪些机遇与挑战?能否分享下您的心得体会?



陈谔(A3):中国系统架构师大会是高手云集的盛会,覆盖的领域也非常广泛。作为大会的专家顾问,这是一个很好的机会,我能够直接接触业界许多先进的思想,也能够和各领域的专家分享与交流想法,并且也能借此机会促成长期的交流合作。这种交流的环境是难能可贵的,是非常高效有品质的。




在挑战方面,我觉得由于IT行业发展太快,总是不乏新旧技术思想的碰撞与颠覆。作为本届中国系统架构师大会的专家顾问,我觉得需要控制自己的思维惯性,有必要深入考虑一些隐藏在技术架构解决方案背后的成因和适用的场景,而不再是停留在简单去否定或追捧的层面上,这将会是一个挺大的挑战。





皮皮(Q4): 对很多互联网企业而言,提供7*24小时不间断的服务是一项非常艰巨的任务。一旦出现异常,运维工程师要面临各种异常补救措施,作为前台技术中心总监,您能否为我们分享下网易是如何利用自主研发的监控平台来应对异常情况?



陈谔(A4):网易的监控平台从很早开始就注重开放接口来满足业务数据的采集监控,这是因为不少线上事故并不能从服务器、VM的各项监控数据指标中得到良好的体现,所以我们的监控平台从一开始就设计成开放接口,允许将实时的业务数据推送到监控平台上,同时监控平台还支持监控数据的聚合和各种统计方式,这样运维人员便就能很方便的设定规则来触发报警。




此外,监控平台还具备完善的查询功能,能够通过类似SQL查询的方式查询符合一些阈值条件的服务器,为容量规划的决策提供支持,支持产品的长期发展。除了业务层面外,监控平台在数据中心层面还支持监控网络拓扑和交换机的工作情况,这样带来的好处很多,可以在很大程度上协助运维人员防患于未然,分离热点保障产品的服务质量。当然监控只是保障不间断服务的一个方面,更多的还是需要产品在架构层面做到高可用、剥离状态、运维友好、支持过载保护及必要的服务降级。网易的一些重要服务还包含额外的SLA评估服务,用以从用户视角观察服务质量,这样就能把运营商网络、CDN等服务端难以监控的因素也包含在内。




皮皮(Q5): 很多邮箱等Web应用都会面临着用户隐私等信息安全的问题,网易该如何应对这种挑战?您觉得有哪些技术方法可以强化Web应用的安全?



陈谔(A5):保护用户隐私是一个包含很多方面的系统性的工程,网易也有较为完整的体系来应对这一挑战。首先网易有完善的通行证账号体系,网易通行证提供了将军令、密保卡、手机绑定等多种保障,通过统一的账号体系同时也对异常登录等行为做了实时的分析反馈,通行证及网易的平台类产品均提供了标准的OAuth2.0,OpenId等支持来保障第三方接入时用户账号的安全;


其次网易的互联网产品也十分注重客户端漏洞的预防,网易的安全部门对各产品的XSS、SQL注入等漏洞情况有严格的监控,漏洞的解决都有严格的限时要求;在服务端我们要做的是防御入侵,近年来不少严重的用户隐私泄漏事故均起源于服务端被入侵,网易的安全部门及系统运维团队负责对操作系统、应用容器等漏洞进行跟踪。当有重大漏洞出现时各产品和服务均会第一时间进行更新,例如最近的Heartbleed漏洞,网易相关的产品均在极短的时间内完成了更新,网易的开发人员在接入机房内网时都需要额外通过将军令验证,这也很好的保障了数据中心网络不因为个人安全疏忽而被入侵。

此外,我们还在积极引入入侵检测体系,提升运维感知能力;在数据中心的网络层面,网易也通过划分VLAN来控制不同产品间的网络连通性,在网易实施私有云以来还逐步提供了到租户粒度的三层网络隔离,目前网易私有云网络正通过实施SDN,实现租户网络的完全二层隔离,从而带来了更高的灵活性和安全性。


在强化Web应用安全方面,我觉得应在需要的场合引入HTTPS,注意cookie的属性设置如secure、http-only;注意预防XSS、SQL注入等漏洞,可基于Zap,Burp Suite等工具来检测漏洞;基于中央认证服务器的体系实现SSO(可参考google账号认证体系或Yale CAS);第三方认证授权使用OpenId及OAuth2.0;用户密码存储确保签名及加盐存储;服务端应用容器、依赖的框架、操作系统及常用软件需关注安全更新及时升级修复安全漏洞;管理服务器环境考虑使用堡垒机;架构上避免服务器不必要的向外网暴露;引入VLAN隔离产品、数据服务环境。



获奖公布:
2009532140
gzmt
家住海淀





求职 : 数据库管理员
招聘 : Java研发
认证徽章
论坛徽章:
6349
ITPUB9周年纪念徽章
日期:2014-05-02 10:36:402011新春纪念徽章
日期:2014-12-29 12:11:142010广州亚运会纪念徽章:卡巴迪
日期:2014-08-06 08:44:252012新春纪念徽章
日期:2014-12-29 12:11:142013年新春福章
日期:2014-12-29 12:11:14马上有车
日期:2014-12-29 12:11:14马上有房
日期:2014-12-29 12:11:14马上有钱
日期:2014-12-29 12:11:14马上有对象
日期:2014-12-29 12:11:14马上加薪
日期:2014-12-29 12:11:14
发表于 2014-6-25 18:48 | 显示全部楼层
good ,陈先生...

使用道具 举报

回复
求职 : 数据库管理员
招聘 : Java研发
认证徽章
论坛徽章:
6349
ITPUB9周年纪念徽章
日期:2014-05-02 10:36:402011新春纪念徽章
日期:2014-12-29 12:11:142010广州亚运会纪念徽章:卡巴迪
日期:2014-08-06 08:44:252012新春纪念徽章
日期:2014-12-29 12:11:142013年新春福章
日期:2014-12-29 12:11:14马上有车
日期:2014-12-29 12:11:14马上有房
日期:2014-12-29 12:11:14马上有钱
日期:2014-12-29 12:11:14马上有对象
日期:2014-12-29 12:11:14马上加薪
日期:2014-12-29 12:11:14
发表于 2014-6-25 18:59 | 显示全部楼层
此外,考虑到我们需要对已有机房网络实现融合,因此在设计开发网易云期间,我们对最基础的计算、网络、存储服务都做了大量的概念验证、性能测试工作,并对于各类异常状况的处理做了充分的运维应对措施。
就针对你说的有几个问题:
虽然做了测试,得到了测试结果,但是根据什么来保证这个结果就能满足网易云的需求?另外我觉得虽然经过测试,只是对异常情况的运维只是提供了一定的经验



网络架构上SDN的逐步实施也是网易云的一大特点,通过基于L3 Overlay的方案,网易云极大的降低了与数据中心网络拓扑的耦合,并为用户带来了租户间二层隔离的更为安全的私有网络。

这个,租户间隔离层越多,是不是意味着用户到达自己的租户间的路径就越长?
那么用户的频繁更新文件是不是有一定困难?
是不是有损灵活性?

使用道具 举报

回复
论坛徽章:
18
技术图书徽章
日期:2014-06-18 14:20:102014年世界杯参赛球队: 希腊
日期:2014-06-20 16:01:122014年世界杯参赛球队: 加纳
日期:2014-06-26 23:51:20马上有对象
日期:2014-07-21 11:36:292014年世界杯参赛球队: 比利时
日期:2014-08-05 11:35:38
发表于 2014-6-25 23:43 | 显示全部楼层
本帖最后由 gzmt 于 2014-6-26 10:11 编辑

引入HTTPS,cookie属性设置,注意预防XSS、SQL注入等漏洞,基于Zap,Burp Suite等工具来检测漏洞,操作系统及常用软件关注安全更新及时升级修复安全漏洞,使用堡垒机,引入VLAN隔离……
这些措施在信息安全领域已不新鲜,网易在信息安全领域也不突出,如何证明网易在私有云以及云存储方面的专业安全服务能力,是今后需要考虑的一个问题。

使用道具 举报

回复
认证徽章
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
发表于 2014-6-26 10:44 | 显示全部楼层
gzmt 发表于 2014-6-25 23:43
引入HTTPS,cookie属性设置,注意预防XSS、SQL注入等漏洞,基于Zap,Burp Suite等工具来检测漏洞,操作系统 ...

这个问题好!

使用道具 举报

回复
认证徽章
论坛徽章:
127
茶鸡蛋
日期:2012-01-16 14:24:41鲜花蛋
日期:2012-06-06 14:48:18双黄蛋
日期:2013-01-07 21:07:482013年新春福章
日期:2013-02-25 14:51:24优秀写手
日期:2013-12-18 09:29:082014年新春福章
日期:2014-02-18 16:44:08马上有对象
日期:2014-02-18 16:44:08马上加薪
日期:2014-03-18 09:57:11马上有车
日期:2014-03-20 16:13:24马上有房
日期:2014-03-20 16:14:11
发表于 2014-6-26 10:46 | 显示全部楼层
2009532140 发表于 2014-6-25 18:59
此外,考虑到我们需要对已有机房网络实现融合,因此在设计开发网易云期间,我们对最基础的计算、网络、存储 ...

采取二层隔离所带来的网络安全可能在寻求一种平衡。

使用道具 举报

回复
求职 : 数据库管理员
认证徽章
论坛徽章:
17
2011新春纪念徽章
日期:2011-02-18 11:43:34itpub13周年纪念徽章
日期:2014-10-08 15:13:382014年世界杯参赛球队: 俄罗斯
日期:2014-07-17 17:21:42ITPUB季度 技术新星
日期:2014-07-17 14:37:00马上加薪
日期:2014-05-30 16:34:48马上有房
日期:2014-05-16 14:12:02马上有车
日期:2014-05-05 11:57:522014年新春福章
日期:2014-04-29 11:42:05技术图书徽章
日期:2014-02-09 09:36:59优秀写手
日期:2013-12-18 09:29:16
发表于 2014-6-26 11:30 | 显示全部楼层
学习!~~~

使用道具 举报

回复
招聘 : 系统分析师
论坛徽章:
483
马上有房
日期:2014-02-19 11:55:14itpub13周年纪念徽章
日期:2014-09-28 10:55:55itpub13周年纪念徽章
日期:2014-09-29 01:14:14itpub13周年纪念徽章
日期:2014-10-08 15:15:25itpub13周年纪念徽章
日期:2014-10-08 15:15:25马上有对象
日期:2014-10-12 11:58:40马上有车
日期:2014-11-16 17:11:29慢羊羊
日期:2015-02-09 17:04:38沸羊羊
日期:2015-03-04 14:43:432015年新春福章
日期:2015-03-06 11:57:31
发表于 2014-6-26 12:59 | 显示全部楼层
小皮,A和Q写反了……

使用道具 举报

回复
论坛徽章:
0
发表于 2014-6-26 13:23 | 显示全部楼层
2009532140 发表于 2014-6-25 18:59
此外,考虑到我们需要对已有机房网络实现融合,因此在设计开发网易云期间,我们对最基础的计算、网络、存储 ...


为了确保我们的云架构能满足产品的需求,除了必要的测试,我们在初期将产品引入私有云时做法是将产品除了外部的负载均衡外,在云内完整部署一份,然后通过配置负载均衡将流量导到云环境,并密切监控各项性能指标,这样即使有风险我们还是能够切换回原环境而不会影响产品,通过这样的机制逐步引入产品帮助私有云很好的确认了是否能够真实满足产品的需求。运维方面的确主要是平时准备方案,加强演练,不过网易私有云其实也运转了快2年了,我们也已积累了一些处理问题的经验。

基于L3 Overlay实施SDN并不会影响租户节点间的物理路径,节点间的路由是数据中心已经保障了的,额外的开销基本只是tunnel协议带来的。租户间的网络互通在网易私有云中是通过在虚拟机上挂载专门划分的机房内网IP来实现,这样实际是利用了机房已存在的路由,在性能和可靠性上也完全没有问题,挂载机房内网IP需要额外解决租户访问控制的问题,这个也正是负责网络虚拟化的同事会在中国系统架构师大会上带来的topic,还请到时关注,租户隔离带来的灵活性方面的问题这个主要是和安全性间的一个权衡。

使用道具 举报

回复
论坛徽章:
0
发表于 2014-6-26 13:44 | 显示全部楼层
gzmt 发表于 2014-6-25 23:43
引入HTTPS,cookie属性设置,注意预防XSS、SQL注入等漏洞,基于Zap,Burp Suite等工具来检测漏洞,操作系统 ...

网易私有云的安全措施主要还是遵循网易自己的安全体系,这里面的确没有太新鲜的东西,我们目前能做的是切实的去实施这些安全措施。网易其实一直以来经营邮箱和游戏这两个对安全要求颇高的业务,在自身体系上是积累了不少经验的,我们的安全部门目前发展也很快,相信大家也能逐渐听到网易在安全服务领域的一些声音。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 
京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表