|
1) 对于公司不断增加的数据存储,处理和分析需求,您是更倾向于选择增加硬件设备自建和升级数据中心?还是开始尝试来自公有云的相关服务?
自建数据中心和公有云的选择不容易,技术和成本上来说,自建成本高、周期长、持续维护压力大、人员投入多但自主能力强、灵活性高、安全和可靠性能根据企业实际情况灵活调整。公有云见效快、灵活性和支持度随厂商而各不相同,安全性则是云里雾里。至于成本,从个人的计算来看,如果企业的设备200台或更高,则自有数据中心和私有云更合适。而在此下选择公有云会更有效。
在数据管理的层面,这个选择必须考虑业务和技术的前提:
a).大部分应用系统的架构无法灵活将数据独立出去而不影响业务有效运行,采用历史数据截断和备份是常用方法。对于这样的数据可以采用大量廉价甚至非在线的存储实现,比公有云有效、安全。
b).如果采用公有云,系统在线运行时候的数据如何有效接入、保证安全、性能和可靠性等方面需要对系统结构、企业网络和公有云厂商做大量工作,如有案例则非常想请教一下。
c).如果应用服务都是在公有云之上,如针对企业的舆情收集和分析(同样有厂商号称基于云技术),在数据内容、技术体系都在公有云之上的天然情况,使用外部又便宜那何乐而不为?
因此,个人意见是目前大部分情况下扔是自建数据中心为主,而在业界的云服务、云技术下的技术架构商业产品迅速成熟之后,某部分业务的公有云服务才会更有选择的余地。
2) 为数据类的应用自建数据中心,硬件选型是选择单纯x86架构?还是选择非x86架构,抑或是将x86与非x86架构混合部署和应用,做出相关决策时最主要的依据是成本,安全,性能、可扩展性还是系统兼容性?
数据类的应用,特别是类似“大数据”类的应用会逐步以X86架构为核心,在硬件层面,单台X86设备和小型机等典型性能设备的差距在快速缩小,而云计算、分布式计算、内存数据库、map reduce等等技术使得X86设备在总体性能堆砌、可靠性方面有足够的保障,这样带来灵活性、成本、企业总体资源池效益等方面的优势更加明显!而系统兼容性这个问题在大部分情况下不会带来根本性的影响,对于企业内部而言,安全基本都在同一起跑线。
所以,X86架构在总体成本、性能、可靠性、可扩展性、总体资源池的管理效益等方面都占据非常大的优势。
另外一个角度上看,power为代表的小型机,专业技术带来对它自己保护的同时,却也形成了一个其他业务、技术都难以进入的壁垒的反作用,而不得不游离于许多业务之外。相对于极端开放的linux代表的X86体系,从业界技术人员、覆盖业务内容技术发展速度等方面都有跟不上的感觉。
3)尝试用外部的云平台或云服务承载数据应用需求时,会侧重考虑哪个方面的因素?是价格、知名度、稳定性、响应能力还是客户端的易用性?
这些内容当然都需要考虑,而且都是选择时候的重点。
个人认为厂商所提供服务的“标准化程度”和“特性化服务能力”也同样需要考虑。
字面上不同方向的两点并不矛盾:
a).看从厂商所提供资源和服务的标准化程度到底细致到什么级别。使用了同一个开源技术的云厂商,其对产品掌握的程度、管理的精细化程度、可以实现的功能类型、能否支撑的业务情况会因为标准化程度不同而体现。极端点,厂商1说他们可以根据CPU核心、内存和存储容量给你分配资源,厂商2则可以把中间件、负载均衡、CPU忙闲时间、内存实际使用比率等等给你动态分配……
b).基于第一点,厂商对其所运行云的能力程度,以及对你所需要运作的业务、技术类型的了解程度,例如应用的接口服务等超出IaaS的特性化服务能力,能否把客户真的当爷侍候...
4)请具体谈谈对于推进大数据及数据分析应用时力不从心的地方或环节有哪些?可以涵盖硬件,软件和服务层面。
目前所在的企业看来,大数据和数据分析部分的限制不在硬件部分,无论是小型机、X86还是云都不是这个工作的瓶颈。
影响这类的原因主要是企业的数据本身、信息化的体系和实施时候的能力。
企业在主数据、元数据等方面的管理如果没做好,会对数据应用带来反作用,系统间数据不匹配、业务运作断裂,大数据和数据分析更无从谈起。一些企业或为了面子或受咨询公司蛊惑,数据管理没踏实落地做好,底层数据混乱、系统间数据隔离、高层数据应用不明等原因导致的“马粪外面光,里面一包糠”。
软件和服务层面,过度关注于大、挖掘、高层报表等可以直接、迅速看到一定结果的高层应用,而经常忽略底层要求就是导致走歪路、力不从心的帮凶。
好技术的实现也需要很多配套条件的。
|
|