|
UNIX集群功能高可用性竞争分析报告
概述
作为全球著名的研究咨询机构,D.H.Brown Associates,Inc.(以下简称DHBA)的主要业务范围是信息产业战略分析、技术评估、产品与市场趋势分析和预测,并致力于密切跟踪、深入了解信息产业核心技术及其未来趋势的发展。为了更细致地研究集群技术在实际应用领域所能实现的可用性,不久前,DHBA公司对来自康柏公司的Tru64 UNIX和 TruCluster服务器软件、通用数据公司(Data General)的DG/UX和DG/UX Clusters、惠普公司的HP/UX和MC/ServiceGuard、IBM公司的AIX和HACMP、Sequent公司的 Dynix/ptx和ptx/CLUSTERS以及Sun公司的Solaris和Sun Clusters等主流UNIX集群技术的高可用性进行了一次较为完整的测试和分析。
为了尽可能全面、综合地反映不同集群产品在为用户提供高可用性计算环境方面所具有的能力和特性,DHBA的专家们根据企业计算用户在实际应用中对集群系统的需求把整个分析过程划分成了6个单项,它们是:集群备份与恢复、集群故障恢复配置能力、集群并行数据库存取、集群高可用性管理、集群的单系统映像以及灾难恢复。
在对6家厂商的UNIX操作系统和集群软件的数百个特性和功能进行认真分析和评估后,DHBA按照6个与集群相关的功能类目对它们依次记分排序。根据DHBA提供的研究数据,康柏公司的Tru64 UNIX和Tru Cluster服务器软件以 53.5分的最高成绩,摘取综合评分桂冠,并在“集群并行数据存取”、“集群高可用性管理”和“集群单系统映像”等三个单项评比中获得第一名。IBM以51.8分的总分位居第二。
DHBA的专家们根据企业计算用户在实际应用中对集群系统的需求,为6个单项分别确定了不同的加权值,其中:集群备份与恢复加权值20%、集群故障恢复配置能力加权值20%、集群并行数据库存取加权值10%、集群高可用性管理加权值5%、集群的单系统映像加权值5%、灾难恢复加权值5%。由于本报告加权值的总和为65%,因此,在本评估报告中可实现的最高结果是65%。
评测分析
集群备份和恢复
由于检测和恢复机制是系统实现高可用性的首要目标之一,因此在综合评分中“集群备份和恢复”获得了20%的加权值。评估系统的“集群备份和恢复”能力,着重从故障恢复模式、检测方法和恢复选项以及备份和恢复选项等几个方面着手,同时需要考虑系统服务备份的分配、选择本地与故障恢复的灵活性、并行与串行恢复,以及一系列诸如故障和资源短期等集群系统可检测的条件。
在这个重要项目中,较高的综合得分和较小差异说明:各公司的集群解决方案在这一领域都比较成熟。
HP的MC/ServiceGuard在这一单项中获得最高分,除了拥有其他系统的共性外,HP还支持动态备份选择功能。HP通过本地和故障恢复来支持从 WAN适配器故障中进行恢复的功能。而且,HP还提供了监控CPU队列长度和文件系统自由空间的代理程序。HP的MC/ServiceGuard还支持通过人工干预来确认故障恢复及在接管前配置阈值的能力,通过为监控低交换空间条件提供代理来使系统得到进一步改进。另外,MC/ServiceGuard可监控代理故障,并可自动重启发生故障的代理。虽然 MC/ServiceGuard并不支持集群的文件系统,但是HP仍然可以无需重新安装即可满足磁盘卷所有的改变。
康柏的TruCluster以0.6分的差距屈居第二。康柏能够以本地或通过故障恢复来支持从WAN适配器故障中进行恢复的功能。康柏的集群文件系统无需重新安装即可改变磁盘卷的所有权,TruCluster软件采用了动态备份选择。与HP一样,TruCluster软件使用部署在每一个节点上的资源组数作为决定哪一个节点接管资源组的标准。
集群故障恢复配置能力
对“集群故障恢复配置能力”的考察,主要是针对系统故障恢复、自动配置硬件和系统软件资源的能力。集群系统硬件配置能力决定于系统对于不同种类的服务器、磁盘和用于心跳和客户机连接的网络配置能力;集群软件配置能力则主要决定于系统对混合操作系统版本(能够在运行中升级)、可供选择的中间件和RAID 软件的配置能力。本项目的考察重点涉及:节点/心跳媒体、RAID、中间件/NFS、TCP/IP 地址接管和磁盘互连。
灵活的配置能力可帮助用户保护在外设、LAN、服务器和应用过程中的投资,而“集群故障恢复配置能力”在提高配置集群灵活性方面具有重要的意义,因此该项目获得总评分20%的加权值。
评估项目中的得分情况:
所有厂商的集群系统都支持4个或更多节点,基于硬件的RAID 1和RAID 5,以及在快速以太网、FDDI、令牌环和ATM网络上的TCP/IP地址接管。这就意味着所有参加评测的集群系统均支持大型、灵活的配置,可满足用户广泛的应用要求,而且都支持SCSI磁盘及至少一台TP监视器。同时,参加评测的系统均不支持单个启动服务器或无磁盘集群节点。
但在支持大节点数量、支持心跳讯息媒体、心跳协议优化、 TCP/IP地址故障恢复、磁盘互连支持、WAN线路和磁带驱动器切换、基于软件的RAID 5 以及支持混合操作系统版本等方面,各厂商所采用的解决方案并不相同。
IBM以91.6分获得本项目的第一名。除了具备所有厂商共有的特性之外,IBM在故障恢复配置中可支持16个以上的节点,从而获得了很高的信任度。在参加评测的产品中,只有IBM 的HACMP可支持多达32个节点。如果使用24 路SMPRS/6000S80,HACMP集群系统最多可配置768个CPU。
HP的MC/ServiceGuard获得本项目的第二名。HP的集群系统可支持多达16个节点,使用32路SMPV类服务器,最多可部署512个CPU。 MC/ServiceGuard心跳讯息可以在以太网、快速以太网、FDDI、令牌环和串行线路上传输。对于混合的操作系统版本,MC/ServiceGuard还支持混合心跳媒体。另外,HP还支持集群节点之间专用X.25和SNAWAN线路的故障恢复和磁盘互联,FC交换式多路径例外。
与HP得分非常接近的康柏TruCluster最多可支持8个节点,使用32路SMP服务器可部署多达256个CPU。TruCluster服务器集群软件可在以太网、快速以太网、FDDI、ATMLAN、串行线路以及通过磁盘传输心跳讯息,康柏内存通道互连技术也采用了为心跳优化的协议。TruCluster支持混合心跳的媒体,同时也能够使用基于LAN的路由器在专用的X.25和SNAWAN线路上进行故障恢复。另外, TruCluster还支持共享启动盘,可使用SCSI或UltraSCSI磁盘互连,支持共享磁盘驱动器的故障恢复。
集群并行数据库访问
并行访问允许多个集群节点共享一个物理数据库。它要求Distributed Lock Manager(DLM)来协调并行的请求以更新共享的数据,这样多个用户就不会互相覆盖彼此的更新。并行访问可以加强可伸缩性,并可进行更快速的恢复,从而提升可用性优势。
本项目涉及集群配置、虚拟原磁盘访问和锁定管理,在综合评分中的加权值为10%。
项目中的得分情况:
所有厂商都支持4个或更多的节点,提供共享磁盘和无共享的数据库、冗余DLM讯息路径、多线程DLM、混合式故障排除(HA)和并行访问模式以及基于硬件的RAID 5。但在支持的节点数、虚拟原磁盘、DAM、DLM讯息基于内存的互联、DLM讯息的优化协议和基于软件的RAID 5方面有所差别。
康柏的TruClusterServer软件以90.2分的绝对优势获得了该项目的冠军。TruCluster在并行数据库访问配置中支持的节点多达8个。利用了虚拟原磁盘访问,以及类似于康柏内存通道技术的高速节点互联的TruCluster,在提供并行数据访问支持方面表现出了突出的优势。康柏的TruCluster支持虚拟原磁盘,使用DAM (使用康柏内存通道节点互联)和具有物理磁盘连接主机间请求的动态负载平衡。目前,其他厂商中只有IBM提供类似的技术。
IBM的HACMP位居第二。HACMP在并行数据库访问模式中可支持8个节点对的配置,IBM具有DLM讯息的优化协议、基于核心的DLM 和用户应用的DLMAPI。 |
|