LifeKeeper for Linux 双机热备、双机热备软件、双
发布时间:2014年01月15日
详细说明
北京三木联合信息技术有限责任公司
联系人:李明 电话:010-51657615-811 手机:134552346572
QQ:157725879 网址:http://www.samer.com.cn
Linux 上的高可用性
SteelEye公司的产品 LifeKeeper for Linux 是一个通过保持系统正常运行而确保应用具有持续可用性的软件。LifeKeeper实现以集群方式连接在一起的Linux系统的高可用性,这是通过监控系统及应用的健康状态、保持客户连接性并为任何客户–无论位于互联网、内联网还是外联网提供不间断的数据访问。
为了使系统及应用能在宕机时自动恢复,LifeKeeper允许将应用在发生错误时切换到集群中的其他服务器。这有助于LifeKeeper将单点故障的风险降到*低,从而在Linux系统上创建一种抗错环境以满足关键任务操作的严格可用性要求。
抗错
LifeKeeper为Linux环境提供抗错(FaultResilience,FT),这是通过允许同一集群内的其他服务器接管失效的服务器和失效的应用。总拥有成本的降低是因为LifeKeeper支持服务器的 Active/Active 配置。该种模式下不再需要专门购买用作热备份的服务器,从而允许客户和应用在失效时恢复到集群中正在运行其他应用的服务器上。
前瞻性保护
有了LifeKeeper,某个硬件部件或应用的失效可通过多种错误检测机制被提前检测出来而不会等到系统完全失效。LifeKeeper 使用智能的进程和多条 LAN 心跳连接来监控 Linux 集群。在两台服务器节点之间定时发送额外信号而确定系统和应用的健康状态,LifeKeeper在采取任何行动前首先确认系统状态,这降低了单点故障的风险,使故障切换情况*少发生。当应用失效但硬件仍能正常工作时,LifeKeeper首先只恢复失败的应用而不会马上完全切换到另一台服务器,限制了不必要的切换。
透明的故障切换
如果因为某个事件的发生而导致服务器可用性的中断,LifeKeeper自动将保护的资源和应用转移到集群中的另一台服务器上。因为切换过程对客户端是透明的,单个系统的失效不影响用户的工作。LifeKeeper 迁移所有的应用和传输连接性的方式使用户能够继续访问应用和数据。这保证所有客户–从内部用户到在线客户–都不会受到系统失败的影响。
伸缩性
LifeKeeper 提供一个集群框架,允许通过简单地往集群中增加节点而使应用支持更多的用户。为了确信提供失效保护,LifeKeeper 还在应用级支持伸缩性。当LifeKeeper 以多向配置安装时,某台机器上的多个失效应用可以恢复到不同的机器。
数据访问与完整性
当 LifeKeeper 运行于共享存储环境下,数据存储是与集群中的服务器分开的。所有数据保存在外部共享磁盘中。这种独立性允许在访问数据时不必考虑是通过哪台主机上的应用,而且 LifeKeeper 的共享存储锁定机制通过对磁盘的锁定使其在任何时刻只允许一个应用存取,维护了数据的完整性。
恢复操作
LifeKeeper 为 Linux 环境提供保护,支持容灾、多系统失败恢复以及更快速的恢复,这包括:
多向恢复
LifeKeeper for Linux 支持一种多向故障切换配置的四节点集群,其中相关的两个节点连接到同一共享磁盘。
支持共享数据
LifeKeeper for Linux 支持 N+1 配置。LifeKeeper 在每条共享SCSI总线上支持两个节点。这允许在集群中连接到同一共享磁盘的两个节点之间实现基于共享SCSI磁盘的应用恢复。在该配置下的服务器扮演 Active/Active 角色,为集群中的任何其它节点提供故障备份。
多级失效切换
LifeKeeper for Linux 允许在*多32个活动节点之间实现多级故障切换,保证在发生系统或应用失败时客户能够继续访问。
应用恢复工具包(ARK)
SteelEye 为商业软件提供 LifeKeeper 应用恢复工具包,包括数据库、Web服务器和应用服务器。这些应用恢复工具包提供 LifeKeeper 管理和控制某个特定应用的工具。当安装了特定应用恢复工具包后,LifeKeeper 就能监控该应用的健康状态并在其失败时进行自动恢复/切换。
SteelEye 同时还提供应用恢复软件开发工具包(SDK),支持开发特定的应用恢复工具包。应用恢复SDK为开发用于专门应用以及商业应用服务器的定制恢复例程提供强大的框架。使用了SteelEye的应用恢复SDK,特殊的恢复例程可以通过编写直接的应用恢复脚本而定义。
在维护与升级时仍然保证运行
LifeKeeper 允许在计划停机维护或升级期间以及在系统失败或应用停止响应时保证系统的运作。LifeKeeper 的抗错能力可用于方便系统或应用升级。有了 LifeKeeper,一般用于日常维护或升级的停机时间可以大大减少甚至消除。