首页 > 基础设施 > 正文

如何在虚拟化环境中保证业务的持续性

2009-02-13 09:29:28  来源:IT专家网

摘要:虚拟化技术正在许多分市场获得重要的吸引力。据市场研究公司IDC发表的全球每季度服务器虚拟化跟踪报告称,2008年第二季度全球虚拟化软件许可证销售量同比增长了53%。
关键词: 虚拟化 业务 持续性

    虚拟化技术正在许多分市场获得重要的吸引力。据市场研究公司IDC发表的全球每季度服务器虚拟化跟踪报告称,2008年第二季度全球虚拟化软件许可证销售量同比增长了53%。包括减少硬件和软件成本、改善灾难恢复功能和降低能源使用在内的虚拟化的许多好处也引起可必须加以考虑新的业务持续性问题。

    当企业用在一台物理服务器上运行的虚拟机替换多台物理服务器的时候,管理程序和它运行的物理服务器平台将成为一个单个故障点。更糟糕的是这个单个故障点并不仅限于一台服务器,它扩展到在那个服务器上托管的所有的虚拟机。如果这个物理服务器发生故障,这种经典的“把你的鸡蛋全部放在一个篮子里”的问题可以导致灾难性的后果。

    市场研究公司Forrester Research的分析师Natalie Lambert同意这个观点。他认为管理程序是虚拟化环境中的主要安全漏洞。她指出,攻击者能够从一个被攻破的管理程序访问数千个台式电脑。

    意外的关机时间

    把虚拟化应用到数据中心的一个最诱人的理由是服务器可移植性。通过把虚拟机文件存储在一个替代的服务器上可以简单地把一个虚拟机从一台服务器迁移到另一台服务器上,不用考虑这个集群服务器的构成和型号。在制定灾难恢复计划的时候,这种可移植性是非常诱人的。考虑到服务器部署的灵活性,虚拟机的恢复没有从磁带恢复传统的物理服务器那样复杂并且代价是非常便宜的。

    采用传统的备份好恢复技术,全面的备份是定期实施的(如每个星期、每天或每个小时)。然后,逐步的和差异化的备份是定期进行的(在正常计划的全面备份的间隔时间内实施)。在发生灾难的时候,恢复工作包括最近的全面备份和可用的任何逐步的备份或者差异化的备份(当然,这个前提是在灾难恢复站点的这些备份是可用的。但是,情况并未如此)。

    根据这个过程,恢复时间可以需要几个小时并且恢复点仅仅是与最后可用的备份一样好。在发生灾难的时候,即使有可移植的虚拟机的好处,用户也可能失去大量的重要数据或者需要投入大量的时间进行灾难恢复。这些结果可能都不会满足企业的恢复时间目标和恢复点目标。

    IDC预测称,在2007年,服务器关机时间使企业在失去销售收入和降低生产率方面付出了大约1400亿美元的代价。避免出现这种混乱局面的关键是采用连续不断的数据复制技术。

    有许多这种技术的提供商。他们都能够把实时的虚拟机数据从主服务器复制到位于同一个数据中心、替代的站点或者在这两个地方的备份的服务器。首选的方式是在替代的站点进行备份,因为意外的关机时间通常是由电源中断和气象应急事件引起的。这些情况可能影响到主要服务器和备份服务器,如果这些服务器都在一个地方的话。复制的或者备份的虚拟机能够以最短的时间或者在没有数据损失的情况下恢复服务。灾难恢复还可以通过网络实施,从而消除了投资资源以便从备份媒介恢复数据的需求。

    对于希望实施全面的自动化灾难恢复的机构来说,应该部署高可用性的集群。这种技术能够保证在主机服务器发生故障的时候,这个主机服务器托管的虚拟机能够在一个替代的服务器上恢复。这就要求所有的虚拟机都存储在一个共享的光纤通道或者iSCSI阵列中。

    如果这个共享的存储阵列发生故障会发生什么事情呢?如果出现地区性停电会发生什么事情呢?共享的存储设备应该取消,因为这种设备有安全的风险。使用实时数据复制的地理上分散的集群是更好的选择,能够使机构避免受到地区性停电、飓风和其它气象现象的影响。特别是把主要服务器与备份服务器之间的距离设置至少相隔500英里有助于把风险降低到最低程度。

    计划的关机时间

    虽然意外的关机时间比计划的关机时间更受关注,但是,后者仍是许多企业非常担心的问题,特别是那些在安全、金融服务、在线购物和其它运行时间非常重要的领域的企业。要得到“五个九”(99.999%)的可靠性或者每年不超过5分钟15秒的关机时间,企业需要有效地管理计划的关机时间。

    计划的关机时间占数据中心中断的大多数时间,因此,有效的管理是非常重要的。一台主机服务器计划的关机时间影响到那个系统中的全部虚拟化的工作量。在某些情况下,这就意味着在主机服务器进行维护的时候(如操作系统补丁下载、硬件更换等等)数十个虚拟机必须要离线。一般来说,这样的关机时间数量是不能接受的。虚拟化导致在计划的维护期间受到影响的工作量成倍地增加。

    在计划的关机时间情况下,管理员不需要像在意外的灾难恢复时在一个备份的服务器上的重新启动一个虚拟机。在大多数情况下,管理员能够把虚拟机迁移到一个附近的节点,在把虚拟机迁移到备份的服务器的过程中只会产生很短的中断时间。例如,当需要服务的硬件是存储这个机构虚拟机文件的存储局域网,这个正在使用中的虚拟机就可以迁移。

    总结

    传统的服务器崩溃造成的失去几个小时的工作效率是非常糟糕的。根据存储在主机服务器上的虚拟机的数量,那个灾难可能产生二倍、三倍或者更多倍的影响,你将看到巨大的业务影响。虚拟化能够为企业提供巨大的好处,但是,只有在正确实施的时候才能提供这种好处。

    由于虚拟服务器固有的安全漏洞的增加,机构必须要在自己的虚拟化环境中强制执行明确的灾难恢复计划和高可用性计划。机构需要保证他们没有通过暴露一个单一的故障点而把所有的鸡蛋都放在一个篮子里。机构还必须要考虑地理、与气象有关的关机时间的可能性以及是否实施全面自动化的灾难恢复等因素。许多机构没有认识到在灾难恢复的时候人力资源是很缺少的。因此机构通常最好是让大多数过程实现自动化,尽可能使备份站点与主要服务器之间的距离远一些。

    制定灾难恢复计划的最佳时间是在实际灾难发生前的很长时间里完成。随着企业继续深入地实施虚拟化,企业必须要同时采用可靠的业务持续性做法,否则,机构就会面临重要的关机时间和数据损失的严重风险。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。