2008-06-04 09:23:00 来源:计算机世界
隐忧 灾难恢复级别不高
虽然目前磁带备份仍然是主流的灾备方式,不过由于受到了磁带数量的限制,再加上企业越来越复杂的数据环境,使得绝大多数企业的灾难恢复级别都不能完全满足企业业务连续性的要求。
自从美国“9·11”事件发生以后,很多企业开始意识到,保持业务连续性不仅是企业必备的一种良好的业务运营习惯,更是当企业遇到重大灾难时,业务能否成功恢复的关键。灾难恢复计划就是为了确保企业在面对各种各样的灾难和突发事件时能够维持业务正常运营的预警机制。
目前,企业的IT部门在设计IT基础架构时一般都会考虑到业务连续性的问题,但是由于关键性的业务数据、应用程序和系统可能会遭遇到不可预测的中断或是不经意间的损失,比如病毒、自然灾难、人为因素造成的错误或故障等,而当遇到这样的中断或损失时,并非所有的企业都能很好地应对,大多数企业在这方面做得还很不够。
不断增加的数据量和数据复杂度、更复杂多变的业务需求,以及越来越多的法规遵从要求,构成了今天企业中的IT大环境,这就不免给企业的数据备份和灾难恢复增加了难度,并引发了很多新的矛盾。在很多情况下,企业加强了对数据的保护,但却忽略了一个重要的问题——为什么要恢复数据;而当企业一旦把注意力放在了数据和业务的恢复上,就会发现,其实只需要重新提供应用程序所需的数据就可以实现恢复的目标。
虽然在大多数企业的业务连续性规划中,都是以业务的高可用性为目标的,而高可用性的需求也正是企业评估并配置数据保护解决方案的重要原因。不过,传统的数据保护更侧重于数据的备份,而却忽略了使用数据的应用程序,这显然不能满足高可用性的要求。
企业通常使用的磁带备份虽然能够满足服务器的存档要求,但是磁带却不能保证关键业务软件的可恢复性。因为从磁带中重建一个应用程序非常困难,且耗时很长。一般来说,如果通过一个磁带同时恢复4个以上的应用程序到一个物理服务器上,将会导致很长时间的延误,而这是在灾难发生后大多数企业所不能接受的。
相信经历了这次汶川大地震的考验后,很多企业和组织都应该深刻意识到了自己的数据和业务在面对灾难时是多么的脆弱,即使是那些已经预先部署了灾难恢复系统的行业用户亦然。来自国外的一组数据也同样证明了这一点,Search Security在对500家企业的IT部门的调查中发现,有20%的企业在日常的夜间备份时不能完全备份所有的数据;有40%的被调查者表示,他们在需要恢复数据时不能从磁带中顺利地恢复它们。
而且,定期的磁带备份只能保证在灾难发生时,将系统还原到灾难发生前几个小时的某个时间点上。如果企业在某天,某个关键业务系统出现了故障,很可能就只能恢复昨天的数据,而这些数据至少已经是12小时以前的了。这也意味着,如果遇到了地震这样的重大灾难,灾难在当天越晚的时间发生,灾后被恢复的数据相对于灾难发生的那个时间点就越旧。然而,在灾后的系统恢复中,任何没有被保存下来的数据的丢失都将是永久性的了。
不言而喻,永久性的数据丢失对于企业来说代价有多高,这其中可能会包括数据本应带来的收入、数据承载的业务价值,以及重建此业务的成本。那些在灾难发生时正在传递的数据重建起来的难度就更大、成本也更高,而这部分数据对于企业来说又是灾难恢复中的重点。
此外,当大规模灾难发生时,如果企业使用的是磁带备份,那么就要先将磁带上的数据恢复到系统上,然后才能开始业务的恢复。这种恢复业务运营的方式至少需要几个小时,而在大多数情况下要花费几天甚至几个星期的时间,而这段时间将会给企业带来很大的损失。据Gartner的研究,大型企业网络宕机的平均损失估计在每小时4.2万美元左右。
事实上,成功的灾难恢复计划的关键就在于,不仅要注重数据的备份,更要关注那些用来获得数据的应用程序。虽然磁带备份仍然是目前主流的备份方式,不过由于受到了磁带数量的限制,CIO们也已经开始寻求一种更有效的方式来弥补在这方面的缺陷。
更何况,使用磁带备份的业务连续性解决方案,通常RTO(恢复时间目标,是指当灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求,也就是从灾难发生到系统恢复服务所需要的最短时间)长达几小时甚至几天,因此根本达不到关键性行业所要求的灾难恢复等级。
虚拟化 新挑战与新方法
在虚拟化已经成为被CIO们广泛关注的焦点的同时,那些开始重新考虑并准备实施更高级别灾难恢复与业务连续性的CIO们却还并没有充分认识到虚拟化在其中的重要作用。事实上,虚拟化技术的应用在给企业灾难恢复带来新要求和新挑战的同时,也带来了新方法。
今天,虚拟化技术在服务器和存储领域的应用,使得企业的很多数据和应用都整合到了一台物理服务器上,这让企业在使用很少资源的情况下完成了更多工作。虚拟化技术可以帮助企业降低成本、简化IT管理,并减少对空间的需求,这已经得到了业界和用户的普遍认可。
不过,当企业的服务器整合任务完成以后,保护和利用好这些虚拟化系统就显得尤为重要了。因为在这些虚拟机上运行着很多关键性的业务软件,显然它们需要更高级别的保护。我们不难想象,虚拟机一旦发生故障将会给企业带来的巨大影响——不仅是单个应用程序的暂停,更是多个应用系统同时停止运行。因此,虚拟化技术使得企业需要更高级别的灾难恢复与业务连续性解决方案来为企业整个虚拟环境下的数据和应用提供保护。
与此相对应的是,虚拟化技术在给企业灾难恢复提出新挑战和新要求的同时,也给灾难备份提供了新选择和新方法。即使是对于那些在IT基础设施建设上还没有采用虚拟化技术的企业来说,虚拟化也可以帮助它们更好地完成灾难恢复的任务。因为虚拟化技术在适应性、弹性以及节省成本等方面的优点在灾难恢复解决方案上同样可以得到很好地发挥。简单地说,虚拟化不但可以减少灾难恢复中所需硬件的数目,还可以简化灾难恢复的步骤。
在数据复制和转移的过程中,我们可以将虚拟机作为第二服务器,而每个用户操作系统都是独立的、未经任何更改的物理服务器镜像。由于很多虚拟机运行在同一台物理设备上,因此在系统恢复中,运行多个业务的物理服务器就能够由一台设备负责恢复了。而每个虚拟机彼此间又是相互独立的,恢复中也就不需要整合,因此在灾难恢复的过程中管理这些应用程序与在运行业务时管理虚拟机的难度差不多。
在美国,总部位于飓风多发区密西西比州的Hancock银行就让虚拟化技术在灾难恢复系统中实现了很好的应用。正是因为密西西比州经常会遭受飓风的袭击,因此Hancock银行必须保证当有暴风雨来袭时,尽可能最晚地暂停业务,同时以最快的速度恢复业务运行。
时间回到2005年,卡特里娜飓风袭击了密西西比海岸,Hancock银行经受了严峻的考验。“当时,我们的损失非常惨重。”Hancock银行的IT经理Ron Milliet说,“我们的IT部门要为银行遍布4个州的150个网点提供IT支持,飓风来临时,IT部门首当其冲。当然,如果我们没有事先部署灾难恢复与业务连续性解决方案,并提前有所准备的话,IT部门势必会遭受到更严重的打击。”
恰好就在飓风来临之前,Hancock银行开始了自己的虚拟化整合计划,不过在飓风到达的时候,这一计划还没有完成。“事后,我们发现,已经完成虚拟化整合的几个小型服务器在几个小时内就完全恢复了,而其他物理服务器完成恢复则用了几天的时间。”Milliet说。
对于Hancock银行来说,卡特里娜飓风证明了虚拟化技术实现了更快的恢复,而更少的硬件和电力成本消耗的优点也很好地显现了出来。此后,Hancock银行将更多的业务转移到了虚拟化环境中,当然除了基于大型主机的银行核心系统以外。(部分案例资料编译自《CIO》)
未来 全面提高灾难恢复等级
事实上,要想全面提高企业灾难恢复的等级,CIO们不仅需要考虑使用新的备份和恢复技术,更要探索怎样的灾难恢复计划才能从整个企业业务构架的角度来保证业务的连续性。
在更复杂的业务环境和更高级别的灾备要求下,企业CIO们需要重新考虑究竟什么样的灾难恢复计划才能从整体上提高企业自身的业务能力。
这其中就涉及了一个非常重要的问题,该如何更合理地分配IT资源,让闲置的设备能够为备份工作所用,或者说是利用这些多余的设备建立镜像站点,又或者是将未被充分利用的资源作为灾难恢复中的一部分。也就是说,用户应该在实现更高级别灾难恢复机制的同时,最大限度地节约成本、降低开支。
位于亚特兰大的一个温泉度假村过去一直使用的都是传统的磁带备份系统。但是,度假村负责IT的副总裁John Forelli认为,磁带备份不仅速度慢,而且很难保证系统运行的一致性、连贯性。“更严重的是,磁带备份系统占用了大量的网络资源。”Forelli说,“在我们的酒店里有2000间客房,且需要24小时不间断营业,因此很难找到一个合适的时间,在不影响酒店整体运营的前提下进行数据的备份。”
在2006年,度假村的管理层决定使用虚拟化技术和备份软件来提高数据备份和业务恢复的能力。系统部署完成后,度假村可以使用虚拟机恢复备份在物理服务器上的数据,在断电等情况下也可以自动保存数据,而这是通过自动切换至另一备份系统而实现的。“如果有用户在系统备份时在使用度假村的预订系统,请求服务将会转到相应的灾难恢复虚拟机上,而对于用户来说,这一过程不会受到任何影响。”Forelli介绍说。
“而且,复制过程是渐进的,因此不会给网络增加压力。”Forelli补充说。“相信这也是虚拟化技术在灾难恢复中获得了重用的原因之一。”Gartner的分析师Donna Scott说。
除此之外,WAN优化以及基于电子邮件的备份应用都能降低灾难后的恢复时间、降低成本,更重要的是提高业务面对大型灾难时的连续性和可信度。因此,企业可以选择各种不同的方式全面提高企业的灾难备份等级。(部分案例资料编译自《CIO》)
灾备刻不容缓
距汶川大地震的发生已经有整整三个星期的时间了,如此大的灾难给当地及周边地区居民的生命及财产造成了极其重大的损失。面对这场突如其来的地震灾害,除了灾后紧急救援、积极捐款捐物之外,我们还应该做些什么呢?随着抗震救灾工作的不断推进,人们对此问题的思考也更加深入。
政府机构、各大行业,特别是银行、电力、保险、税务等关系国计民生、担当社会正常运转“脊梁”的企业和机构是否应该反思:针对像地震这样的大范围、大破坏性的突发性灾难是否应提前有所准备?是否已将地震列为重要风险,并在做风险分析和业务影响分析的同时制定出相应的应急预案?是否部署了灾难备份与业务连续性系统,以保证数据不会丢失和业务的迅速恢复?现有的灾难恢复规划是否在此次大地震中经受住了考验?
国家安全标准化委员会“信息系统灾难恢复规划”课题组组长汪琪在此次抗震救灾过程中指出,银行、保险等关键性行业如果能够在应急预案开发的过程中将地震危害以及对业务的影响分析得更透彻,并制定出更适当的应急预案,就可以实现灾后业务的快速恢复。
值得庆幸的是,在此次汶川大地震发生后不久,当地的银行及农村信用社很快就在临时帐篷中恢复了业务,并制定了很多利民政策,以保证受灾民众能够顺利地取到钱。在经历了如此大的灾难之后,各大银行及农村信用社所做的这些努力对于受灾民众的意义我们不必多说;而银行系统能够做到在第一时间快速恢复业务,取决于它们实施了灾难恢复与业务连续性方案,并进行了数据大集中。据介绍,灾后的数据恢复程度达到了82%。
当然,我们也应该清醒地认识到,数据恢复的程度还只是82%。此外,我们必须给予高度重视的是,在受灾网点恢复营业和与总行数据中心相连的过程中还暴露出了很多问题。看来,即使是一直都将信息化建设作为首要任务的金融行业在灾难恢复方面做得也还不够,更何况是其他行业。据悉,在此次大灾发生后,大部分行业和机构的数据和业务恢复程度都还没能达到金融行业的水平。
可以说,汶川大地震给我们敲响了警钟,各大行业、政府机构,尤其是那些关系国计民生的关键性行业应该也必须拥有更高级别的、完备的灾难备份和恢复机制,以保证业务能够在第一时间恢复运营。(文/田梦)
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。