CDP是一种数据的连续时间点的保护技术,其根本作用是能在故障瞬间完成任何时间点的故障恢复,达到业务的快速连续的作用,从根本上解决传统备份中低恢复能力和非精细时间策略(如按照天的备份)的先天弱点。这种技术的诞生造成了备份领域和灾难恢复领域的一次革命,今后数年,人们仍将看到这种技术带来的深远影响和颠覆传统容灾备份的划时代意义。要理解CDP的新和奇,我们还是要分析传统的容灾和备份技术。
全球经济一体化的今天,信息系统越来越成为社会生产能力的枢纽和重要支柱,人们忽然发现,今天,信息系统的安全竟然能够成为决定我们生死存亡的核心棋子,我们再也不能在常规意义上来看待这具有举足轻重地位的“大脑”。我们四路环望,信息经济包围了我们,也产生了巨大的喷薄欲出的新的发展动力。政府开始朝向服务型方向演变,电子政务系统越来越成为政府和百姓的连接桥梁,其作用比肩“血管”。电信领域日新月异的新一代网络技术的飞跃,无一不构建在信息系统的的巨手支撑之中。能源系统的发展,已经完全依赖于信息管理系统所构建的“主动脉”。多年以来,人们在认识到信息化社会的典型特征的同时,逐渐在多种程度上开始对于信息技术的安全问题加大投入,施以重墨。数据备份技术的发展,从无到有,从小到大,成为各企业信息系统的一门必修课。但是,“21世纪的珍珠港事件”的爆发,曾给世界经济带来了极大的负面影响,也使得越来越多的人们对于各业务运行的灾难抗御能力提出了反思,人们发现,天堂与地狱仅一墙之隔。可以说,“备份”已经成为众多信息系统的基本信息保护方式,而“容灾”的概念在今天月来越显得万分醒目。
当企业因为信息化带来快捷的服务决策和方便管理时,也必须面对着数据丢失的危险,数据大集中也会聚集风险,这是人们意识到的一点。数据的丢失会中断企业正常的业务运行,造成巨大的经济损失。
当今天的人们在高谈容灾和业务连续性,在议论备份系统的选与见时,人们忽然发现了一个令他们困惑的谜团,这就是,所有的灾难我们都能防御吗?所有的灾难我们都能快速恢复吗?
容灾和备份,首先要清楚容什么样的灾,其次要清楚灾难后如何恢复,采用何种技术和管理手段确保信息系统能够在系统之后的快速再建、数据如何利用后援手段确保最小程度的丢失。根据国务院信息办今年颁布的《重要信息系统灾难恢复指南>中所述定义,灾难指由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。灾难恢复指为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态、并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。
具体来说,我们可以将常规的业务系统故障风险分为几大类:
- 系统的物理故障风险,如主机系统、网络系统、数据库系统、存储系统等。
- 网络的安全风险,如大规模的网络入侵、黑客侵入、病毒的侵扰等
- 系统的变更风险,如组织变更、系统升级等
- 系统的环境风险,如突发自然灾害(包括地震、大规模停电、水灾、火灾等)
- 人为的错误,包括程序错误、人工误操作等
人们经过认真分析发现,常规的容灾系统具有保持业务在上述1-4类风险下的业务恢复能力,而第五类的人为错误只能依靠备份系统来恢复,但这类故障确是各类故障中发生频率最高的。
乱花渐入迷人眼。人们发现,一个美好的灾难备份系统建设的愿望,在实践中往往是那么的过程繁杂,抉择难断。容灾系统固然可以通过各种复制手段解决大多数类型的故障的业务快速恢复问题,但是建立容灾系统的成本是相当高昂的,而且人们仍然要面对最易发生的人为故障无法医治的难点。过去,只能采用常规的备份系统。数据备份系统,是指为防止系统出现操作失误或系统故障导致数据丢失,而将数据集合从应用系统中以备份格式到处到离线的存储介质的过程,在数据备份过程中,一般采用备份软件和磁带库的物理介质保存系统配合来进行。 而常规的备份系统实际上采用的是粗放型的备份策略,如按照日月年等策略进行的各种全备份和增量备份,以及辅助进行的合成备份等(由于备份设备的制约和容量的限制,精细化的备份是不现实的)。在一般的备份系统中,常见的是每天一次,也就是对于数据的实时性或近实时性并不提供保证,而且,备份出来的格式是专用的备份格式,并非应用系统中的数据原有格局,恢复时一定要通过格式转换进行倒回操作,因此也并不保证恢复的快捷和精细化的时间点恢复。举例来说,一旦系统存放了1TB的数据,并且按照日增量进行备份,一旦当日中午11:00发生意外,需要全数据的恢复,那么我们只能恢复到上一个恢复点(如昨日23:00),而且,恢复的用时可能会在5小时以上,这还要取决于增量备份的份数。这样的恢复能力,远远满足不了用户越来越高的安全要求和服务要求,需要有一个契机和一个新的技术的诞生,来达到以用户为中心的数据安全和系统安全的要求。
在容灾体系中,人们往往采用RPO(灾难是的数据保存点)和RTO(灾难后的业务恢复点)这两个指标来衡量容灾体系的应急能力和系统保护能力。一般而言,容灾系统确保RPO指标的基本要求(也就是仅仅考虑数据要保存到接近故障点)以及一些系统更高的RTO指标的要求,也就是灾难时要考虑业务的处理系统的快速恢复能力。由于一般容灾系统采用的复制技术的局限,往往在数据库等业务恢复时,遇到一致性要求的数据回滚问题,这往往会使得应用的启动会耗费一定的时间(RTO无法达标)。而能够解决人工故障恢复问题的传统备份技术,RPO指标和RTO指标都远远无法达到容灾的要求,因为备份技术诞生时的业务连续性要求今天已发生了根本性的改变。设想一下,恢复到上一个备份日以及数小时的恢复周期,这已经落后于以信息为动脉的现代信息社会的要求。
实际上,现在已经产生了连续数据复制保护和多点影像保护的技术,这就是CDP的数据连续性保护技术,这一技术的出现,真正使得数据的点备份变成了连续跟踪数据变化的多点精细跟踪技术,使得传统意义的备份系统已经淡化,而快速恢复以及任意时间点恢复已经成为现实。
CDP 技术的先行者以美国飞康虚拟存储公司的CDP架构为代表,具体实现的机理是:首先利用连续或间隔型的复制策略,实现用户系统内的包括系统数据在内的数据连续复制(即可以支持到本地的复制,也可以同时进行到异地的复制),以确保灾害发生时,数据恢复到最新的时间点,同时,采用配合复制的时间点快照技术(如TimeMark),连续产生多个时间点固定影像(可以按照每小时的间隔或分钟的间隔),这些影像不仅时间精细化,而且是直接可用的image,人们无需进行任何改造,直接mount即可使用。大量的渐进性故障,如病毒的侵袭、人工的误操作、软件的BUG等等发生时,人们大可不必惊慌,因为你所做的只需要找到系统中存留的影像(如几分钟前的),进行简单的空间重新定位(不到一分钟),你就会愉快地看到被破坏的数据又重现光明,灾难压力化解于无形。当然,你还可以利用这些数据的多点连续快照,进行任何的开发和挖掘工作,数据的价值得到充分利用和增值。
我们再看一下,试想,系统完全损坏后(包括硬盘),几分钟内,系统又通过远程引导和恢复了起来,这在传统的恢复技术中是不可想象的,飞康的CDP构架(内部的disksafe组件)实现了,通过虚拟化存储技术,存储服务的多项难点被突破,人们的多个梦想被实现,这实在是人们办公、生产时的福音。CDP技术的出现,真正意义使得数据复制和备份具有了高性能的RPO和RTO的能力,克服渐进式的灾难具有了杀手锏。这一技术将在不远的将来对于容灾技术和备份技术的架构产生又一次修正。
美国飞康软件公司的CDP架构具有以下的一些特点:
- 不间断的或基于策略的磁盘卷的数据复制
- 用户端的数据复制和可对全部磁盘或个别文件进行的数据恢复
- 集成基于数据库时间点恢复的快照代理
- 支持通过FC、iSCSI HBA或PXE的远程启动
- 通过“恢复光盘” 可快速修复系统
- 将数据库相关的磁盘卷编组,同时附加策略,以保证数据库的数据交易一致性
- 将RPO和RTO优化至最佳
- 多种的远程复制策略
目前,CDP 技术也成为了其他一些存储厂商所关注的焦点,一些传统的存储备份技术也在悄悄地发生着变化,融入CDP的数据多点快速恢复的元素。对于用户而言,CDP技术完全是应用的要求、是信息化的要求、是服务水准的要求,CDP 技术带来的无穷价值毋庸多言,用户从中受到的益处是十分巨大的。越来越多的人在感受着这一点,这也是存储技术发展的技术结晶。
总之,建立强大的灾难抵御系统,需要我们善于理性分析、跟踪存储技术的脉搏,与时俱进。拨开迷雾,康庄之路在眼前。紧跟存储脉搏,成功不再遥远。