和力记易:论CDP的前世今生
和力记易 发表于:13年09月02日 10:29 [综述] 存储在线
一、CDP的诞生
CDP(Continuous Data Protection),从字面上来看,它是一种持续的数据保护。而持续的意思是不间断的进行,对于一件事情,不间断的进行有很多种理解。比如跑步,每天跑50分钟,这属于持续的锻炼身体;比如做好事,日行一善属于持续的积德。但是跑步也好,行善也好,虽然是在持续的做,但是两次中间存在间隔,并不是一直在跑步,也不是一直在行善。
所以CDP最早的概念就是每天都做数据保护,每天都备份,并没有更细分的指标。所以在2005年前后,IBM的TSM产品振臂一呼:数据保护仅七天做一次不行,要每天都做,要CDP!这可以说是CDP概念的最早提出。此时它应用在数据备份领域还是一种存在备份间隔有明显备份时间窗口的计划备份。
二、CDP的进化
随着大数据时代的全面来临,人们正式进入信息消费时代。信息数据和所有人都已经密不可分,这就使得数据的安全性必须被提高到一个前所未有的高度。如此一来针对数据的备份如果还存在备份间隔的窗口,将会导致备份间隔之内的数据丢失,间隔越大,丢失的数据越多!这是信息消费时代所不允许的。
这就必须来缩短备份窗口,减少备份间隔来减少数据的丢失,最理想的状态就是零丢失,那就意味着备份间隔为0,即不存在备份窗口。
为了更好的表达这种CDP状态,又引入了两个概念:RPO和RTO。
RPO(Recovery Point Object):恢复点目标,指出现灾难的时候会丢失多长时间的数据,即是备份间隔
RTO(Recovery Time Object):恢复时间目标,指出现灾难的时候多长时间可以让业务继续运作,即恢复时间。
有了这两个标准,那么新的CDP概念将备份全新的诠释,需要做到RPO=0,RTO趋近于0,才能被成为CDP。为了使这个新的概念和几年前的CDP有所区分,业内正式把之前的CDP概念称之为:Near CDP(准CDP),而现在新的概念称之为True CDP(真CDP)。
三、CDP的国际标准
在这里不得不提到一个一直在关注CDP的组织,它就是SNIA。全球网络存储工业协会(Storage Networking Industry Association,SNIA)是成立时间比较早的存储厂家中立的行业协会组织,宗旨是领导全世界范围的存储行业开发、推广标准、技术和培训服务,增强组织的信息管理能力。
作为一家非盈利的行业组织,拥有420多家来自世界各地的公司成员以及7,100多位个人成员,遍及整个存储行业。它的成员包括不同的厂商和用户,有投票权的核心成员有Dell、IBM、NetApp、EMC、Intel、Oracle、FUJITSU、JUNIPER、QLOGIC、HP、LSI、SYMANTEC、HITACHI、Microsoft、VMware、Huawei-Symantec十五家,其他成员有近百以上,从成员的组成可以看出,核心成员来自核心的存储厂商,所以SNIA就是存储行业的领导组织。
SNIA从2005年就开始成立了一个5人的CDP研究小组,这个小组历时6年,在2011年出台了一份研究文档,给予了CDP更加细致准确的概念,并清楚的明示了哪些不是CDP。
什么是CDP:1、有变化就备份;2、至少备份到另外一个地方3、可以恢复到任意时间点。
CDP可以实现:1、数据0丢失;2、任意时间点回退;3、快速恢复;4、全时段保护。
实现CDP的方式:1、基于块;2、基于文件;2、基于应用。
什么不是CDP:
1、复制不是CDP:同步复制只有一份数据;只有有限个点快照。
2、快照不是CDP:快照存在时间间隔;两个快照之间的数据可能丢失;频繁读取操作系统;在数据、文件、应用和系统间缺乏嵌入式关联。
3、定时备份不是CDP:指定备份计划;通过日志定时备份。
从这份文档中,我们可以很清晰的给出CDP的定义:实时备份、异地容灾、任意时间点回退(Any Point In Time)。
四、国内的CDP厂家
根据CDP的国际定义,其中最难实现的当属任意时间点回退。因为对于结构化的数据库数据来说,不但要能实现任意时间点的回退,还要能保证每个可以回退的点都是可用的有效点。这就需要建立在对数据库的物理结构以及内部逻辑结构非常熟悉的基础之上!
北京和力记易科技有限公司十年磨一剑,在Windows、Linux以及Unix下的对主流的数据库的各种版本建立了强大的分析模型,获取了内部的物理结构,分析出了逻辑关系,从而保证了结构数据回退的100%可用!属于目前国内唯一的True CDP厂家。