Avamar是全球第一的源端重复数据删除技术,Data Domain是全球第一的目标端重复数据删除技术。Data Domain和Avamar到底有什么不同呢?先来看看什么是重复数据。
什么是重复数据?
重复数据有两种理解方式:一种从文件角度看,两个文件一模一样,比如我们通过邮件发送文件,我们这有一份,别人也有一份;另一种以数据块角度看,文件或数据库,切成小的数据块,数据块是几KB。切的数据块不是定长的,它会智能的分析数据,然后做变长的切块,同一个文件切出的数据块可能是4K、8K、 10K,根据算法做除重运算。
重复数据删除技术分类
1) 以除重操作发生的位置来划分:
1. 在数据源端(基于主机)备份,备份之前就做除重了,然后再备份,比如Avamar。
2. 在备份端来做除重,在线处理(Inline或联机处理),Data Domain就是这一技术的代表,这一方式中,数据在读进来之后,在存到磁盘之前就已经进行了重复数据删除,也就是一边备份,一边除重。In-line的优势是节省了磁盘空间,同时重复数据删除一步到位,特别简单,但缺点是对CPU的损耗非常大,会占用大量CPU资源,导致性能下降。
最终用户应该先弄清楚,自己的重复数据在哪里发生的最多,再决定是不是在那个位置来进行重复数据删除。假如是在一个企业内部,发件人给所有员工发了一封带附件的邮件,这些数据都是存储在主机上,这种情况下可以采用基于主机的重复数据删除。
2) 以重复数据删除所采用的技术来划分:
1. 文件级别的除重:删除重复的文件,一般采用hash或逐个字节比较的方法;比如EMC Celerra 的除重技术。
2. 固定块除重:先把文件进行固定大小的切块,然后对每一个块进行除重,因此对CPU的要求非常高。
3. 变大小块除重:和固定块除重类似,只是切块方式更灵活。DD和Avamar都使用了这个技术。
4. 数据压缩:一般认为压缩和除重是两个不同的概念,其实压缩就是个变大小的位级别的除重。EMC Celerra 如果你使用了除重技术则默认打开这个功能,当然你也可以不使用压缩技术。
Data Domain和Avamar的区别
有了以上基础,我们正式切入正题。DD和Avamar的区别就很清楚了。
Avamar
EMC Avamar 软件先缩减源位置的备份数据量,然后再跨网络传输数据并将数据存储到磁盘,实现了快速、高效、可靠的数据保护。与传统解决方案不同,Avamar 可找出在全球范围分布的所有服务器、台式机、笔记本电脑和办公室中存在的冗余子文件数据段。Avamar 获专利的全局重复数据消除技术可确保备份数据段在全局范围内仅存储一次。这可有效地将每日移动和存储的数据总量减少到1/500,也可通过现有局域网/ 广域网带宽进行每日完整备份,以保护其关键数据。Avamar 采用高效的重复数据消除技术,使得保护主数据所需的磁盘空间减少到1/50,从而延长了企业保存磁盘备份的时间。此外,通过释放存储空间,可以减少增加更多物理存储的需要,从而大幅降低诸如占地空间、电源和制冷等方面的资本支出和营运成本。
Data Domain
Data Domain有独特技术–inline除重,在线除重。Data Domain是在CPU内存做除重运算,数据不会先写在磁盘上,而是通过运算再写到SATA上,这和传统的其他VTL除重方面最本质的区别,其他VTL因为除重效率的原因,先把数据写在SATA盘上,然后读出来除重,再写回去,和Data Domain相比这对后端磁盘读写的压力是3倍,这也是Data Domain的优势。
在EMC的重复数据删除技术蓝图中,Avamar和Data Domain被赋予不同的工作目标,Avamar更侧重于源端,更偏向在VMware虚拟化环境、备份服务器、在线复制等应用领域,其最新的进展是EMC将Avamar推进到了桌面和移动办公领域;Data Domain的工作则更多的侧重在目标端,即业务系统后端所连接的存储、备份和归档、容灾设备。
Avamar软件和Data Domain重复数据删除存储系统是目前EMC重复数据删除解决方案的核心,见下图。
Avamar与Data Domain的重复数据删除方案组合有相当充足的理由:
Avamar是软件,Data Domain系列产品是硬件,两者相得益彰; Avamar采用的是数据源端的重复数据删除技术,而Data Domain系列产品的核心是目标端的重复数据删除技术,两者互补性强,可以构成全面的重复数据删除解决方案。
EMC Avamar 6.x版本能使用升级版的Data Domain集中化数据存储,以及Avamar自有的Data Store(现容量翻倍)。在数据文件通过网络链路发送到Data Store之前,Avamar软件会在源端对其进行重复数据删除操作。传统重复数据删除系统被作为目标系统,当数据文件达到系统之前(在线重复数据删除, 例如Data Domain)或者之后(后处理重复数据删除)进行重复数据删除操作。
Data Domain使用备份服务器来对发送到Data Domain系统的备份文件做部分重复数据删除,从而提高重复数据删除的速度。这就是所谓的DD Boost。因为DD Boost是基于策略内嵌于Avamar客户端的,所以Avamar 6.x可以在将数据发送到到Data Domain系统的时候使用这种技术。
Avamar 6.x可利用内嵌的DD Boost向Data Domain目标备份Exchange、Oracle、SharePoint、SQL Server和VMware镜像。Avamar自有的Data Store有效容量翻番达到124TB。与之相比,DD890目标系统可用容量为285TB。用户能够将DD Boost所支持应用的备份发送至Data Domain目标,而其他应用备份将发送至Avamar Data Store,以此最大化备份整体性能,并加速Avamar客户端。
Avamar的关键优势
Data Domain 是一种基于目标的重复数据消除设备,它采用的方式与 Avamar 的重复数据消除方式有天壤之别,但很多人通常将 Data Domain 与 Avamar 一同归为“重复数据消除”工具。与 Data Domain 相比,Avamar 有几项关键优势,这些优势可分为以下四个类别:
1. Avamar 在客户端消除重复数据— 在通过网络传输之前。这使每日完整备份速度提高 10 倍之多,同时将每天所需的网络带宽缩减了 500 倍之多。Data Domain 依赖于传统的备份软件,这些软件每周通过网络和备份服务器移动的数据量大约为受保护的主数据的 200%(非常低效)。所以说,Avamar 解决了由网络拥塞和备份服务器产生的备份难题。而且 Avamar 特别适合于 VMware 环境,因为备份数据在跨底层物理服务器基础架构传输之前就已经缩减了。另外,较小的远程办公室可以只部署 Avamar 软件代理(不需要增加硬件)。Data Domain 在每个场所都要求添加硬件。
2. Avamar 通过获专利的 RAIN 技术提供了服务器的高可用性,因而客户可以放心且经济高效地在磁盘上存储多年积累的备份。Data Domain 依赖于可能会成为单点故障的备份服务器;如果备份服务器发生故障,从 Data Domain 应用装置恢复数据将不现实。另外,Data Domain 应用装置可能成为性能瓶颈,因为数据在存储到磁盘之前执行的是线内消除重复。Data Domain 还缺少自动化的每日备份数据和服务器完整性检查。
3. Avamar 实现了简单的一步恢复,省去了为达到所需的恢复点而恢复完整备份接着恢复后续增量备份的麻烦。Avamar 还为 Avamar 环境提供了集中化管理和一目了然的控制板监视(Data Domain 不提供此功能)。
4. Avamar 为灾难恢复提供了完整复制。与 Data Domain 不同(Data Domain 要求在目标站点配一个备份服务器以便执行功能性灾难恢复),Avamar 的复制同时包括服务器和存储器,所以它随时都可以从磁盘存储立即执行恢复。
此外,Avamar 是一种软件解决方案,它可以使用开放的存储平台,并且可以扩展到比 Data Domain 的应用装置更高的容量。
Data Domain,Avamar和Networker的结合
就目前看EMC不会把这Data Domain和Avamar结合在一起,但是Avamar可以和Networker结合的。
比如现在Networker的备份客户端已经有两种选择:Networker备份客户端在备份时,可以选择要除重还是不要除重。如果不要除重,把它备份到 Networker后面管理的其他备份设备上,可以是磁带也可以是磁盘,甚至DD都是可以的;另一种,在备份客户端上,有一个选项是带除重的选项,这时选 中后,备份设备备份到Avamar设备上,这个结合的好处:用同一个客户端选择要除重还是不要除重,并且整个备份策略是由Networker统一管理的, 也就是说这个数据用了除重或非除重的备份方式,备份的数据存在什么样的备份设备上,还有备份策略、备份周期,是什么样的都是由Networker来管理 的,所以有一些客户已经把Avamar和Networker结合起来一起使用了,至于以后会不会和DD结合起来再使用,如果有这样的案例会介绍给大家,因 为两个产品刚刚整合到一个部门里,看以后本身方案的发展。