Data Domain和Avamar到底有什么不同?

IT168 发表于:12年04月27日 10:18 [转载] IT168

  • 分享:
[导读]Avamar是全球第一的源端重复数据删除技术,Data Domain是全球第一的目标端重复数据删除技术。Data Domain和Avamar到底有什么不同呢?

Avamar是全球第一的源端重复数据删除技术,Data Domain是全球第一的目标端重复数据删除技术。Data Domain和Avamar到底有什么不同呢?先来看看什么是重复数据。

什么是重复数据?

重复数据有两种理解方式:一种从文件角度看,两个文件一模一样,比如我们通过邮件发送文件,我们这有一份,别人也有一份;另一种以数据块角度看,文件或数据库,切成小的数据块,数据块是几KB。切的数据块不是定长的,它会智能的分析数据,然后做变长的切块,同一个文件切出的数据块可能是4K、8K、 10K,根据算法做除重运算。

重复数据删除技术分类

1) 以除重操作发生的位置来划分:

1. 在数据源端(基于主机)备份,备份之前就做除重了,然后再备份,比如Avamar。

2. 在备份端来做除重,在线处理(Inline或联机处理),Data Domain就是这一技术的代表,这一方式中,数据在读进来之后,在存到磁盘之前就已经进行了重复数据删除,也就是一边备份,一边除重。In-line的优势是节省了磁盘空间,同时重复数据删除一步到位,特别简单,但缺点是对CPU的损耗非常大,会占用大量CPU资源,导致性能下降。

最终用户应该先弄清楚,自己的重复数据在哪里发生的最多,再决定是不是在那个位置来进行重复数据删除。假如是在一个企业内部,发件人给所有员工发了一封带附件的邮件,这些数据都是存储在主机上,这种情况下可以采用基于主机的重复数据删除。

2) 以重复数据删除所采用的技术来划分:

1. 文件级别的除重:删除重复的文件,一般采用hash或逐个字节比较的方法;比如EMC Celerra 的除重技术。

2. 固定块除重:先把文件进行固定大小的切块,然后对每一个块进行除重,因此对CPU的要求非常高。

3. 变大小块除重:和固定块除重类似,只是切块方式更灵活。DD和Avamar都使用了这个技术。

4. 数据压缩:一般认为压缩和除重是两个不同的概念,其实压缩就是个变大小的位级别的除重。EMC Celerra 如果你使用了除重技术则默认打开这个功能,当然你也可以不使用压缩技术。

[责任编辑:王振]
昆腾公司已经算是存储行业的“老手”了,在磁带市场一直保持着优势。随着存储技术的发展,昆腾又适时做出调整,开展磁盘方面的业务。
官方微信
weixin
精彩专题更多
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
12月15日,中国闪存联盟成立,同时IBM Flash System卓越中心正式启动
DOIT、DOSTOR、易会移动客户端播报中国存储峰会盛况。
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.