Data Domain和Avamar到底有什么不同?
IT168 发表于:12年04月27日 10:18 [转载] IT168
Avamar是全球第一的源端重复数据删除技术,Data Domain是全球第一的目标端重复数据删除技术。Data Domain和Avamar到底有什么不同呢?先来看看什么是重复数据。
什么是重复数据?
重复数据有两种理解方式:一种从文件角度看,两个文件一模一样,比如我们通过邮件发送文件,我们这有一份,别人也有一份;另一种以数据块角度看,文件或数据库,切成小的数据块,数据块是几KB。切的数据块不是定长的,它会智能的分析数据,然后做变长的切块,同一个文件切出的数据块可能是4K、8K、 10K,根据算法做除重运算。
重复数据删除技术分类
1) 以除重操作发生的位置来划分:
1. 在数据源端(基于主机)备份,备份之前就做除重了,然后再备份,比如Avamar。
2. 在备份端来做除重,在线处理(Inline或联机处理),Data Domain就是这一技术的代表,这一方式中,数据在读进来之后,在存到磁盘之前就已经进行了重复数据删除,也就是一边备份,一边除重。In-line的优势是节省了磁盘空间,同时重复数据删除一步到位,特别简单,但缺点是对CPU的损耗非常大,会占用大量CPU资源,导致性能下降。
最终用户应该先弄清楚,自己的重复数据在哪里发生的最多,再决定是不是在那个位置来进行重复数据删除。假如是在一个企业内部,发件人给所有员工发了一封带附件的邮件,这些数据都是存储在主机上,这种情况下可以采用基于主机的重复数据删除。
2) 以重复数据删除所采用的技术来划分:
1. 文件级别的除重:删除重复的文件,一般采用hash或逐个字节比较的方法;比如EMC Celerra 的除重技术。
2. 固定块除重:先把文件进行固定大小的切块,然后对每一个块进行除重,因此对CPU的要求非常高。
3. 变大小块除重:和固定块除重类似,只是切块方式更灵活。DD和Avamar都使用了这个技术。
4. 数据压缩:一般认为压缩和除重是两个不同的概念,其实压缩就是个变大小的位级别的除重。EMC Celerra 如果你使用了除重技术则默认打开这个功能,当然你也可以不使用压缩技术。