问:除了源端和目标端重复数据删除技术,还有post-process和inline重复数据删除以及固定块长度和可变块长度重复数据删除技术。这些不同方法的优缺点是什么?
答:每种方法都有其自身的优缺点。与inline重复数据删除相比,Post-process重复数据删除需要有一个更大的后端存储池,但是它有重复数据删除固定工作负载,而没有其它负载。另外,Post-process重复数据删除还能让你快速恢复最近的备份,这个进程通常能将恢复率降低到备份速率的80%。
在块长度中也存在类似的权衡:使用可变块长度的重复数据删除技术的算法速度较慢,而且会产生很多元数据,但是比计算不太密集的固定块长度的算法能够实现更好的压缩率。
有一种鲜为人知的块散列类型叫做sliding-window,也称picking up steam。它可以很智能地把数据散列成不同块大小,这取决于应用程序的类型,比其它类型的散列算法更能容忍插入、改变元数据。