VMware View存储最佳实践(3):技术选择
比特网 发表于:12年04月28日 11:00 [转载] 比特网
单实例
共享存储数据的单实例(即重复数据消除)的概念非常简单 :系统在共享存储设备上搜索重复数据,并通过匹配相同的数据来减少所需的实际物理磁盘空间量。重复数据消除是数据库领域的一个概念,管理员为此术 语赋予的含义是在合并数据库中搜索重复记录。在共享存储中,重复数据消除是用来查找并删除重复数据对象(文件、块或数据块)的算法。存储系统中的原始指针会被修改,以便系统仍可以查找该对象,但磁盘上的物理位置会与其他指针共享。如果写入数据对象,则写入会进入新的物理位置,并且不再共享指针。
重复数据消除的方法各种各样,而且有关重复数据消除可为一线存储带来哪些好处的可用信息也可能是误导性的。
不管是哪种方法,重复数据消除都基于两个元素 :哈希值和索引。
哈希值
哈希值是提供给每个对象的唯一数字指纹。哈希值通过一个公式产生,在该公式中,同一个哈希值不可能使用两次。但有一点需要注意,那就是两个对象可以具有相同的哈希值。某些线内系统仅使用基础哈希值,这种方法可能会导致数据损坏。缺乏对重复哈希值的辅助检查的任何系统都可能给您的 VMware View 部署带来 风险。
索引
索引使用哈希目录或查询表。 存储子系统使用哈希目录确定重复记录,即使在它们当前未执行磁盘读取和写入操作时也是如此。此方法使索引可以独立工作,而不管本机磁盘的使用情况。
存储子系统使用查询表将哈希目录扩展到不支持多个数据块引用的文件系统。查询表可以在系统 I/O 和本机文 件系统之间使用。不过此方法的劣势是,查询表可能会导致失败。