专家博客:较为常见的数据块误区(下)
Bill 发表于:11年04月07日 00:25 [编译] 存储在线
本文作者Howard Marks是Networks Are Our Lives公司的首席科学家。这家公司总部位于新泽西州霍博肯,从事顾问工作。1987年以来,他一直专注于系统的分析和写作。
DOSTOR存储在线4月7日国际报道:如果你的存储系统使用4KB Chunk,比如NetApp的WAFL(任意位置写入布局文件系统),那么每个8KB的SQL Server页面更新将会导致系统存储两个chunk。如果你的系统使用16MB的chunk,比如一些系统做的那样,一个8KB的数据库更新将占用16MB的快照空间,消耗16MB字节的广域网带宽来进行远程复制,并在迁移到0层存储的时候占用16MB的昂贵的闪存记忆体。
由于市场上的存储系统在chunk大小上差别很大,有的只有4KB,有的甚至达到1GB,因此,你快照空间或闪存空间需求可能差异很大。当你听到"只有块改变"这样的语句的时候,一定要问清楚这些块的实际大小是多少。
上面所说的有可能还不足以动摇你原来的想法,我们下面将讨论那些有可能会产生比原来预计还要多的磁盘更新的应用程序。当你在保存微软Word或PowerPoint或Photoshop或Final Cut的文件的时候,程序都会在对话中产生一个临时文件来保存你的编辑。当你进行最终保存操作的时候,程序会删除原来的文件,并将临时文件重命名为原来文件的名字。因此,如果你编辑的是一个500MB的视频文件,你的磁盘系统会看到500MB的修改块,这样你将会使用更多的快照空间和远程复制带宽。重复数据删除可以帮助解决这个问题,尤其是在这个重复数据删除引擎内容感知到可以识别这是同一文件的新版本的情况下。
简而言之,无论何时你听到"只有块发生改变"这样的话语的时候,你一定要问清楚发言人所说的块的大小是多少。粒度性很重要。