NAS存储NETGEAR ReadyDATA 516评测
任新勃 发表于:13年08月30日 17:00 [综述] 存储在线
ReadyDATA 516使用的是ZFS文件系统。作为目前最顶尖的文件系统之一,基于ZFS的ReadyDATA 516提供众多数据安全特性。传统文件系统(如ext3/4)就近覆盖数据,这意味着如果系统断电(例如,在分配数据块到将其链接到目录中的时间段内断电),则会使文件系统处于不一致状态。以前,此问题是通过使用fsck命令解决的。此命令负责检查并验证文件系统状态,并尝试在操作过程中修复任何不一致性。但fsck命令并不保证能够解决所有可能的问题。后来,文件系统引入了日志记录的概念(ext3相比ext2的好处)。在单独的日中记录操作,在系统发生崩溃时,可以安全地重放该日志。由于数据需要写入两次,因此该过程会引入不必要的开销,而且通常会导致一组新问题,例如在无法正确地重放日志时。对于事务性文件系统,数据是使用写复制语义管理的。数据永远不会被覆盖,并且任何操作序列会全部被提交或全部被忽略。因此,文件系统绝对不会因意外断电或系统崩溃而被损坏。尽管最近写入的数据片段可能丢失,但是文件系统本身将始终是一致的。此外,只有在写入同步数据(使用O_DSYNC标志写入)后才返回,因此同步数据决不会丢失.
校验与自我修复数据
根据CERN进行的为期5周的实验,每1TB的数据,平均发现3个损坏的文件。随着容量的增大和操作时间的增长,此情况将会更糟。而此情况对于SATA硬盘来说,发生的概率是非常高的。文件损坏是什么概念?对于JPEG图片来说,也许就是一张图片里面有一个黑点,这影响不大,但是如果是你的ERP数据,你的网上订单数据,那么,损坏几个文件造成的交易损失将会是惨重的。对于RDD516来说,它支持校验和和自我修复数据,具体的做法是:当你写入一个文件的时候,将会写入许多数据块,每一个数据块除了自身的数据之外,还会有其子数据块的校验值,这样就保证了两点,第一是子数据块的数据肯定是正确的,第二点是子数据块的地址是正确的。
那如果这时候某个数据块坏了怎么办?这就是RDD516的自我数据修复功能,只要你做了有冗余的RAID级别,那么RDD516将会自动从冗余的副本里面找到正确的数据。
高效率特性:重复数据删除, 数据压缩, 无限制快照
也许,RDD516在该级别产品里面,最独一无二的,就是其支持无限制快照,重复数据删除和数据压缩功能。重复数据删除,一般都是大型存储设备独有的功能,比如EMC, NetAPP等公司的产品。并且一般需要支付license才能使用。在面向中小企业的产品里面,支持重复数据删除功能的产品,RDD516还是我们见到的第一个。重复数据删除的作用,就是不会在存储里面保存两份同样的数据。典型的使用场景是,你运行每周定期备份,而备份的文件又绝大多数没有改变,这样子可以节省极大的空间。RDD516的重复数据删除是基于块级别的inline做法。也就是说,重删的计算是在数据到达存储的时候进行的,当RDD516发现一个冗余数据块的时候,它将只会创建一个指针并且指向已有的数据块。
那么重删在什么地方能够应用得到:
虚拟化应用:多个虚拟机安装同个版本的操作系统(比如Windows Server 2008 R2),而这个系统共享相同的kernel,库文件,系统文件,系统应用,通过使用重删,这些文件将只会保留一份,当然,多个虚拟机系统是可以同时访问这些文件的。
文件服务器:这取决于具体你的用户存放的是什么文件。对于企业用户来说,更多的是存放协同分工合作的文档,有很大的可能这些文件是同个文件的不同版本,这样子也会节省很大的空间。
邮件服务器: 和文件服务器类似,对于邮件服务器来说,在企业环境下,经常会有同事抄送其工作成果给同个组员,领导等,这样子一份文件会保存少则几份,多则几十几百份。使用重删可以急剧减少空间占用。备份到硬盘(B2D):多人备份数据到硬盘,这也有很大的可能性会有相同数据的不同副本:应用,系统文件,文档,图片等等。
Web 2.0 和社交网站: 对于社交网络来说,人们关注相同的热点,当几万人转发相同的主题,共享相同的热点的时候,这时候又有大量冗余数据产生,此时重删又能发挥作用。
如果说重复数据删除是基于块级别的,那么数据压缩就是基于比特(bit)级别的。相比较重复数据删除,我们对压缩应该是更为熟悉的。比如咱们常用的Windows平台上的WinRAR就是这样的压缩软件。从实际测试效果来说,压缩的节省空间大小,跟重删其实是差不多的。并且其具备一个优点,就是对资源的占用相对来说是较小的。
RDD516支持无限制快照,这个功能对于我们来说,简单点说就是可以找回过去任意时间点的数据,比如你在工作日的每天都执行了一个快照,你这一周都在修修补补一个设计图,等到周五的时候,你突然觉得似乎周一的那个版本更好些,你还能找回来吗?通过访问周一执行的快照,你就可以找回这份文档了。
桌面上的数据中心
虚拟化应用的数据仓库
ReadyDATA 516支持iSCSI和NFS来作为VMware的数据仓库。并且已经经过了VMware ESXi,微软Hyper-V和Citrix XenServer的认证。RDD516有两个特性非常适合运用于虚拟化环境:Thin Provisioning和虚拟网络配置。比如你要配置4个VM,每个VM的虚拟硬盘要配置为2TB,对于不支持Thin Provisioning的设备来说,只能一开始就分配8TB的总空间给VM,然后NAS功能就只能使用余下的空间。如果支持Thin Provisioning,容量将会按照实际使用来分配,也就是,你装完VM的系统之后,写1M数据才会实际分配1M数据。这样的好处是,按需分配,NAS功能可以充分利用剩余的空间,也可以延迟硬盘采购,按需购买。RDD516支持虚拟网络配置,可以在1个网卡上面虚拟出多个虚拟网卡,而VMware等虚拟机也支持虚拟网卡,如果一个VM配置一个虚拟网卡,以不同网段来直连到RDD516,安全性将会更佳。
备份到硬盘,并利用基于云的连续数据保护实现容灾
中小企业用户常见的存储需求是将用户的数据备份到存储上面,比如每个人的工作目录,邮件等等。使用的工具可以是Windows自带的备份软件,也可以是专业的备份软件,比如来自Acronis, Quest, StorageCraft, Symantec, VEEAM的备份软件。而RDD516兼容主流的备份软件,可以作为这些软件的备份目标的。但是,这只是第一步,RDD516内置一个基于云来进行管理的连续数据保护功能。你可以将已经备份的文件,再通过云备份到远程站点。远程站点可以是另外一台RDD516,也可以是NETGEAR的RD5200.
同样的,对于虚拟化环境来说,存放在RDD516上面的VM,可以通过ReadyDATA Replicate将数据备份到另外一个站点来实现容灾:
想象这么一个场景,一家设计公司,20-50个雇员,使用虚拟化搭建内部的服务:一个WEB服务器来展示公司的设计作品,一个Exchange服务器来担任邮件服务器和通讯录,一个即时通讯平台,还需要共享数据的文件服务器。每个虚拟机,都将数据存放在ReadyDATA 516上面,利用ReadyDATA 516的重删来节省空间,使用基于云的备份来实现容灾和连续数据保护。对于设计师来说,更偏向于使用Mac OS X系统,而其他人可能习惯于Windows系统,没问题,ReadyDATA 516支持SMB,AFP,NFS,无论是什么平台,都可以在RDD516上面访问相同的数据。
结语
我们没有在存储行业中看到同时满足以下要求类似的产品:配置简单,支持众多企业级特性(重删,自动精简配置,无限制快照,压缩),支持云备份,面向中小企业的价位。EMC, NetAPP, HP, Dell有支持重复数据删除, Thin Provisioning等功能的产品,但是他们一般都是一个大的机架式产品,动辄几百个硬盘的配置不是中小企业用户所能负担的,而且这些功能一般都是要另外购买许可证的。
ReadyDATA 516基于Solaris系统,而Solaris是运行ZFS文件系统的原生平台,也是最佳的平台。相比较将ZFS fork到Linux的做法,直接使用Solaris系统将能保证最佳性能和最高的稳定性。也因其高级数据特性,我们认为对于中小企业用户来说,ReadyDATA 516是一款非常特别的产品,应该能胜任你的需要。
最后,ReadyDATA516的配置界面非常友好,基本上几十分钟以内就能实现初始的部署和配置。