今天我们继续讨论RAID 5,谈到RAID 5,重建时间要受4个因素影响。
第一个因素是阵列中硬盘的数量,硬盘越多,重建时间越长。其次,涉及到RAID条带化时,大小不是问题,条带越大,I/O越快,相应地,重建速度也越快。第三个因素是硬盘本身容量的大小,硬盘容量越大,重建过程越长。最后的问题是,在重建过程中,用户I/O是否继续,如果继续,重建过程会更慢,如果取消,所有系统资源全部投入到重建过程,重建时间会大大缩短。
除了这个四个因素外,许多系统也允许在I/O和重建操作之间实现负载均衡,但使用这个功能永远也不会达到用户预期的性能水平。
所有情况下,硬盘容量的大小和重建期间系统仍然保持运行是两个最大的障碍。
同时要注意,RAID 5第二块硬盘坏掉的话,数据会完全丢失,因此在重建过程中,要先发制人,预防数据丢失,但重建如何影响IT和业务运营?答案可能会让你大吃一惊。
假设有一个由4块9GB大小的硬盘组成的RAID 5阵列,系统不能脱机,因此在重建时仍然有源源不断的I/O请求,重建的速度大约25MB/s,以这个速度重建,每分钟可以重建1.5GB,一个36GB 的阵列大约需要24分钟,不包括任何安装,寻找备用硬盘等所花的时间。
几年前,9GB大小的硬盘还算高级产品,而现在的硬盘容量已经开始按TB计算了。我们以4块500GB的硬盘组成RAID 5进行重建,总容量达到2TB,重建时间最后花了22个小时多一点。
我做硬盘业务的朋友告诉我,明年你讲看到TB级硬盘遍天下,届时进行系统重建可能会出现两种情景。
情景1:重建期间让系统脱机,在此期间数据不可用。
情景2:将需要使用的数据复制到其它阵列,但这需要你有一个可复制的卷(或最近执行过备份,并且可以快速恢复),并且需要有一个额外的本地阵列可以使用,大多数时候,这两者都不具备。
计算奇偶校验的开销永远不会消失,随着大容量硬盘的出现,可能需要为大型阵列寻找另一种合适的RAID级别,最好是可以避免奇偶校验计算的,RAID 10(结合了RAID 1和RAID 0)可能是最佳候选方案,甚至可以使用更便宜的SATA硬盘,好消息是,商业决定是以科技为本的。
新的更大的硬盘正改变着竞争环境,将来有一天如果你为阵列选择硬盘类型和容量大小时,我想你会做出明智的决策。如果你是一个管理员,试图重建一个非常大的RAID 5阵列,你也一定会选择非业务时段执行,或脱机执行。
原文出处:http://www.networkworld.com/newsletters/stor/2006/0731stor2.html
原文名:Larger disks poised to change the RAID playing field
作者:Mike Karp