数据存储产业服务平台

浅谈RAID内存的经验总结以及小技术

本人很喜欢RAID内存,在工作中也很喜欢总结关于RAID内存的经验教训,下面就这个问题来详细说说吧。在HP的热插拔技术中还应用到两个小技术,它们就是回写(Scrubbing)技术和热插拔容量(Hot-Plug Capabilities)技术。

回写技术

HP热插拔RAID内存提供了一个回写硬件方式,它可以确认ECC或RAID检查出来的软错误。HP技术尝试定位于在读内存时检查出来所有软错误,方法是把改正后的正确的数据写回内存中去。但此方法不适用于硬错误。

回写技术可以阻止软错误的累积,避免发生更严重的错误。它降低了ECC的工作量,提高了系统的性能。一些传统的系统采用的是软件回写,HP热插拔RAID内存使用硬件完成这个工作。

HP热插拔RAID内存会对错误生成错误日志,错误极限由软件设定。当记录的错误值达到错误极限的时候,软件会自动做出反应。例如,当超过错误极限的时候故障灯会自动亮,这就是由软件控制的。

热插拔容量(Hot-Plug Capabilities)技术

HP热插拔RAID内存还允许用户在不关闭服务器电源的情况下在线更换、在线扩展及在线升级DIMM,这就是HP的热插拔容量技术。

在线更换是指在系统运行的情况下更换出现故障的DIMM。HP热插拔RAID内存不需要操作系统的支持,服务器在购买的时候就具有支持在线更换的能力。在线扩展指用户在空的插槽上插入DIMM以扩展系统容量。在线升级是指用户用容量更大的DIMM替代旧的较小容量的DIMM。在线扩展和在线升级都可以使用户获得更大的系统内存容量。在线扩展和在线升级要求操作系统的支持,系统要认出新增的内存。

当在线内存操作完成后,如果工作在热插拔RAID内存模式下,那么系统会自动在所有的内存盒中重新放置数据(rebuild)。虽然这样做会暂时降低内存的工作性能(重新放置4 GB的数据花费的时间少于30s),但是只需要花费很少的钱就可以提高容错能力,并可避免系统检修期间带来的经济损失。

综上所述,在HP的以上3种新的AMP高级内存保护技术中,在线备份内存适合于那些不想仅因为内存错误就停机检修设备的用户,他们希望利用固定的设备检修时间更换出现故障的内存模块。热插拔镜像内存能够为此类用户提供更高的容错能力,而且用户也无须等到固定的设备检修时间才更换出现故障的内存,因为热插拔镜像内存可以让用户在不关机的情况下对内存进行在线替换。对于那些需要大容量内存支持且长时间不间断运行的应用程序而言,HP热插拔RAID内存的可靠性最高。它可以保证内存子系统运行正常,即使是在有一个内存设备完全出现故障的情况下也是如此,它支持工业标准DIMM的在线替换、在线扩展和在线升级。

未经允许不得转载:存储在线-存储专业媒体 » 浅谈RAID内存的经验总结以及小技术