由于我之前关于FAS3200系列的文章引起了强烈反响,Tech OnTap再次邀请我来谈谈FAS6200系列的设计,对此我感到非常荣幸。
尽管早期的FAS6000系列在当时已是巨大的飞跃,但自其面市以来,随着内核数量的增加以及内存大小超过四倍的增长,需要考虑的许多方面已发生了变化。NetApp用户自然希望获得更多一流的性能,同时我们在此期间为Data ONTAP增加了新功能(例如重复数据删除和压缩),二者都对存储系统资源提出了新的需求。这无异于雪上加霜。
我们推出FAS6200系列的目标是创建一个平台,在平台上提供大量资源来实现一流的性能并执行重要系统任务,此外还为广泛的工作负载(从归档到IOPS密集型数据库负载在内的一切事务)提供支持,而且是同时支持这些工作负载。这好比同时生产一辆玛莎拉蒂豪华跑车和一辆皮卡,但结果令我们兴奋不已。
图 1) FAS6200 系列。
如果您还不熟悉FAS6200系列(以及相应的V6200开放式存储控制器型号,该型号支持您管理EMC、IBM、Hewlett-Packard、Hitachi Data Systems以及其他主要存储供应商提供的磁盘阵列)的常规功能,可阅读由Chris Lueth和 Mukesh Nigam最近合着的一篇文章,其中详尽地介绍了该产品系列的各个细节。本文旨在“揭开面纱”,重点关注一些特定主题:
-处理器/内存复合体的设计
-I/O 子系统增强功能
-某些新增的弹性功能
处理器/内存复合体
内存/处理器复合体是实现Data ONTAP所有高级功能的动力之源。我们研究了市场上现有的种类繁多的处理器,最终选择了Intel出品的4核Nehalem和6核Westmere处理器。我们发现借助这些处理器可以使内存带宽增至我们早期平台的三倍左右,并使单个控制器上的内核数从8个增加到12个(对于FAS6280),这让我们十分振奋。我们能够在Westmere处理器发布不久便交付配备Westmere处理器的系统,这是NetApp的产品发布与Intel产品发布配合最为成功的一次。
除了处理能力和内存带宽方面的全面改进外,我们还使平台的内存容量增至原来的三倍,让FAS6280每个控制器的内存达到96 GB之多。这为我们提供了足够的空间来更轻松地实现一流的性能和全新的功能,包括现在大多数新系统中都提供的NetApp闪存。
闪存可将实现特定性能级别所需的磁盘轴数减少多达75%,还可大大降低读取操作的延迟。但是,每TB闪存需要占用4 GB的系统内存来存放页表。因此,您会发现在大型系统中添加若干TB闪存后,内存占用量会大幅增加。(它还会用尽扩展槽,我将在下一节中介绍这一问题。)
为完善新系统,我们对Data ONTAP用来记录写入请求的非易失性RAM(NVRAM)进行了全新的设计。NVRAM 8设计实现了1 GB/s 的持续写入性能。考虑到NVRAM以较小的网络大小的数据块处理数据,因此要达到上述性能级别,NVRAM必须每秒进行1百万次传输。每次传输必须以微秒为单位设定,这不仅要求具有快速的硬件,还需要极为高效的中断例程才能顺利实现。
使I/O加速
NetApp存储系统每个核心进行I/O操作的次数比标准服务器多出10到20倍。大型存储安装要求一个NetApp存储系统即提供最高相当于256个核心的应用处理能力。这意味着大量的I/O。
在我们开始与Intel讨论Nehalem和Westmere处理器时,用于实现这些技术要求的标准 Intel 参考设计仅支持单个I/O芯片(IOH)。NetApp希望获得尽可能高的I/O 处理能力,因此与 Intel 接洽以期获得对两个IOH芯片的支持,使I/O处理能力加倍。我们与Intel合作实现了这一目的,并且证实新的设计能很好地按预期工作。
两个IOH芯片可提供72个第二代PCIe通道,而标准服务器设计通常只能提供20到30个通道。不仅如此,我们还使用交换机使通道数进一步激增:在FAS6280中建立152个PCIe通道的I/O连接,内部总带宽超过72 GB/s。
利用我们的新型机箱设计,您可以为一个控制器模块搭配4个PCIe插槽,此外还可选择增加带有另外8个PCIe插槽的I/O扩展模块(IOXM)。这样,一个控制器即可配备12个插槽,或者对于典型的HA对来说,可配备24个插槽。相比之下,FAS6080 仅提供3个PCIx插槽和5个PCIe插槽。除I/O扩展插槽外,FAS6200系列还提供许多板载 8Gb FC、10GbE 和 6Gb SAS 端口。(参见表 1。)如果您不需要额外的扩展插槽,还可以选择一种非常紧凑的配置,在6U的机架空间内即可容纳两个控制器(一个 HA 对)。
表 1) 三个新的FAS6200系列型号与FAS6080(之前的高端系统)的比较。
*实际内存分配取决于 Data ONTAP 版本。
**需要 Data ONTAP 8.0 及更高版本。容量是表中所示 Data ONTAP 7.x.x 值的一半。
正如我之前所述,额外插槽可用于闪存。此外,随着存储行业中正进行从 FC 向 SAS 磁盘的过渡,我们知道,需要通过提供板载 SAS 和 FC 端口,并确保存储系统在需要之时可同时支持大量的这两类端口,来帮助促进这一过渡过程。
板载端口和额外扩展插槽还可确保FAS6200系列完全能够支持在集群模式(C 模式)下运行的Data ONTAP 8 。您将能够支持大量的10GbE端口,使网络连接不会成为C模式配置的瓶颈。
更高水平的弹性
对于FAS6200,我们还希望在可靠性、可用性、可服务性和可管理性(RASM)功能方面更上一层楼。首先,我们添加了一项新功能来创建持续写入日志。电池后备NVRAM能够连续运行大约72小时。借助新的持续写入日志功能,如果遭遇停机故障,NVRAM内容将存入闪存,从而无限期保护写入日志。在下次启动时,只需重新运行生成的NVLOG即可使系统恢复到一致状态。
我们还向FAS6200系列中添加了新的服务处理器,其功能远远超过以前型号中使用的远程LAN模块(RLM)。服务处理器非常稳定,即使存储系统的其余部分均已关闭仍可运行。该处理器可提供RLM的所有功能,例如远程重启、出现系统故障时自动通报以及随时可供访问来排除故障。除RLM的功能之外,服务处理器还添加了一些新功能,包括:
-FRU报告和跟踪
-高级电流/电压和温度传感器报告
-监控和设置LED状态
-强制内核转储(替代控制器上的NMI按钮)
从工程角度来讲,FAS6200最令我兴奋不已的弹性功能是能够深入处理器读取其内部状态,即便处理器未在运行也能读取。内核转储和内部处理器状态相结合,可以提供详细的可靠数据,用以确切了解出现问题时发生的情况,以便加以更正。与以前功能的运作方式一样,我们会逐渐将该功能推向中低端应用范围。
结论
可能我的看法有些片面,但我认为FAS6200系列是NetApp产品发展过程中的一个新里程碑。该平台的性能比FAS6000高出 3.6倍之多。此外,该平台还大大增加了内存大小和I/O带宽,具有更高的扩展能力,支持在执行重要系统任务(例如数据保护、重复数据删除和压缩)的同时实现一流性能,所有这一切均不会影响与其余NetApp产品系列的兼容性。我们增加了新功能来进一步提高硬件可靠性,只要您准备好进行过渡,该平台将来完全可以支持在集群模式下运行的Data ONTAP 8。