近几年,非结构化数据正在以指数级的速度飞快增长,这种环境背后直接导致了文件存储需求的激增以及NAS市场的爆发性增长。根据一份来自 ESG(Enterprise Strategy Group)的统计报告,有五分之一的用户透露他们的NAS系统容量每年增长超过50%,而54%的用户说他们的NAS容量增长速度每年至少20%。大多数选择使用NAS的企业都拿它做存储而不是文件共享服务,因为NAS具有可靠性高,性能、扩展性好,易于存储管理等众多优点。于此同时,NAS还具有远程复制、快照、自动精简配置和高效率克隆等高级功能。NAS的应用形式也很灵活,既可以是网关装置放在块存储系统前端使用,又可以是一套独立且完整的存储系统。因此NAS在企业领域的应用十分广泛,从大型企业到微型企业,都可以看到它的身影。
NAS细分市场
低端的NAS产品一般主打家庭或个人用户市场。价格低于100美元,这样的产品通常可容纳2块或4块磁盘,支持RAID 0/1,主要的特点还包括:有一个千兆网络端口;可使用基于Web的管理界面创建用户并设置文件共享;支持基本的文件共享配额管理;提供备份功能等等。低端NAS是为那些非专业的个人用户、SOHO用户以及小型办公室应用准备的,只具有基本的性能且不能扩展。我们在市场上能看到的相关产品包括D-Link 的ShareCenter、EMC的Iomega StorCenter、Netgear的Stora以及Seagate的BlackArmor 系列等等。
比低端NAS高一档的产品我们叫做中低端NAS,通常在小型机构或企业中可以看见它们的身影。中低端NAS的容量从几个TB到100TB不等,除了使用SATA磁盘之外,有些系统还支持SAS磁盘。中低端NAS已经可以提供高端存储协议以及部分企业级产品具有的特性,比如可选择多种RAID级别,支持微软活动目录,支持快照、支持远程复制,并配备专用的备份接口。此类产品的体积适中,硬件配置主要包括多核CPU、充足的内存、可选SAS磁盘、并配备多个千兆以太网端口。价格通常低于2.5万美元,主要的目标市场是那些IT人力资源和预算都比较有限的小型办公室或大型企业的分支机构。可用性以及丰富的可选配置是这个级别产品的主要特点。各种以Microsoft Windows Storage Server为基础的NAS、Netgear的ReadyNAS、Nexsan的E5000系列以及Overland Storage公司的SnapServer系列是这一级别NAS系统的代表。而更高一级的厂商比如NetApp,也将其FAS2000系列瞄准了这一市场。
StorageIO Group的创始人兼高级分析师Greg Schulz总结了中低端NAS的特点,他说:“中低端NAS在价格、系统易用性以及功能方面较好的实现了平衡,普通用户既可以买得起,同时又可以拥有如AD集成、复制和快照等功能。”
接下来我们看看中小企业和企业级NAS市场。这一领域向来被EMC和NetApp两家公司控制,新进的竞争对手包括已经被HDS收购的BlueArc以及不断涌现的scale-out NAS厂商。高级分析师Greg Schulz说:“企业级的大项目一向只看NetApp或EMC,或者同时采用这两家的产品,其他的竞争者只是偶尔才有机会”。近期,EMC收购了 Isilon System公司,而NetApp也不甘落后的推出了支持scale-out扩展的Data Ontap 8系统,这些策略也能够帮助他们两家获得更大的市场份额。
高性能、高可用性、数百TB到PB级的海量存储、企业级的支持能力、以及不断丰富的高级功能是此级别NAS产品的典型特征。企业级系统一直在推动NAS技术的发展,不断的在扩展新的功能需求。比如,同时支持块协议和文件协议,能够水平扩展,而重复数据删除也从一个加分的功能变成了必备的功能。企业级NAS系统通常针对传统的企业应用进行优化,确切的说,在处理大量的小文件方面表现非常出色,而且应付Microsoft SharePoint,Exchange和 SQL Server等back-office应用程序时性能也很好。不过,如果涉及需要高带宽的应用,NAS系统通常不是用户的首选。
举例来说,某些特定的应用和行业(比如媒体/娱乐业和油气开发,其数据类型的特点是单个文件很大,相对于以大量小文件为主的应用)需要非常高的吞吐带宽和极强的可扩展能力。因此这些领域需要那些特殊的scale-out可横向扩展且高性能的NAS系统,比如EMC的 Isilon、HP的StorageWorks X9000网络存储系统、IBM的Scale Out Network Attached Storage (SONAS) 以及Panasas等产品。
NAS特性深度剖析
不管公司规模有多大,无论有多少文件存储需求,在使用NAS产品之前有一些属性和特性是我们必须考虑的,了解这些关键点,才能让我们做出正确的采购决策而不至于后悔。当我们评估一个NAS系统是否合适时,需要评估以下几个关键点:
●选择双控架构还是scale-out横向扩展架构
●存储效率如何
●是否支持统一存储
●是否支持虚拟化应用
双控架构 vs. scale-out横向扩展架构
完全冗余的双控制器架构NAS系统出现在上世纪90年代初期,目前占据了市场的主流。这种架构的产品通过增加磁盘数量可以实现纵向扩展。其上所有的 部件都紧密耦合在一起,并且共享一个公共的存储资源池。一旦达到性能的上限,用户只能另外增加一套NAS系统,这是唯一的性能扩展方式,而两套系统彼此之 间是独立的。因为可以扩展磁盘数量,所以在应对以小文件随机访问为主的负载模型时,它可以表现出很好的性能,而这种负载模型也是企业数据中心最常见的主流 应用类型。
与双控结构不同,scale-out横向扩展NAS则采用了松散耦合结构,由多个处理节点组成,至少两个节点起步。多个节点并行处理负载,并且可以 通过增加节点实现水平扩展。尽管各厂家产品的并行度存在差异,但总的来说,所有节点同时处理文件I/O是它们共同的特性。每当用户增加一个新节点,系统整 体性能也会相应地按比例增长。在大多数情况下,scale-out横向扩展NAS系统不需要进行成本高昂的叉车式升级(用新系统完全取代旧系统),相反, 我们只需要通过不断增加节点,即可以将已有NAS系统的规模扩展到数个PB。scale-out横向扩展NAS的优点是很吸引人的,比如同时提高I/O性 能和吞吐带宽、提高可扩展性、降低成本、管理简单(逻辑上只需要管理一个系统)而且可用性更高。“我们预计到2015年,将有80%的存储系统采用基于 scale-out的横向扩展设计,”ESG的高级分析师Terri McClure证实了scale-out架构具有广阔的前景。
目前,支持scale-out的部署方式正逐渐成为对企业级NAS系统的基本要求,而传统的纵向扩展系统将逐步退居SMB市场。但即便在中小企业领域,双控架构仍然受到scale-out架构的威胁,尤其是当NetApp推出支持scale-out的Data Ontap 8之后,这种情势更加明显。或许这是一个明显的信号,市场进入到一个拐点,NAS行业的领导厂商目前都在大力推广scale-out架构,比如Dell公司通过收购Exanet获得了相关技术,并且已经发布了两款基于Exanet的scale-out NAS网关产品(一个是NX3500,它是与PowerVault iSCSI磁盘阵列配套的NAS网关;另一个是FS7500,它是与EqualLogic系列磁盘阵列配套的NAS网关)。而EMC收购了Isilon,HP有StorageWorks X9000,IBM有SONAS,当然还有前面提到的NetApp。
存储效率问题
某些高级存储特性和功能可以帮助我们在有限的物理磁盘上储存更多的数据,这也是我们评价一款存储阵列产品高低的重点之处。存储效率高意味着用户只需 要准备比以往更少的磁盘,这样既能够显著的节省费用,同时也能比较容易的摊薄高昂的采购成本。换句话说,越贵的NAS在使用过程中的开销有可能越少,而价 格便宜的NAS由于不具备高效的存储特性,使用过程中的成本反而更高,而那些可以提高存储效率的功能就包括自动精简配置、高效快照、瘦克隆、重复数据删除 以及压缩等等。在不同的NAS产品中,这些功能特性有着不同的实现方法和效率表现。最主要的区别是它们处理数据的粒度不同,大多数NAS系统以卷为最小的 操作单位,但某些产品可以单独针对目录甚至是单个文件进行操作。EMC公司Isilon产品高级市场副总裁Sam Grocott 说:“EMC的Isilon可以在文件和目录级别实现快照、复制和配额设置”。
下面我们就介绍一些能帮助用户减少物理磁盘需求并提高存储效率的高级存储特性。
Thin provisioning自动精简配置。该功能可以让我们预分配超出实际可用物理容量的逻辑空间,从而达到提高存储利用率的效果。对于同时支持文件和块存 储协议的系统来说,这一点相当重要。通过自动精简配置技术创建的卷和NAS存储池与真实的物理空间并不需要一一对应,实际情况是物理存储空间被划分到一个 公用的存储资源池并以按需分配的原则来使用。在一个支持自动精简配置的系统中,物理存储资源是按需进行动态分配的。如果没有自动精简配置,那么用户在一开 始就必须准备好足够的物理存储空间以便分配给相应的卷和存储池。
Efficient snapshots(基于指针的)高效率快照。在NAS系统中,快照是非常重要的数据保护手段。快照能够按时间周期自动执行,用户也可以选择将快照复制到 其它NAS系统以实现容灾应用或用于其他(数据保护)目的。现今大多数NAS系统都带有快照功能,高效率快照只需要拷贝改变的数据,并且用指针将其与前面 的完整快照进行关联。高效率快照不仅可以节省宝贵的物理磁盘空间,而且完成它所需要的时间也很短,创建快照过程中对系统性能的影响也很小。
Thin clone 瘦克隆。有些NAS系统可以支持块存储协议并带有瘦克隆功能。瘦克隆在最初创建时甚至不需要预留存储空间。与高效率快照类似,瘦克隆卷通过指针与生产卷关 联。克隆卷上只需要保存改变的数据。第一个提出瘦克隆概念的产品是NetApp的FlexClone,现在支持瘦克隆功能的NAS厂商已经越来越多了。
重复数据删除和压缩。重复数据删除和压缩本来是备份/归档产品的标准应用,但现在的主存储产品也越来越多的开始集成此类功能。在NAS系统中用户可 以使用定期批量处理或者实时在线处理的方式来实现去重。尽管目前支持重复数据删除的NAS产品还很少。比较有代表性的产品是NetApp的 filer,filer可以针对每个卷启用重复数据删除功能,所处理的数据块大小为4KB,用户可以设置固定时间自动执行去重任务,但通常都会选择在系统 负载较轻时开始运行。另一个典型的带去重功能的产品是Oracle SUN ZFS Storage 7000系列,但与filer不同的是,ZFS Storage 7000可以在数据写入磁盘之后立即进行实时的在线去重处理。
自动存储分层。自动存储分层功能可以把活跃数据保留在高成本、高性能的存储介质上,并将非活跃数据转移到廉价的低速介质层,这种技术可以帮助用户有 效的控制昂贵的tier-1存储层的规模,且不会对性能产生太大的影响。我们评估任何一款NAS产品都要注意其存储分层方式应该是在不同的介质层(固态存 储介质层、高速SAS介质层、低速SAS介质层、大容量 SATA介质层)之间自动地以数据块或字节的粒度移动数据,而不是以卷为单位移动数据,而且颗粒度越小越好。有些系统,比如EMC的FAST(Fully Automated Storage Tiering)就是基于可定义的自动数据迁移策略。其它产品,像NetApp和Oracle(SUN ZFS Storage 7000系列)则倡导存储的智能化,它们强调自己的存储系统足够智能,可以自行调度数据到合适的层级,无需用户自定义策略。
统一存储
作为NAS领域的两只领头羊,EMC的VNX阵列家族和NetApp的全线产品都属于统一存储,即在一个单一的存储阵列中同时支持文件存储协议 (NFS 和CIFS)以及块存储协议(Fibre Channel和iSCSI)。在EMC和NetApp不遗余力的推动下,统一存储产品也日趋流行起来。这一类型的产品特别适合中小企业,因为只需一个独 立的存储系统就可以满足它们所有的存储需求:包括文件共享服务,为服务器虚拟化提供存储空间,以及支持诸如Microsoft SQL Server、SharePoint和数据库之类的企业应用。
“中小企业通常很喜欢这种万能的存储系统,非常便于管理,而且他们也买得起。”EMC VNX产品总监Drew Schlussel说到。
存储和虚拟化
随着服务器虚拟化应用的加速普及,是否支持与虚拟化软件集成的特性就成了评估存储系统重要的标准之一。这项功能会影响到虚拟化环境中磁盘卷分配的速度和效率。NetApp产品市场经理Jason Blosil说:“通过FlexClone技术,我们只需要轻点按键,就能够快速地克隆出VMware VMDK镜像。”
服务器虚拟化应用的存储部署并不复杂,可以在后端使用一套NAS设备存放虚拟机的映像文件。但是如果通过瘦克隆创建虚拟机,就可能有许多I/O请求 同时访问同一个物理数据块,那样很容易出现性能问题。因此,让NAS系统识别虚拟化引擎hypervisor的工作机制,避免重复响应虚拟服务器的I/O 请求是解决性能问题的关键,尤其是当虚拟机数量越来越多时更是如此。有些厂商利用固态存储和自动存储分层相结合的方案,通过策略或者依靠缓存让热点数据驻 留在最快的存储介质层上。
VMware提供了一组用来与存储系统集成的API叫做VAAI(vSphere API for Array Integration),通过VAAI,vSphere可以将一部分存储操作以及相关的管理功能交给底层的存储系统处理。但在vSphere 5之前,VAAI仅限于支持块存储设备。在最新的vSphere 5版本中,升级后的VAAI可以更好的支持NFS和NAS存储,实现诸如自动精简配置和快照等功能。VAAI通过将繁重的存储处理工作和管理任务从主机端 hypervisor卸载到存储系统,意在消除主机端存储应用的性能瓶颈。
用户还可以利用VMware vCenter和SCVMM(Microsoft System Center Virtual Machine)的hypervisor插件,直接在hypervisor的控制界面里执行存储管理操作并生成管理报表,这有助于IT专家和服务器管理员更好的管理他们的存储系统。
总结
因为NAS系统有许多技术优点和实用价值,因此无论是作为块设备前端的网关还是独立的存储系统,在当今的数据中心里NAS系统都是不可或缺的设备。 NAS仍然在不断发展,越来越丰富的功能特性,越来越多的scale-out产品,与块设备集成实现统一存储、与虚拟化以及云存储环境紧密集成,这一切都 预示着NAS在未来仍将是重要的存储系统,无论是何种应用,也不管是哪类数据,快速且扩展性出色的NAS系统都可以满足用户的需求。