存储虚拟化在主机和物理存储之间创造一个抽象层,当SAN实施时,它为所有的块级存储提供一个单点管理。简单来说,多个异构网络存储设备构成一个虚拟存储池,在主机上表现为使用一套虚拟存储卷。
在短短的几年内,存储虚拟化,也称作虚拟块,已经在大企业中证明了它的价值,从昂贵的解决方案转化成可以负担得起的商品,相关文章见《利用对称式虚拟存储提高存储效率》。作为一种标准特征,特别是在最保守的中端磁盘阵列中,存储虚拟化为中小型企业的存储管理带来了新的发展。同时,来自顶级供应商的专属解决方案采用的集中数据管理给大企业带来了最大的投资回报率。
存储虚拟化在主机和物理存储之间创造一个抽象层,当SAN实施时,它为所有的块级存储提供一个单点管理。简单来说,多个异构网络存储设备构成一个虚拟存储池,在主机上表现为使用一套虚拟存储卷。
此外,除了从不同阵列的物理磁盘创建存储池外,存储虚拟化还提供了非常广泛的服务,以统一的方式交付。这些扩展从基本的卷管理开始扩展,包括LUN mapping,串联、数量分组和条带化,自动精简配置,自动卷扩展,和自动数据迁移,到数据保护和灾难恢复功能,包括快照和镜像。总之,虚拟化解决方案可以作为执行管理存储集中控制点,可以达到更高的SLA.
也许块级虚拟化最重要的服务是非中断数据迁移。对于大企业,移动数据是生活中的常事,由于旧设备的不再使用和新设备的联机,存储虚拟化可以在不中断的情况下,把块级数据从一个设备转移到另一个设备上。存储管理员可以自行进行日常维护,或者在不干预应用和用户的情况下替换年老的阵列。
四种SAN虚拟架构
SAN的虚拟架构中,有四种提供存储虚拟化服务的方法:带内应用,带外应用,混合方法即分离虚拟架构法,以及基于控制器的虚拟化。所有的存储虚拟化都必须具有三种基本的元素:维持一个虚拟磁盘和物理存储,以及其他配置元数据映射;用于配置改变和存储管理任务的执行命令;在主机和存储之间传输数据。在他们处理这三种单独的路径时,这四种架构是不同的——元数据,控制器,数据路径——在I/O架构中。差异主要来源于性能和可扩展性。
带内设备内的元数据,控制器和数据路径信息所有的都在一个单独的设备中。换言之,元数据管理和控制功能共享数据路径。这就表明繁忙的SAN存在一个瓶颈,因为所有的主机要求必须通过一个单控制点实现。带内设备厂商加入了先进的集群和缓存功能,解决了这一问题,其产品存在潜在的可伸缩性。如 DataCore的 SANsymphony,飞康的IPStor和IBM SAN卷控制器。
带外应用把元数据管理和控制应用拉出数据路径,把他们卸载到一个独立的计算引擎上。这时必须在每个主机上安装软件代理。代理的任务是从数据流采集元数据和控制请求,然后把他们转发给带外应用用于进程,把主机解放出来,使其专注于数据传输。带外应用的唯一一个供应商是LSI Logic,它的StorageAge产品既能在带外也能用在分离路径上使用。
一个分离(split)路径系统利用智能交换机端口处理能力,卸载元数据以及从数据路径控制信息。和带外设备不同,它的路径是在主机分离,分离路径系统在智能设备中分离数据,控制路径。分离路径系统把元数据和控制信息传送到一个带外计算引擎,并将进程和传输数据路径信息传送给存储设备。 因此,分离路径系统消除了主机代理的需求。
通常情况下,分离路径虚拟化软件将在智能交换机或内置应用内应用。 分离路径虚拟控制器供应商主要有EMC公司(Invista),Incipient和LSI(StoreAge SVM)。
阵列控制器一直是最常见的虚拟化服务部署的位置。 然而,虚拟化控制器通常虚拟内部物理磁盘存储系统。这种情况正在改变。新的做法是,部署智能虚拟化设备可以使控制器上的内部和外部存储都实现虚拟化。像带内设备,该控制器处理所有三种途径:数据,控制和元数据。 这一新型基于控制器的虚拟化主要是日立的通用存储平台。
文件级虚拟化概述
和块级虚拟化简化了SAN管理一样,文件虚拟化消除了企业级NAS系统的复杂性和局限性。 我们都承认非结构化数据急剧增长,并且IT很难控制那些数据,文件虚拟化这时帮了一个大忙。
文件虚拟化使物理文件服务器的基本细节和NAS设备抽象化,并跨那些物理设备创建了一个统一命名空间。命名空间指的是目录和文件及其相应的数据结构。通常一个标准文件系统,如NTFS 文件系统,一个空间与一台计算机或文件系统相关联。通过把多文件系统和设备都统一到一个单独的命名空间下,文件虚拟化提供了一个单一的文件和目录,并为管理员提供了一个更易于管理数据的单控制点。
和存储虚拟化带来的好处一样,文件虚拟化也可以在无间断的情况下,把文件数据迁移到另一台。存储管理员可以在不影响用户和应用的前提下,进行NAS设备的日常维护以及旧设备的废弃。
当文件虚拟化和集群技术相结合时,它的可扩展性和性能都显着提高。一个NAS集群可以提供数量级吞吐量(Mbps)命令和IOPS.高性能计算(高性能计算)应用,如地震处理,视频渲染,科研仿真,很大程度上依赖于文件虚拟化技术为用户提供可扩展的数据访问。
三种架构方法,只有文件虚拟化还处于起步阶段。不同厂商的方法适用于不同的使用模式,没有放之四海而皆准的。一般来说,你会发现现在市场上三种不同的文件虚拟化方法:集成平台的命名空间,集群存储派生的命名空间和网络虚拟的命名空间。
集成平台的命名空间是主机文件系统的扩展。它们提供了一个特定的平台。这一类型的命名空间非常适合多站点协作,但他们往往缺乏文件控制,因此他们就限制在单一文件系统或操作系统内。 如博科StorageX,NFS v4和Microsoft分布式文件系统(DFS)。
集群存储系统结合集群和先进的文件系统技术,创建了一个可支持无限增多的NFS 和CIFS请求的模块化可扩展系统。 这些集群系统是一个统一的,跨所有集群因素共享的命名空间。集群存储系统非常适合高性能应用,把多文件服务器整合到一个单一的高可用性系统内。这些厂商主要包括Exanet,Isilon公司,NatApp公司(Data ONTAP GX),惠普(PolyServe)公司。
网络虚拟命名空间是由网络设备(通常称为网络文件管理器)创建的。网络文件管理器存在于客户端和NAS设备之间。 基本上充当路由器或交换机,这些设备在用户和存储之间展现一个虚拟的命名空间。 网络虚拟命名空间非常适合用于分层存储部署和其他的非中断数据迁移情况。
总结:文件和块存储虚拟化可能是现在减轻数据风暴最好的方法。 通过块虚拟化和文件存储环境,IT能够取得更大的经济管理以及对异构存储系统的集中执行和控制。 这些解决方案的道路是漫长和艰难的,但这些技术最终赶上了我们的需要。