文件资源的管理已经成为全球各种机构必须面对的迫切问题:虽然经过长期的探索,但是如何管理基于非结构化文件信息的飞速增长、以及由此带来的复杂性和成本的增加,依然是严重妨碍各种机构发展的关键因素之一。
2006年6月,Taneja集团对全球IT决策者进行了调查,62%的被访者表示,在他们数据中心中,文件管理是当前的首要问题或首要问题之一。在我们与最终用户进行日常讨论,请他们评价最新的文件管理解决方案时,也再次证实了上述结论。目前,文件管理的新技术主要包括:
- 广域文件服务(WAFS)
- WAN优化和应用加速
- 分布式和集群文件系统
- 网络文件管理(NFM)/文件虚拟化
- 文件/文档管理软件
- 文件分类软件
- 文件数据存放/移动控制
显然,三年前,上述各类技术甚至还不成熟。围绕文件管理和控制,究竟需要怎样的方案和创新?答案很简单,由于文件数据总是与关键业务过程相关,在过去的几年里文件数据已经相对地变得越来越重要。在过去的三年中,文件数据已经成为全球每一个公司沟通的命脉。从某种意义上来说,是我们共同经历了一个文件数据的时代,几乎所有的工作流程最后都将以某种方式通过文件基础设施进行传递,跨越越来越多的地域、商业伙伴和IT基础设施,并都存在实时性要求和访问权限要求。上述事实清楚地阐述了文件的急剧增长以及其带来的系统复杂性增加的问题,那么解决这些问题的供应商在哪里?其实,应对这些问题的创新技术的已经大面积应运而生。
IT 记忆的回顾
历史正在重演。就在十年前,随着开放式系统的出现,我们目睹了数据块级存储的变迁过程,历经了在多个核心业务系统之间利用和共享存储资源的发展过程。当时存储管理员们正为如何控制设备和成本的增加以及由此带来的复杂性问题而绞尽脑汁时,具有划时代突破性意义的存储区域网络(SAN)诞生了。
勿庸置疑,在二十世纪九十年代, 转换为SAN网络是用户和厂商一致寻求的部署和共享存储资源的通用体系结构。延伸“区域网络”框架所固有的共享资源的概念,为存储行业开启了更为广阔的视野。
通过类比,我们不难发现企业文件管理正处于极为相似的转变阶段。简而言之,一个全新的文件资源管理的时代已经来临,我们将再次借用和延伸“区域网络”的概念以确立基础设施另一层上的文件数据管理方案。我们需要构建文件区域网络,即FAN(File Area Network)。
FAN的诞生
FAN是一种用于整合企业现有的多种文件相关技术的系统化解决方案,旨在向企业客户提供一种有效地处理企业文件信息的可扩展的、灵活的智能平台。恰当结构的FAN将向企业提供前所未有的文件控制水平和经济效益。FAN包括以下一些功能:
- 管理与平台无关的、遍及全企业的文件信息和基于元数据及内容值的文件属性;
- 建立与物理设备的位置无关的、基于业务价值(例如部门、项目、地理区域)的用户文件可视性和访问权限;
- 实现跨越所有地理边界的、不间断的透明文件信息移动;
- 创建文件管理服务,这种文件管理服务将作为真实“服务”对整个基础设施进行部署,而不是仅仅部署在特定应用层;
- 整合冗余文件资源(例如,冗余文件的重复复制),为文件管理带来巨大投资回报(ROI)。
这些功能在其范围和作用上是否似曾相识?那是因为FAN之于传统文件管理,就如同SAN之于DAS,在功能、控制和ROI上都取得了巨大的进步。
与SAN的情况一样,目前在FAN的体系结构和部署方面,有着许多可用的技术和方案。在未来的几年中,许多厂商将参与到FAN生态环境中, FAN解决方案也将快速发展。所以,建立公认的FAN概念是非常重要的,这将有助于IT人士构建、部署、管理并增补文件基础设施,以及开发通用的解决方案和参考模型。如果缺少此类框架,将来企业不仅要面临管理失当文件数据的泛滥,而且由于缺少通用术语,也将不可避免厂商之间命名上的混淆。因此,我们必须准确了解什么是FAN:
FAN的组件
任何企业级FAN都是由下列六个核心组件构成的:
- 1.存储设备:部署FAN的最基本条件是存储的基础设施,可以是SAN或NAS环境。唯一的先决条件是:FAN必须利用联网的存储环境,才能实现数据和资源的共享。
- 2.文件服务设备/接口:可以是直接集成在存储基础设施上的一部分(如NAS),或作为网关的接口(如SAN),所有FAN的设备必须具有标准协议(如CIFS或NFS)进行文件级信息接口。
- 3.命名空间:所有FAN都建立在现有文件系统的基础上,为授权用户组织、展示和存储文件内容。这种功能被称为文件系统的“命名空间”,是整个FAN的核心概念,在FAN中可以存在多种命名空间。
- 4.文件管理和控制服务:软件智能是FAN体系结构的另一个核心概念。软件智能与命名空间进行互操作,为企业创造了的更多价值。从部署方面看,这些服务可以直接与文件系统集成,或集成在联网设备中,也可以是单独的服务。文件管理和控制服务包括文件虚拟化、分类、复制和广域文件服务。在本文中我们还将对这些功能进行更为详细的分析。
- 5.客户端:所有的FAN都具有可以访问由文件系统创建的命名空间的终端客户机。这些客户端可以位于任何平台或计算设备上。
- 6.连接性:FAN具有多种连接终端客户端和命名空间的方法,通常是通过标准LAN进行连接,但是也可以同时或交替地利用任何广域网上的技术。
命名空间: FAN的Fabric
Taneja集团2006年6月的研究报告表明,超过57%的IT用户已经部署或者正在部署先进的命名空间技术,以改善文件管理的效果。换言之,无论IT用户是否已经意识到,他们都正在组建其第一个FAN,而准确地了解命名空间技术是组建FAN的关键。事实上,我们可以认为命名空间对FAN的意义,就如同基于交换的Fabric对SAN的意义。然而,对于FAN而言,最重要的区别是:FAN是关于信息呈现的关系,而不是关于物理设备的关系。
对任何给定文件系统数据的呈现、访问和常规组织(即目录结构)都涉及到命名空间。对于任何FAN来说,在任何环境下,都只有三种可能的FAN命名空间。未来,大部分企业将采用这三种方式的组合,解决其所面临的各种问题。
1.非共享命名空间:这是企业建立基本的文件服务或传统的NAS时的默认设置。这是文件系统映像对应信息的用户级呈现,这种文件系统映像结合了给定物理机器的具体信息。换言之,不存在跨越多文件系统映像的信息共享。目前所部署的大多数文件系统采用的都是非共享命名空间。非共享命名空间在小型部署中占有主导地位。然而,随着非共享命名空间的大量部署,尤其超越其文件系统能力时,就引起了许多棘手的IT问题。
2.共享命名空间:已经联合了企业物理文件呈现环境的子集,从而能够在多个同构机器上共享信息。IT团队可以使用这些同构机器,将用户级信息呈现给指定的客户端。一般来说,共享命名空间是专用平台,而不是用于部署在企业的所有客户端上。由于紧密地连接多个文件系统,共享命名空间能够解决针对企业的一个目标子集的、重要文件的可视化、协作性和性能等问题。例如,共享命名空间可以部署在集群NAS环境和集群或分布式文件系统环境。
3.全域统一命名空间(GUN):Taneja集团表示,就FAN中的命名空间而言,GUN是法宝:所有文件级信息进行真正异构的、全企业范围内的管理和控制,并基于管理员定义的参数进行动态定制,能够最终实现企业所需要的管理、控制和应用。可以将软件智能应用于GUN,从而确保软件智能可用于整个企业(例如,访问控制、文件虚拟化、分离方案、复制等)。从体系结构方面看,可以按照多种方式建立GUN,包括基于分布式主机的软件或网络驻留方案。
FAN的控制与管理: 软件服务
FAN中所采用的另一主要定义是文件管理和控制服务组件。这些软件工具与命名空间、物理文件系统、存储和连接性相互作用, 极大地提升了FAN的价值。这些软件服务是FAN的中枢,其中包括一系列现有技术和新近进入市场的创新技术。
继续与SAN进行类比,可以发现,这些软件服务对于FAN的意义,就如同存储管理软件对SAN的意义。下面我们将对这些软件服务进行分门别类的介绍:
迁移服务:在共享命名空间或全域统一命名空间下不间断地移动文件,是FAN所带来的最有价值的对IT的贡献之一,也是FAN核心基石的一部分。用户可以在基于分布式主机的软件、基于网络、或基于设备的方案等多种层面上获得这种服务。
复制服务:在FAN中,必须能够在资源和地理位置之间不间断地复制所有文件。这种复制服务可以通过部署在基础设施的不同层(如主机、NAS设备或网络)上的多种技术来实现。支持不间断的文件级复制是FAN体系结构重要价值。
存放服务:根据文件的属性,将文件级数据存放在指定的物理设备上是FAN的重要组件。优化数据存放确保了支撑FAN的服务器和存储设备被维护在一个最佳性能和使用水平。实现这种存放服务的途径包括利用带内网络设备,如,网络文件管理(NFM)设备、一些信息分类和管理(ICM)技术等,或者采用分布式软件方案。
访问连续性服务:当采用FAN建立命名空间时,终端用户能够保持对所涉及的文件级信息的进行不中断访问是非常关键的指标。在站点故障或设备故障时,必须能够进行完全故障切换,以确保跨地域的数据总可以访问。这种访问连续性服务可以通过多种文件复制工具和广域工具来实现,如WAFS设备就可以实现故障切换和恢复。
信息分类服务:在过去的2年中,由于企业越来越需要确切的管理文件、信息分类和管理(ICM)取得了里程碑式的发展。此软件实现了信息的内容级索引,可以支持基于策略的控制、访问和保存。ICM是FAN的基础组件。
FAN扩展服务:大多数企业客户需要在地域上扩展FAN访问。因此,FAN必须能够在其命名空间中支持广域网连接性。这种扩展服务的终极目标却不仅仅是地域连接,而且使其连接具有接近LAN的访问速度和服务水平。包括WAN优化技术和WAFS在内的多种技术可以实现FAN的这种扩展服务。
业界领先的FAN供应商
我们已经给出了FAN的基本定义,下面我们转而介绍一下FAN技术的供应商。本文重点介绍的这些供应商均能为用户提供FAN的整体框架,有的是通过OEM,有的则是通过合作伙伴。这些供应商在组建FAN方面具有广阔的视野(所有供应商按字母顺序排列)。
博科:近年来,博科做出了公司在产品战略上的重要转移,将其产品从数据块级SAN Fabric光纤交换机,扩展到文件级管理解决方案。通过并购提供命名空间创建和文件服务解决方案的NuView软件公司,以及与Packeteer-Tacit达成合作伙伴关系,博科的业务由原来的核心SAN交换机领域扩展为SAN交换机和FAN解决方案两大业务领域并驾齐驱。在未来几年中,这种极具优势的产品战略转移将使博科在市场中变得更加强大。
EMC:EMC已经在FAN战略上投入了很大精力。通过并购Documentum和Rainfinity,EMC可以提供一系列管理软件服务、命名空间创建和管理能力。可以相信,随着EMC战略的逐渐明朗, EMC业务还将扩展到其他文件服务。
惠普:作为微软最大的OEM合作伙伴,近年来,惠普在NAS一直占有明显的市场优势。惠普已经开发了文件级ILM(分类、迁移、复制),这些功能均适合于支持FAN软件服务。同时惠普还与其他公司达成了OEM合作关系,如PolyServe (基于Linux和Windows的集群文件系统)和Riverbed(WAN优化)。纵观这些因素,我们有理由相信,惠普将在FAN的采用方面扮演重要的角色。
微软:作为最为广泛的服务器平台供应商,微软将会对FAN的增长起到重要作用,除如DFS等命名空间技术外,最新版Windows Server R2提供了全系列软件服务套件,这些软件能够显著提高基于微软系统FAN的管理质量。简单地讲,绝大部分FAN将建立在微软技术上,而微软也将成为FAN市场中的领导者。
网域(Network Appliance):作为NAS市场一贯的先行者,已经做好了迎接FAN时代的准备。NetApp的GX集群平台将最终采用先进的命名空间。针对包括迁移、复制、分类和解复制内的FAN软件服务,公司进行了一系列的研发和技术合作。
这是FAN时代的开始,可以预见,技术将被快速创新和迅速增值的。然而,在2006年和2007年初,我们期待着这些厂商,通过扩展企业文件管理能力,在即将到来的文件区域网络阶段中发挥举足轻重的作用。让我们共同迎接一个全新的FAN时代。