数据存储产业服务平台

DoSTOR存储专访:Tom Clark北京解读存储虚拟化

    DoSTOR存储专访 11月1日北京消息:Tom Clark这个名字,在存储业界无疑是尽人皆知。他曾担任全球网络存储工业协会(SNIA)的理事,现任McDATA的解决方案和技术主任。他写的《SAN设计权威指南》(Designing Storage Area Networks)和《IP SAN权威指南:存储区域网络中的iSCSI、iFCP和FCIP协议》(IP SANs: Guide to iSCSI, iFCP, and FCIP Protocols for SAN)被列为进入存储产业的必读书,有存储圣经的美誉。而近日,我们又看到了他著的《Storage Virtualization》(存储虚拟化)一书,正因此,在目前业界正热的存储虚拟化技术上,他有着超于一般人的专业眼光。
  
    为了让DoSTOR的读者了解到存储虚拟化技术起源、目前所处阶段以及未来的发展,我们借着Tom Clark先生在北京主讲“存储网络虚拟化研讨会”的机会,和他进行了深入的交流。



Tom Clark先生


    Sean:您认为存储虚拟化到今天已经发展到何种阶段?
  
    Tom Clark:
我写过的那本书中我指出存储虚拟化技术是SAN技术演进的下一个高潮,在市场上存储虚拟化已经有一些投入使用的产品,这些产品在应用方面的范围还非常窄,但是在很窄的应用面当中,这些产品是有效的。虽然有效,但这些产品还未能发挥存储虚拟化当中的巨大潜力。在今天有很多存储处理器的工作是人力密集型员工操作为主的,要对服务器做大量配置和分配,为了满足在层级上应用的要求还有大量的管理工作要做,将来有了存储虚拟化之后上述所有流程可以实现自动化。但是在实现自动化的同时,要确保数据的完整性,要确保整个解决方案的可靠性和高性能的话还有很多年的工作要做。
  
    Sean:您刚才提到很多虚拟化产品在应用方面比较狭窄,是不是说在实践功能和在整个局域网中所能起到的虚拟化作用并没有达到业界认为虚拟化应该在存储区域网中达到的效用?
  
    Tom Clark:
我同意你的说话,但有一个条件,业界的期望值往往是由宣传炒作来导向的。比如在iSCSI和其他新技术而言,对于它的期望值总是高于初期实施的水平。所以存储虚拟化也受害于一些炒作行为。一方面,存储虚拟化技术的核心仍然是非常强大的。今天我们在使用存储虚拟化的时候应用是相当狭窄的,但是我们现在还没有能够使整个SAN网络的运行实现自动化的虚拟工具。但是我想再过几年,存储流程将会实现高度自动化。也就是说,我们可以把这个发展比喻成在计算平台之上从命令行界面发展到完全图形界面这样就使应用的运行变得简易得多。
  
    Sean:实现虚拟化主要有三种途径:主机、控制器和网络,您认为日后哪一种方式会成为主流?
  
    Tom Clark:
第一种基于主机的虚拟化已经有相当长的历史,主要是通过VERITAS(已被Symantec并购)的卷管理器来实现的,基于主机的虚拟化的主要问题是按照每个主机来管理的,那么对于拥有50到100台服务器的系统,需要管理的服务器就非常多了。下面就是基于存储阵列的虚拟化,日立和一些小公司都有一些解决方案,这些解决方案是很好的,但是对用户来说就是要使用他们专有的存储技术。在网络中的虚拟化得到了业界的大力支持,因为这样的虚拟化可以独立于主机也可以独立于存储系统之外,使客户可以使很高的灵活性来实施虚拟化服务。
  
    Sean:但是从目前推出的虚拟化产品来看,基于网络的虚拟化产品没有其他两种方式那样成熟,基于网络方面的虚拟化产品并不是很多?
  
    Tom Clark:
这个现象是存在的,现在市场上数量最多的是基于主机的存储虚拟化产品 ,还有一些基于阵列的虚拟化产品,但是在这种关于稳定的高性能的同时能以非破坏性的方式来实现集成的虚拟化技术研究方面,现在主要是在基本的工程设计方面,业界投入了很多的精力。这个工作的重点是在标准的制定方面,就是基于Fabric的标准的制定。无论是基于的虚拟化还是基于存储设备的虚拟化现在都没有业界统一的标准,它们都代表专有的解决方案。特别是要McDATA的技术方案主要体现的是对客户体现的是更高的性能,我们的解决方案是基于光纤架构应用接口标准的,而且我们具有后向兼容性,这些性能实际是客户所需要的。虽然网络虚拟化解决方案在2005年部署得还不是非常广泛,但是和客户交谈的情况可以看到,到2006年的时候,很多客户会在网络中更广泛地部署虚拟化服务,并开始实施虚拟化方面的新技术包括生命周期管理技术。
  
    Sean:您认为大量在网络层面实现虚拟化的时候,基于主机和基于控制器的虚拟化会走向何种的方向?
  
    Tom Clark:
在今后的发展中,我们仍然会看到不同的虚拟化方案演进的过程。就像自然界的进化论一样,不同的物种会在同一个时间段中向前进化。在这个过程中市场会起到一定的物尽天择,自然选择的作用。对于规模比较小的公司来说,因为他们需要管理的服务器数量不是很多,基于主机的虚拟化仍然是一个很好的解决方案。对于一些希望采用某一家特定厂商的专有化存储技术的客户来说,基于阵列的解决方案也是不错的。但是总的期望是基于光纤网络的虚拟化将成为一个中心趋势,将得到广泛采纳,而且对基于主机和阵列的虚拟化是一个很好的补充。
  
    Sean:现在大多数虚拟化的成功案例都是在美国和欧洲地区,能否介绍一下虚拟化在美国应用的程度?
  
    Tom Clark:
即使在欧美市场,虚拟化的应用也不是很普遍。即使是在使用虚拟化技术的公司,他们也是把虚拟化用在非常特定的解决方案当中。比如,有一家公司有一个数据中心用的是IBM的,还有另一个数据中心,这样它用EMC的虚拟化技术来实现异质数据的处理。实际上它的关注是非常窄的,应用是非常特定的。现在我还没有看到哪一些大公司用虚拟化技术来对所有存储资产都使用虚拟化技术,现在虚拟化技术还是用于典型的应用,像快照,如果想让这种情况发生实质性变化的话,条件是主导厂商比如日立,IBM,EMC要向市场上证明能拿出非常稳定,非常强大,非常高性能的虚拟化解决方案。如果这点能成为现实的话,我们将会看到虚拟化技术的广泛应用。
  
    Sean:那目前用户采用的虚拟化产品中的功能并不一定是虚拟化产品才能实现的,像Veritas的软件在很多年前就可以实现,那使用目前这些虚拟化产品的意义何在?
  
    Tom Clark:
我们以快照的功能为例。现在用虚拟化来做快照的用途举一个例子,比如有一个公司有一个非常高端的存储阵列,它的业务是运行在高端的阵列之上的,这时要对存储做一些快照的处理,但是又不想把非常昂贵的高端存储阵列中的存储资源来存储快照的时间点上的备份,通过虚拟技术我们可以用一个虚拟存储池把一个高端的阵列和一个中端阵列放在一起,把快照的复件放在中端的阵列当中,那么这个中端阵列在虚拟池中仅仅是备份和把数据恢复到某一个做了快照的时间点上,但是在中级阵列上不会去做任何业务的运行,这样我们通过虚拟存储池来做快照就可以大大节省成本。
  
    Sean:您设想中的存储虚拟化在未来是何种模式?
  
    Tom Clark:
将来存储虚拟化的理想模式在市场上已经有说法了,叫做公用事业式的存储。在那个时候我们就不需要像现在这样手工地来管理存储资产,也不需要担心不同存储资产的利用效率不同,因为届时我们会用虚拟存储池来解决这个问题,而且在光纤网络中将具有自动智能,自动地把存储资产分配给需要这种资产的应用。今天我们对于大企业来说使用的是同一层级的服务,全都是高端的,高端的存储系统,高端服务器,高端的SAN导向器的架构。


    今天的现实是对于业务型的应用来说,并不是所有的业务数据都要给它最高端的处理,而且业务信息有生命周期的,有的时候价值高,有时价值低,它有一个价值起伏。在一个理想的虚拟化环境中,我们可以通过虚拟化技术把存储数据放到不同的集合当中,每一个集合实际上反映了这个数据在当期的在性能上,可用性上的价值,这样有了虚拟化之后企业有了充分的灵活性,把他们的存储数据根据实际价值在不同资产中加以转移,这样对于每一个业务数据的处理方法能最符合它当前的价值。


    在一个理想的虚拟化环境中,所有的存储资产,应用和服务器都能处在自我配置的状态中,我们可以以不同的级来提供不同级别可用性和存储成本。对于高度自动化的网络的能力,是一个很大的挑战。一旦这成为现实,SAN的基础架构回应性就更强,反应时间就更快,就可以有效地在SAN基础网络架构的供应商之间和具体的业务应用编程商之间建立起一种联系,但是现在这种联系还不存在。
  
    Sean:虚拟化在存储届不仅仅局限于SAN网络里实现虚拟池的方式,还有一些单一的硬件把硬盘虚拟成磁带,提高用户数据保存和使用的量,你认为这两种不同虚拟化技术的区别何在?
  
    Tom Clark:
这两种技术是互补的,我们有磁盘到磁盘备份,磁带到磁带的备份,以及通过虚拟化技术来驱动不同的多个磁带库中数据的技术,如果使用这种技术,虚拟化的引擎一般是由磁带厂商提供的单独的机箱,这样的磁带虚拟化引擎从终极意义上来说是有可能集成到整个光纤网络中的,只不过目前磁带技术厂商更多是把虚拟化引擎作为一个设备来卖,还有一种虚拟化技术是基于文件的虚拟化技术,基于文件的虚拟化技术更有可能紧密地和块虚拟化技术集成在一起。我们要把这些不同技术作区分的话主要在它们所适用的应用上做区分,在应用背后这些基层的技术有很多共性。
  
    Sean:有人开玩笑说在存储界里所有技术在未来都可以实现虚拟化,是否代表虚拟化是存储技术发展的未来趋势?
  
    Tom Clark:
这是对的,虚拟化是让所有的这些更高级的服务成为现实的驱动的技术,虽然这些驱动的技术表现形式不一样,我们有个成语叫异曲同工。现在实际上从SAN基础架构的角度来说,光纤架构已经达到2G,4G的能力,性能非常高,虚拟化层可以作为驱动型的建筑模块,除此之外,还有很多服务层级,比如信息生命周期管理能力,自动化能力,有了基础之后,我们会看到越来越多更加成熟的应用。总而言之,虚拟化是所有这一切的基础。
  
    Sean:刚才您一直提到Fiber Channel,你在一本有关IP SAN的书中对iSCSI 是非常推崇的,从iSCI诞生以来,业界一直有争论,就是在今后究竟是Fiber Channel还是IP SAN会占据市场的主流,但从目前看,iSCSI 的市场发展并不像很多年来一些厂商推动的那样,有很大的进步,目前还只是一些小厂商推出了iSCSI的产品,您认为将来IP SAN的发展是一种什么样的趋势?
  
    Tom Clark:
关于iSCI以及更早的一些存储虚拟化技术当时问世以后被过分炒作,当时有一家商业媒体说IP SAN会消灭Fiber Channel,虽然这种说法是不正确的,但是在这段的发展当中,iSCSI也证明了这种技术的可行性,并且以及进入了标准制定的阶段。并且这个技术还得到了微软,英特尔这样的主流厂商的认可。iSCI不是要替代Fiber Channel,而是要对Fiber Channel起到一个补充的作用。比如,对一些大的客户来说,对他们最具有使命关键性的应用来说,他们使用的是Fiber Channel,但是除了这些最具有使命关键性的应用他们还有一个堆件去放一些直接附着的存储要使用一些二级的服务器来做一些备份和存储。这样对一家公司来说,如果在二级服务器中也使用光纤通道来说成本太高了,这样iSCI就成为很好的选择,既可以降低采购成本设备成本也可以降低管理费用,特别是我们有了整个SAN虚拟化能力之后,我们可以把这种虚拟化能力既分配到光纤通道服务器也分配到iSCSI服务器。
  
    Sean:现在大多数iSCSI提供商都会以中小企业或二级机构这种用户作为自己的发展目标,但是大的阵列厂商或高端SAN的厂商现在也在面向中小企业或分支机构开发中一些二级设备或低端设备来满足中小企业用户的需求,在这种情况下,iSCSI所面对的用户更为狭窄了,您认为iSCSI的发展是什么?
  
    Tom Clark:
以Clarrion为例,既可以使用iSCSI也可以使用Fiber Channel,还有很多其他模块化的二级或中级解决方案。比如有些新创企业也推出iSCSI的解决方案。所以我们看iSCSI不应该仅仅去从发起iSCSI的目标这个角度来看,这种解决方案可能对中小企业是行得通的,iSCSI从主机的角度来看不一定是针对小企业的,还可以针对大客户。这些大企业已经在SAN网络有了投资,有了他们备份的操作和流程,有了他们的二级存储,这样的话,如果使用iSCSI来增加服务器数量的话是一种非常经济高效的方式。如果把iSCSI主机和iSCSI目标相对于比较低端的Fiber Channel主机Fiber Channel目标的话,我们很难说哪一种方式更受欢迎。这样对于用户来说就可得看今天正好是哪家厂商上门来卖东西了,因为对于一个用户来说,没有一个绝对的原因来说明是一定要选择iSCSI主机目标还是选择Fiber Channel的主机和目标,因为这两者的成本是一样的。但是对于已经在SAN网络做了大量投资的大企业来说,要把这些二级服务器添加到已有的系统中来,iSCSI毫无疑问是一种性价比更高的做法。
  
    Sean:目前已经推出一些实际的iSCSI产品,Fiber Channel的产品目前还是在4G方面进行推广,并没有完全占据市场,从形式来看,可能iSCSI处于一种比较良好的态势,但是很多用户和厂商认为iSCSI技术在某方面还有些缺陷,导致了在提供给用户选择时用户很少会选择iSCSI产品,您认为iSCSI目前发展的技术缺陷是哪些?
  
    Tom Clark:
它的缺陷主要是来自于人们的期望值。刚才谈到了10G的以太网,现在实际上还没有一个10G的具有很高性价比的解决方案,而且在主机系统上10G是根本用不到的。也就是说10G可能会在一种非常高性能要求的交换连接或阵列集中端口上会有一定应用。所以今天达到10G的以太网解决方案不是具有很高的实用价值。从iSCSI角度来说,某些产品的速度最高到1G,有时在1G以下,有时用于远程连接,速度是每秒45兆,速度还是很慢的。另外是用于数据中心的连接比如两个以太网之间的连接,可以达到千兆级或快速以太网的连接,前提是数据流量不能过量,只要数据流量不过量就不会发生碰撞,就不会带来这种IP网络的问题。只要运用得当,可用性是非常好的。


    通常我们遇到的问题不是iSCSI的问题,而是网络中流量太大的问题。流量太大,所以产生了大量的数据包恢复的需求,在一个真正运用得当的千兆以太网连接当中,从服务器到端口之间只要能够把流量控制好,它的性能是足够,成本是非常低的。现在的问题是无论是用户还是厂商,他们IP的网络当中流量太高,这样造成了数据包的丢失和性能下降。他们认为这是iSCSI的技术问题,其实只不过是流量太大的问题。
  
    Sean:你的意思是IP网络的问题制约了iSCSI的推广?
  
    Tom Clark:
我想不一定是说IP网络存在问题,实际上是一个网络设计的问题。对于光纤通道网络你也可以设计一个网络,然后给它加入太高的流量,这样效果同样不好。不是IP网络本身的问题,而是设计和流量的关系没有处理好。很多的人的理解是,有了IP网络后你可以把整火车的数据加进去,这是不对的。比如EMC的iSCSI产品,它提出你用iSCSI技术的话,你只能用一个专用于存储的以太网。你不能把它用作其他用途,这个网络不能支持你的其他要求。如果我们能充分理解网络技术的一些基本原理,把网络设计好的话,我们就有可能设计出很好的IP网络,以太网络或其他类型的网络。但现在很遗憾的是很多厂商对这点不了解,不懂通信网络运用的原理,他们给客户提供很多很坏的建议。所以厂商和客户都需要学习,经销商也需要了解一些参数。McDATA和客户的合作一向是非常密切,我们帮助他们设计网络,包括光线网络,容灾备份。效果很好。
  
    Sean:据我所知,McDATA明年年初会推出自己新的智能交换机,能介绍一下这款产品吗?
  
    Tom Clark:
这个产品的叫法有好几种。首先我们认为存储网络应该是高速的第二层的通道的传输渠道。比如那些使用McDATA导向器的用户要求非常高的可用性,这就是为什么他们购买了导向器的设备来和他们的存储和服务器实现连接。所以我们希望通过新产品交付给客户的能力是在他们继续今天拥有的高性能和高可用性的基础上,使他们能实现更高水平的服务。我们的产品叫作智能光纤网络模块。在不牺牲现有的高性能传输的基础之上能部署更高水平的服务。这个产品必须和现有的架构具有后项兼容性,必须具有很高的性能。所以,我们的这款虚拟化服务的模块是可以通过端口连接到McDATA导向器中的,是具有后端兼容性的,它是用的FlexPars技术是目前市场上最快的,每秒钟可以达到100万的I/O,和它形成对比的刀片技术现在每秒也只能达到20万至30万的I/O。我们在和IBM,EMC进行密切合作,来进一步提高可靠性。通过冗余和故障切换方面的设置我们旨在实现最高水平的可靠性,从而保证客户数据的可靠性。
  
    Sean:你们这款产品是模块化产品?那会不会做成刀片提供给你们的OEM伙伴?
  
    Tom Clark:
刀片有问题。在基础交换服务和虚拟化之间会有微代码兼容性的问题,而且通过把刀片加到一个通用型的机箱中在配置上又带来很复杂的要求。在McDATA模块化的思路当中,我们只要把这个模块通过端口接到导向器当中,就可以在不牺牲的导向器的工作效率和能力的情况下,就可以实现新的更高水平的服务了。而且现在这种模块化的思路已经证明可以大大简化管理,从管理的角度来说,虚拟化模块的管理好像是作为导向器管理的一个部分,很容易管理。从物理连接的角度来说,不会在功耗散热和微代码方面不会给导向器带来额外的负担。



Tom Clark先生在赠送给笔者的书上签名

未经允许不得转载:存储在线-存储专业媒体 » DoSTOR存储专访:Tom Clark北京解读存储虚拟化