数据存储产业服务平台

IBM系统存储大会:企业级存储系统架构的发展

    存储在线 5月18日北京消息:IBM系统存储大会今日在京隆重举行。会上,来自IBM的众多高层与嘉宾分别分表了精彩的演讲。


    从1952年发明磁带起,IBM一直引领存储科技的发布,IBM存储架构部杰出贡献科学家Gail Spear向与会者介绍了她在IBM的三十年,以及与企业级存储系统架构的发展。


    Gail Spear:早上好,谢谢大家给我这个机会在北京这个美丽的城市与大家见面,我今天要讲一下在IBM的经历,我经历了很多的变革,因为在这个公司时间很久了,我还希望向大家介绍一下IBM在存储方面的领先地位,今天的存储架构和明天的存储架构。我是1979年7月作为可靠性工程师加入IBM,这是很久以前的事了,我加入IBM的时候,IBM在存储方面的世界领先企业,从那时起出现了无数难以置信的变化,特别在不同的存储领域,可靠性、驱动器接口、缓存算法、数据复制都有不同,在缓存算法、错误修整和数据复制获得很多专利,最近10年我的精力集中在数据复制和灾难恢复领域,我们有机会在圣何塞与存储先锋一同工作,我们在1956年做了世界第一块磁盘,同时做存储研究。


    我在IBM快30年了,这30年来发生了很多的变化,在坐的有一些人可能还记得,这是一个非常老的磁盘驱动器,这是70年代的产品,这是3420磁带驱动器,这里有很多磁带,还有卷式磁带容量是160MB,按今天标准存储量很小的,当时没有自动装载磁带的方式,必须有人手工装带,寻找磁带再装上,所以获得数据很慢,而且管理这些磁带非常困难,这些磁带过去都是放在大柜子里面。

     当时磁盘存储是这样的,可以看到有一个老的3380,放在两个不同的箱子里,比今天DS8000需要占更多的面积,这上面有一个标签说如果你要修改它,一定要找一个朋友帮你,因为非常沉。在控制器中没有缓存的,我们有很多想法做缓存,比如磁头,磁头是动不了的,当时还有磁泡存储,这速度和半导体速度一样快,成本也很低,最后相反和磁盘存储速度一样慢,和半导体同样的贵。当时我们没有RAID,但是有非常可靠的方式来做,比以前有很高的改善,在这图上还有一点就是客户化逻辑,专门为产品设计的,需要很长的时间来开发这个产品。

     这是现在的存储,大家可以看到新的虚拟磁盘服务器,有60GB的磁盘介质,刚才说达到200GB,实际上向TB演进,向60GB又进了一大步,大家可以看到300GB DDM,这很轻DS6000有5TB存储空间,DS8000最大可以实现192TB的存储。

     刚才说单位面积内容量巨大飞跃,磁盘密度和转速也有巨大飞跃,第一次来公司的是大概300RPM,现在13000RPM,刚来公司的时候,我想这个速度还会更快,我们控制器都是缓存控制器,所有行业的控制器都已经实现缓存控制器,过去只支持大型主机,现在可以支持多主机的平台,iSeries,UNIX,Linux、Windows等其他的也都可以支持,存储不仅可以读写数据,还提供很多先进的功能都可以在存储实现,比如复制数据保护,通过RAID实现数据保护,我们还看到这个趋势在存储方面有更多的功能都可以让客户利用。

     我现在用很短时间介绍创新,这是IBM存储的信息,IBM存储部门的规模已经相当于《财富》450强的企业,我们有3千员工在160国家支持存储系统,我们有14个研发实验室分布全球,在研发方面有7.5亿美元的投入,存储方面我们创新具有领先地位,我们专利数超过所有竞争对手,这使得我们在研发方面可以采用最先进的技术,在实际应用中也有最先进的技术。

     这张图介绍了IBM整个公司的专利,我们可以看到在过去几年我们在各方面都占据第一,这是我们拥有专利的数量,这也意味着我们产品创新非常积极。在美国IBM专利数量也居领先地位,从1993年到2005年,在存储方面我们今年已经提交了286个专利的申请。这是关于存储方面专利的比较,IBM和一些主要的存储厂家的比较,每年申请的存储专利都比我们任何一个竞争对手都要多。 我谈一下存储的架构和现在的进展,因为我负责这一块的。


    我们有很多的存储产品线,以前可能有一个磁盘控制器,一个磁带的产品,现在有一系列的产品了,我想今后这两天你们会听到更多的,还有中端的存储网络,还有刚才提到的产品,以及企业界的,还有DS6000/DS8000,还有自动磁带库,另外非常好的使用,性能也非常高,把它都搁在一起就是存储软件提供了虚拟化,以及便于管理的性能。

     这是DS产品家族,这产品从低端DS300到DS400,一直到DS8000企业级的产品。我们用共同的平台来管理这些产品,我们有数据复制的功能,这样的话这些存储的控制器,另外还可以虚拟化的管理所有产品。我们以前有控制器的时候有逻辑,这个逻辑专门针对这个产品的,在过去几年中我们和其他公司一起利用协同的效力,这样利用PC服务器的技术放在存储服务器上,这样它的每次处理就快,我们可以放在存储控制上,这样性能就快了,因为我们这个架构是基于这个建造起来的,所以从一个控制器到另外一个控制器很容易移动并且有很高控能的处理,并且可以重新使用我们的微码,我们有时候也开玩笑,如果存储时间够,而且有很多的硬件,最终会不行,但是我们微码有时间的话最终还是有用的,我们想确保把微码技术的东西放在产品上,我们可以看到75%DS8000的码都是从以前ESS800产品中拿出来的,97%DS6000跟DS8000中也有。


    这是我们使用的拓扑技术,我们可以看到DS8000,也就是我们重新使用它的东西,把微码也重新利用,有时候是重复存储的盒子,这是存储最基本的要求,存储要保持,现在我们可以看到是一致性的记忆,这样的话使得我们能够有备份的数据。我们也可以看到这里还有RAID适配器,还有后端。

     在DS8000有一个智能的适配器,使得性能从主机中来的,然后放到存储控制器中,使得性能更好,另外提供端对端的检查,一旦进入存储控制器,我们确保一直到后端都是好的数据,我们从磁盘的存储中要确保存储是一致的。

     这图看起来和前面的图非常像,这是一个设备接口卡,我们可以我们使用的是PowerPC的技术,同时提供的东西使得能够确保从后端到存储的控制器都是对的,每次要对它进行检查。在早些时候的产品中,在后端使用这样一种技术,这样可以跟SSA来对话,我们认为是最快最可靠的技术,为什么不用光纤的系统呢?我们很多竞争对手这么使用了,我们之所以没这么做,因为光纤的通道可靠性以及性能不是我们所要的,直到我们有了这么一个设计,也就是有了光纤环,这样就有很多好处,同时如果其中一个连接掉了,我们很难知道哪儿坏了,有了交换式的光纤通道,我们有了这样的方法,这样我们还有富余的连接,我们不会有延迟,如果一个连接坏了,还有另外一个,使得你能够接入每一个DDM,而且很容易查出来哪一个不好。

     我前面提到有很多的功能,先进的功能放在存储里面,一个是弹性组,这样可以很好地使我们保护这个数据,而在27年前没法很好的保护,另外就是城域镜像,我们可以在300千米左右进行同步镜像。另外比如ESS800和DS80000和DS6000的产品还有一个SVC,这样我们可以提供更多的,另外在行业方面也是领先的性能,特别进行同步数据镜像的时候非常重要的。另外还有全球镜像,这可以从一个存储的控制到另外一个在很多很多公里以上的距离上有三到五秒数据延迟,同时可以使你在数据中心遭受灾难的时候可以恢复它,而且在很远的地方就可以进行恢复。另外还有一个全球镜像主要配合z系列,这是一个最好的异步解决方案,几秒钟数据延迟,如果对它进行镜像,如果逻辑方面不行,这样我们就有两个数据,所以我们要保护自己不会删除错误的数据,或者数据受到病毒的污染,我们要保护他们。我们就有FlashCopy,就有基于时间点的拷贝,一般一有什么不好我们马上可以恢复它。

     下面我们谈一下未来的存储架构,因为我们不断地在做存储方面的创新,以后会怎么样呢?Elly在前面谈到很多的挑战,我们未来要面临很多的挑战,数据是迅猛发展的,我们都有这方面的感受,还有物理空间的限制,同时要更有效地利用管理存储,要加强数据的保护,这些都是非常重要的,除了保护我们的业务,要确保我们能恢复,在灾难时候恢复数据的时候,政府规定也有很高的要求,这要重新考虑恢复的程序和离数据中心比较远,还有数据安全性的问题,我们怎么样保护数据的安全不受任何人威胁呢?另外有很大的数据中心,里面有很多存储,有很多服务器,我们怎么管理这些呢?我们怎么跟踪这些呢?

     我们利用了为p系列处理器8路的系统,利用p系列的服务器,利用逻辑,我们使用了一些放在存储控制器上,这样有多功能,现在我们可以很好地利用它,除此之外我们还可以想像除了使用这些存储控制器还有虚拟的存储控制器都放到一个盒子里面,同时我们还可以放在不同的应用,同时不用一个虚拟的处理器,或其他的处理器,我们把处理器分成微处理,微分区,这样进行进一步的分区,因为有些时候有些应用不需要整个处理器,在以后存储LPAR等有一个动态的应用,如果你有八个虚拟存储控制器放在一个地方,你决定其中一个需要更多处理能力,你可以把处理能力或者记忆放在这里,改进这个虚拟存储控制器的功能。


    我们为了应对数据的增长,利用LPAR,把不同的应用除了存储控制器和微码放在存储控制器里面,这些应用可能是这样的应用,它跟存储特别接近,比如NAS系统,SFS系统,和其他的系统,我们可以把目标服务器和其他东西方在这里面,另外我们可能有一个数据库加速器,有了这个数据库以后,要做检索搜寻的时候,要把所有的数据都读一遍,在数据库选出你想要的这些东西,但是如果这个搜索在存储控制器中就可以做完,而不是一直到主机上做这个数据的话会好一些,因此我们这个应用是一个DB2或Oracle数据库有这样的能力,还可以做其他的搜索、备份、TSM,Legato  Veritas以及其他的,这会给你提供磁盘到磁带的备份,还有医学影像使用都可以,还有数据的管理和控制。我们可以看到集成的功能有HMC和SVC,这样减少中心的复杂性,因为减少了盒子的数量。

     我们谈一下数据的保护,有存储的复制,有短距离或长距离的复制,我们想把这两功能合在一起,这样有高可用性,并且有灾难恢复的保护,因此有一个三点复制,我们在这里可以看到A、B是同步的复制,如果丢掉一个存储的控制器,或者因为维修的关系拿走,几秒之内整个会挪用到另外一个控制器上,而且数据不会损失,也不会影响到你。如果你有现场的灾难,你可能在远处C点,对它进行恢复,也就耽误几秒钟数据,这红线表明不管哪一个存储控制器,或哪个地点坏了,可以和另外两个合在一起,这样备份也是不受影响的。

     现在正在做的是一个持续性的数据保护,有时候要用Flashcopy,这是24小时或48小时以前的了,有了这持续保护,可以把每一个数据版本留下来,是连续记录的,我们可以在以前任何一个版本进行恢复,比如有一个病毒把你数据弄坏了,你想一下可能10点病毒攻击我的,你可以从9:59恢复这个数据,这样数据损失非常小的,正好在数据不行的时间进行恢复。再有数据的安全有一些担心,有人可能利用我们的数据,或者修改我们的数据,比如磁带有时候会丢了,或者被人偷了,除此之外磁带的存储会受到影响,我们要对它进行加密,这样的话磁带加密以及磁盘的加密可以确保它的安全性。

     数据保护冰立方产品是在一个研究中心做的,它包括积木、我们可以看到蓝色的连接器,这些连接器把每一个RAID和另外一个连在一起,而且是没有线的,这样我们可以把很密的放在一起,而且比较可靠,机架里任何东西都可以使用,这样我们就可以有这么一个存储的产品,你不会去更改它的DDM,它本身已经有足够东西都可以使用,你不需要去替代它,而且我们可以在这里添加这个模块,添加这个积木,但是你不会修复它也不会从中间取出一块,这样整个系统的稳定性和可靠性就增加了。

     我们有数据爆炸式的增长,我们有很多很多的服务器,我们有SAN,我们还会有所有IBM的存储,也可能你没有,也可能有除IBM以外的存储,那我们未来怎么管理呢?这表明一个单一整合后的存储管理,这样的话我们就可以对于服务器、应用,SAN,存储都是从一个地方管理的,你要保护数据还有一些政策为基准的服务器、网络、应用等等,而且是在不同的平台上。这个数据使得我们能够更好地利用它,而且可以从40%利用率增加到60%的利用率,我想以后会达到90%或100%利用率,以后会有灾难备份和恢复,以及故障结环在同一个地方或不同的地方。在下一个图中关键性的数据性能是非常好来进行存储,而且非常可靠,另外不那么贵。我们用了一些时候的数据就自动存档了,和生命信息周期管理。

     我的发言到此结束,感谢大家听我的发言,希望能够在会议期间与大家有机会见面!

未经允许不得转载:存储在线-存储专业媒体 » IBM系统存储大会:企业级存储系统架构的发展