昆腾公司高级技术顾问Fred Rybczynski演讲实录
大家好!很高兴再次光临北京跟大家见面。我们这次是新推出的DXi3500和5500。今天我会给大家简单介绍一下昆腾公司,其次是重点介绍DXi的新产品,展示它对于客户的价值,最后我会给大家做DXi新产品的演示。昆腾公司是一个专门致力于备份、恢复与存档解决方案的全球领先的存储公司,我们全球雇员3000人,年收入12亿美元,并已在美国上市。
昆腾提供了种类齐全的产品,具有业界最广泛的存储、恢复、备份一系列的方案,我们拥有磁带加载机、磁带机、企业级的磁带库、重复删除功能的虚拟磁带库等等。我们推出虚拟磁带库的目的就是使大家能够享受到磁盘阵列的高性能、快速地恢复。客户之所以需求从磁带备份转向到现在的VTL备份,就是享受磁盘阵列带来的高可靠性。但是客户又发现一个新的问题出现了,当他们存储到磁盘阵列他们发现不能存储大量的数据,因为会导致成本的上升。
对于产生的这个问题,是客户发现他在传统VTL上,不可能存储大量的数据和进行长时间的保护,昆腾现在产生了可以使用户长时间的保存和大量的使用数据库,同时可以恢复和备份数据库的产品。通过昆腾领先业界的重复数据删除技术,我们可以提供给客户10倍、20倍,甚至50倍的重复数据删除笔。
通过重复数据删除技术,我们提供了更大的容量,更好地性能,更好地可靠性。我们通过只存储唯一的数据块,而删除重复的数据块,大大减少了客户存储工作的时间,减少了备份窗口的压力。
重复删除技术的原理就是从事我们这种数据量远远小于实际数据的指针,来代替以后重复的数据块,使我们的用户的存储量真正存到VTL上面的存储大大减少。我们可以通过重复数据删除技术,一方面提高容量的利用率,另一方面我们可以用它所带来的复制技术,实行远程的、域外的、灾难的数据恢复的业务。
我们的DXi3500和5500之所以是重复数据删除设备,就说明它很容易管理和使用,只要接上电源和网线就可以实现我们VTL所有的功能,同时可以享受到重复数据删除的功能,以及异地数据的复制。同时你还可以享受到,昆腾享誉业界的售后支持服务和性能服务。
通过我们DXi重复数据删除业务,你不仅可以保留到几天的数据,还可以保留几个月甚至1年。它保护的数范围从250GB到11TB。它实现的方式多种多样,广泛的DXi,提供了客户灵活的接入性能,DXi可以提供大量的吞吐率。同时我们提供通过NAS的设备,可以直接进入局域网里面,通过一个协议你可以方便地使用它。通过DXi5500可以达到高达每小时800GB的速度。
我想大家都应该很熟悉压缩技术,过去压缩技术是我们在磁带技术里面运用来减少数据量的一种技术。看起来压缩技术有点类似于这个数据删除技术,两者之间好像有一些某一方面的类似,但是实际上在原理上是根本不一样的。压缩技术是以一个KB级的窗口之内技术重复的数据处理,所以它的性能是非常有限的。
现在假设我们的滑动窗口是4KB,我们发现第一个窗口有两个红色的数据块,这就是重复的数据块,我们通过向后指向该滑动窗口内的原始副本来删除这个数据块。我们用压缩指针代替物理数据块,来达到压缩的效果。
但是我们接着往下看压缩技术,你把这个4KB的窗口往后移的时候,你会发现第三块这个重复的红色的数据块,但是它没有办法被替代,在这个窗口之内你会发现第二个窗口所以没有办法删除。但是我们把这个窗户再往后移一点,你会发现第四个红色数据块,这样的话,我们第四个就可以用第三个代替。
前面讲到了压缩技术,但是对于重复数据删除技术,它就不是这样来实现的,它可以在全局的范围之内检索所有的红色数据块,当它看到有4个红色数块的时候,它以第一个红色数据块作为源,其他的就会以指针指向它,来达到删除重复数据的效果。这就是我们通过重复数据技术达到20:1、50:1的重复数删除比或者是重复数据压缩比的原理。
那么再看一下这个例子,大家都知道业界另外一种技术,叫做单一实例技术。这个技术有点类似于重复数据删除技术,在这里面我们发了5个附件,它的名称都是相同的,内容都是相同的,这个时候大家看到,通过单一实例技术,它只存储了一份真正的附件,其他的4个都是通过指针来代替,以达到降低存储数据量的效果。
比如说我们在这个系统里面,发送了5个邮件,但是在这个服务器里面只保存了一份,而其他的都是通过指针来执行的。但是单一实例存储的缺陷在哪里呢?当接受者打开这个附件或者是打开这个附件的名称,或者是修改这个文件,系统就会认为它是一个不同的邮件,就会完全地保存起来,这样这个附件就不会被真正的附件所代替,从而会有5份附件。
如果你采用的是重复数据删除技术,比如说你采用DXi3500或者是5500作为你邮件的最终存储,那么它的存储方式是跟你一般的存储不一样,他仅仅存储你修改这一部分更新的数据块存储到DXi上面去,而其他的都是重复的。
那么这个重复率相当高,这就是我们为什么可以达到业界领先存储删除比,达到50:1这样的比例。它比单一实例存储性能要高得多。
重复删除技术,大家通过上面的例子可以看到,它的工作原理跟我们的压缩技术是不一样的,它没有一个4KB的窗口,它根本不存在这个滑动窗口,它让你以全局的位置来看待重复数据业务,所以比压缩更有效。不仅如此,我们在DXi设备里面还提供了硬件压缩功能,我们的硬件压缩功能确实是一个标准的设置。通过我们单一重复删除技术处理完的数据,会交给硬件压缩卡,通过它进行进一步的压缩,以达到更高地压缩比。
大家从这个图示可以看到,如果我们每一次全备份是100GB,你备份10次之后,你会发现总体实际的容量占用还不到1TB。我们在第一次进行存储的时候,你会发现它的压缩比是20:1,但是在之后的存储你会发现,实际上存储的数量,跟最终存储到DXi设备里面的存储量,大家可以看到由于有大量的重复数据会使这个数据量上升,那么通过硬件压缩我们会达到40:1,因为硬件压缩比软件压缩更有效果。
那么通过重复数据删除技术,我们可以看到,在第10次备份之后,我们压缩比基本上接近了10:1,可以看到采用重复数删除技术,可以大大增加你实际的、能力保护的数据量,换句话说就是可以增加客户的数据恢复点,他可以从任何一个时刻恢复他的历史数据。
通过重复删除技术,我们在第10次备份完之后,我们可以看到这个数据量不到1TB,但是你采用传统的VTL来存储,你甚至没有办法保证一次全备份,因为一次备份就达到了100GB。我们DXi设备,为了保证可靠性和可用性,还在里面提供了缺省的RAID的保护和热保护,通过我们这样高可靠性的设备,一方面提供了大容量的数据保护,同时还是一个可靠地数据保护。
昆腾提供的DXi存储删除设备提供了广泛的型号供大家选择,不管是DXi3500还是5500,不同的型号可以提供客户不同的需求,我们可以从中选取任何一款给客户适合环境的数据保护。除了容量的考虑和保护周期的考虑,DXi还有性能优点,它可以提供业界领先的备份速度,满足客户备份窗口的需求。
我们不光提供了高容量大容量的数据保护方案,在性能上我们同样是可扩展的方案,从390GB/小时的吞吐率保护数据,到800GB/小时的吞吐率,我们可以满足客户吞吐率的要求。我们前面提到当我们重复在做删除技术的时候,通过这个技术,我们可以显著降低您存储到VTL里面实际的存储数据的容量。
我们举一个例子,比如说一家大的银行,肯定有很多的分支机构,在传统的数据保护方案里面,我们需要在每一个分支机构都要放置高技术人员来维护这些设备,来照顾我们这些磁带机和磁带库。如果您采用的是DXi设备,您就不需要担心这些人力上和成本的开支,您可以在分支机构放置一台DXi设备,系统管理员可以在本地计算机通过远程网络进行管理和配置,那么我们既享受了数据高速的备份和恢复,同时这些数据又可以自动地复制。
通过重复数据删除,比如说你需要删除50:1的数据,那么它就使您的网络带宽降低了。
DXi是易于安装、共享和管理的,DXi系列设备可以保护用户的软件和备份流程。同时提供广泛的选择,既可以是NAS连接,也可以是直接连接局域网。如果客户环境是一个很简单地局域网,就可以把DXi虚拟成一个NAS设备,如果是采用Windows的环境,就可以用NFS,如果用的是Linux就可以把我们DXi虚拟成一个CIFS来使用。当然,两种也可以同时使用。 [15:56]
你也可以采用我们iSCSI方式,或者是光纤的方式。我们的DXi5500的设备可以提供高达16的逻辑磁带库,和64的磁带机,高达3200个虚拟磁带机。所有先进产品的背后,我们昆腾提供了统一的服务,同时我们DXi设备可以提供更高性能,快速地备份和快速地恢复,更高地可用性和可靠性,以及更容易管理的界面。
在演讲的开始,我提到昆腾是业界独一无二的可以提供全面的方案,从磁带加载机、到备份等等,那么选择哪一款产品和服务,我们昆腾提供了一系列的工具,可以帮助客户了解他的需求和环境,从而选择最适合自己的方案。
我们可以看到摆在前面的DXi3500,它首先是获得专利的重复数据删除技术,其次是我们非常领先的硬件压缩技术,第三我们还有一个高性能的获得专利的文件系统。昆腾除了集成以上三种技术以外,我们可以看到昆腾的速度非常快,我们自从收购了AFC,这几款产品都是来自于我们不同收购的公司。
比如说我们的文件系统来自于AFC,我们发展的硬件来自于昆腾的VTL,所以可以看到昆腾在收购这些公司的领先技术之后,它集成这些技术的动作非常快,很快可以提供给业界一款具备重复数据删除的设备。同时我们昆腾还有享誉业界的远程监控、管理这种维护的手段和方法。
所以我们这一款产品不光具备了以上这些优点,它可以是我们整体解决方案中一个重要的组成部分,提供了所有后台支持的原理。通过DXi的重复数据删除技术,我们又可以使用磁盘的方式来保存我们的数据。我们可以保存更多的数据,同时又高可靠性、可用性和高性能。除了能够显著地提高备份的性能以及容量的优势以外,备份的目的是为了什么?最终目的是为了恢复数据,那么恢复就需要在你的存储设备上保存更多的全备份,这样才有利于你恢复的速度。
那么DXi因为通过这种领先的重复数据删除技术,可以让你有更多的重复数据,这样可以提高你的RPO,这样可以提高你恢复的速度。大家可以通过屏幕上的这个表格,看到我们入门和终端的配置,我们3500和5500都有一个入门的配置,另外我们提供了这两款入门级产品升级的路线,我们可以从500GB的磁盘升级到750GB,替换掉以前500GB,以达到更多数据量的保护需求。那么我们可以提供完整地路径,当然我们也可以提供从DXi3500转换成DXi5500的路径。
下面我们用一些时间给大家演示一下DXi5500的图形化界面,就是显示一下它的配置。
那么大家可以看到这是我们5500的主界面,我们从主界面可以看到我们定义了一个虚拟磁带库等等, 而且我们可以看到有一个复制正在进行中,这是从丹佛复制到加州。那么这个窗口我们可以看到,显示的数字首先第一行是我们通过备份向DXi5500传输的备份数据总量达到了4.82TB,通过我们重复数据删除技术,真正存储到DXi的数据内容是287.5GB。
最下面是压缩比,达到了17.15。那么在左边的窗口里面,大家可以看到显示了该DXi5500的可用容量是8.17TB,可以看到还有大量的空间可以使用。
通过这个图形化的界面,我们可以创建新的VTL,我们可以定义它的槽位数等等。
这里举的例子是我们创建一个名叫北京的NAS Share,我们可以激活这个数据的NAS Share,那么现在我已经创建了一个名叫北京的NAS Share,现在大家都可以用这个NAS Share,为了保护这个数据,我现在要创建一个NAS Share。
那么这个窗口我们可以进行修改,我们指定哪台服务器可以对这个NAS share可以读可以写,如果已经有指定的服务器,你只要读和写就可以了。那么现在大家可以看到我们北京的NAS share,它是一个NFF协议的NAS share,同时右边显示了它的加载点,这样我们可以把数据备份到这个加载点。
图形化界面还提供了完整的监控体系,无论你是以操作员的身份进入这个NAS share,或者是你执行一些任务,都可以通过我们的警告系统警告你操作错误、失误等等,它会把这些事件记录下来,同时发送邮件给相关人员。大家可以看到,不管是增加警告设置还是删除已有的设置都是非常容易和迅速的。同样DXi设备可以提供这种供第三方平台捕获陷阱,它可以针对某一类事件进行警告。
那么这个界面是在数据服务里面,这里面是定义我们复制的功能,在这个选项里面我们可以填写你需要复制到的目标设备的IP地址。
那现在显示的界面使我们可以通过它创建新的虚拟磁带库VTL。我们可以在这里面指定他的槽位库等等,比如说你可以直接选定一个传统的磁带库或者是DXi系列的产品,如果你选定的是传统的磁带库,那么备份的软件会认为它会认为这个物理带库有加载的时间,但是如果你选择的是DXi3500或者是5500它等待的时间只有两秒钟。
通过这个界面我们可以察看状态窗口,可以显示当前VTL的具体信息,以及察看某一盘指定的磁带已经占用的容量情况等。那么刚才显示的界面是它的物理界面,我们可以看到它虚拟器的数量和槽位的情况。下面这个窗口显示的是逻辑状况,比如说我们可以看到它现在占用了多少DXi的容量占有率,还有多少空间可以使用。
同样我们可以从这个窗口里面选择性能这一项,我们可以察看到分区磁带库的数据吞吐率是多少。所以通过上面这几个例子,我们可以看到,我们可以察看到所有的信息,不光是察看,我们可以进行管理和配置,而不需要通过这些命令来执行这些配置的功能。
那么今天我在结束这个演讲之前,我需要再给大家总结一下具备重复数据删除DXi产品的主要特点。主要有以下三点:第一点我们通过重复数据删除的技术,我们在可靠性上优于传统的磁带数据删除技术。
具备了重复数据删除技术的VTL,我们相对普通的VTL有非常明显的优势,它可以提供数月的数据保留在你的VTL上,而不是10天或者是数天的数据。那么另一方面重复数据删除技术是一直困恼业界的难题,如何保护我们的备份数据,使异地的备份数据传输真正成为可行、可用。
谢谢大家!