虚拟磁带库的概念
虚拟磁带库就是在备份服务器或网络端上体现为传统磁带库的磁盘或磁盘阵列。
我们将用磁盘为备份介质来存储数据,并且本身能够仿真成物理磁带库的产品,称之为虚拟磁带库。
真正的虚拟磁带库,其使用方式与传统磁带库几乎相同,但由于采用磁盘作为存储介质,备份和恢复速度可达100MB/s以上,远远高于目前最快的磁带机。同时,磁盘阵列的RAID保护技术使虚拟磁带库系统的可用性、可靠性均比普通磁带库高出若干量级。
虚拟磁带库的概念早在10余年前即已被IBM,StorageTek等著名存储厂商所采用。然而,受限于磁盘和虚拟磁带技术的发展,以及厂家为了保护其既有模拟磁带库市场的考量,长期以来虚拟磁带库以价格高昂著称,使其通常作为大型磁带库的前端缓存使用,且依附于特定的主机系统(”封闭系统”),市场认知度一直很低。而在近些年,磁盘技术快速发展,出现了多种类型磁盘(SCSI、FC、ATA、SATA),使单位容量磁盘存储的价格急剧下降,进而使磁盘阵列作为备份设备的应用也愈加广泛。
磁盘备份 ≠ 虚拟磁带库
虚拟磁带库是磁盘备份的主流方式,但并非唯一方式。在使用磁盘介质的备份解决方案中,还有一类被称为”磁盘到磁盘(Disk to Disk)”的解决方案。
“磁盘到磁盘”的备份通常指以磁盘或磁盘阵列作为备份设备的备份数据存储方式。
使用磁盘或磁盘阵列与使用虚拟磁带库的不同点在于,磁盘、磁盘阵列必需以主机相关的文件系统方式使用。因此,会存在以下几个问题:
容易被误删除或被病毒感染;
文件系统读写低于裸设备读写,并且产生文件系统碎块,进一步降低I/O效率;
以文件目录方式存储数据,不便于结合成熟的基于磁带库的备份策略;
不便于在SAN环境中统一管理和优化使用。
不支持磁盘阵列到磁带库直接的数据转储,必须借用备份管理软件的备份数据或备份卷拷贝功能。
虚拟磁带库:系统可用性较磁带库提高若干量级
虚拟磁带库中,一般采用磁盘阵列作为后端存储设备。磁盘阵列采用的RAID技术能够保证当盘阵中某一块磁盘出现故障时,盘阵上的数据仍然可以正常读写。用户可以在线更换损坏的磁盘,然后对盘阵逻辑卷进行动重建。用户亦可设置在线热备盘,在出现一块磁盘(RAID6可以同时出现两块磁盘)损坏时,RAID控制器可以自动隔离故障盘,并立即开始逻辑卷自动重建,实现自动在线热恢复。保持了设备的连续可用性。
而磁带库的机械手、磁带驱动器和磁带均为非封闭的精密部件,也不具备容错能力,很容易受灰尘、潮湿等环境因素的影响而导致故障。多个部件组合后整体系统的可用性将更低。
可用性低也就使维护成本提高。据统计,2002 年在美国磁带库的平均年维护成本高达磁带库采购成本的10~15%,尤其令用户烦恼的是,磁带库修复必须由专业人员进行。维修反应时间长,常造成日常运营混乱。用户常因此而被迫购买冗余磁带驱动器 – 而驱动器恰恰是模拟磁带库中的主要昂贵部件,进一步加大了用户的总体拥有成本。
虚拟磁带库:备份可靠性较传统模拟磁带库提高若干量级
备份本身不是目的,必须能够保障数据恢复,备份才有意义。而备份介质的可靠性决定了备份数据的可靠性。磁盘是密封结构,而磁带则暴露在空气中,易受粉尘、湿度、磁粉、粘连、霉点等因素的影响,出现读写错误。所以磁盘的MTBF(平均无故障间隔)一般为磁带的5倍以上。显而易见,采用受RAID保护的磁盘阵列系统存放备份数据,比只用单盘磁带存放数据的可靠性要高得多。
为了提高磁带存储的可靠性,很多用户采用磁带复制方式,实现数据双备份,这样不仅费时费力,同时将造成额外的运营成本。
虚拟磁带库、磁带库、磁盘阵列的比较
作为传统虚拟磁带库的一个有益的补充方案,SURESAVE虚拟磁带库通过光纤连接到备份服务器,为数据存储提供了高速、高效的解决方案,致力于最小化用户备份所需时间。更重要的是,它通过冗余和热插拔设计保证了系统的不停顿,实现连续的备份。用户利用现有的网络,几步简单步骤就能够完成配置。这些特点保证了最小化用户总体投资和最大化性能和商业投资回报。同为数据存储设备,磁带库、磁盘阵列、虚拟磁带库在许多方面有差异。下表中将3种设备之间的不同进行对比。
虚拟磁带库技术与发展趋势:
虚拟磁带库的主要实现方式
” 纯软件虚拟磁带库方案(第Ⅰ代D2D)
将磁带库模拟软件直接安装在备份服务器上,把备份服务器的某些文件系统分区模拟成磁带库,从而使备份软件以磁带库方式使用磁盘文件系统。
此类方案下的备份磁盘暴露于主机的操作系统,本质上依然”在线” 。在用户看来,依然在线的数据一定是不安全的。举例来说,如果备份服务器不幸被病毒感染,该病毒完全可能在损毁在线磁盘上数据的同时,损毁备份盘阵上的数据。
另外,此类方案占用主机资源,性能受限。
这种方案多由备份管理软件作为一个功能模块提供,价格比较低廉。但由于受制于文件系统,使其应用场合、I/O性能及数据安全性具有一定局限。
因此,此类方案主要用于备份缓存 – 也即先备份到磁盘,然后在服务器不忙时再将备份转移到物理磁带库上。
” 专用服务器级虚拟磁带库方案(第Ⅱ代)
该方案实际上是另外一种虚拟磁带库的软件实现方案:通过把虚拟磁带库管理软件安装在一台独立的专用服务器(一般是PC服务器)内,而将该服务器及所连接的磁盘存储设备模拟成磁带库。
这种方式下,备份服务器或其它应用主机通过FC或SCSI与专用的服务器连接,此时专用服务器及所连接的磁盘存储系统一起体现为虚拟磁带库(虚拟磁带库)。
与纯软件虚拟磁带库方案不同点是,备份服务器或应用服务器把专用服务器及其磁盘阵列当作了一台磁带库设备,实现了虚拟磁带库设备与主机设备的物理和逻辑上的分离。主机对这种方案下的虚拟磁带库的读写方式是数据块级(Block-Level)读写,比纯软件方案的读写速度快,并且不会从主机方对备份数据产生误删除操作,主机上的病毒也不会影响备份数据。
此类方案下,虚拟磁带介质 – 磁盘逻辑卷, 不再是操作系统格式化的扇区,而是和磁带一样的裸介质(”raw disk”);其上备份数据也是按顺序Byte to Byte存放的,在物理层上实现了磁盘读写的线性化,避免了文件系统的碎块问题,充分利用了磁盘设备的高速I/O性能。
这种方案的不足是需要利用一台具有一定扩充能力的PC服务器作为虚拟磁带库管理器,系统优化性略低,另外控制器部分采用PC服务器结构,不够精简。
” 专用控制器级集成虚拟磁带库设备方案(第Ⅲ代)
将磁带库模拟管理软件固化在特别设计的硬件设备中,就形成了专用的虚拟磁带库设备,这种设备需要配置一定数量和类型的主机接口和后端存储磁盘阵列接口,有的专用虚拟磁带库设备还配置了归档磁带库接口。专用的虚拟磁带库设备硬件结构与不同于PC服务器,设计采用了精简的硬件模块和精简的操作系统内核(一般为Linux内核),并且充分考虑了与主机及存储设备的连接能力。
专用的虚拟磁带库设备标志着虚拟磁带库技术终于突破了操作系统和PC服务器架构的限制,使虚拟磁带库真正成为了一种独立的外设,其使用方式也更接近普通磁带库,而其优越性能也体现得更加充分。
专用虚拟磁带库设备方案具有如下特点:
1) 性能大幅提高–可支持接近磁盘阵列极限速度的备份/恢复速度;
2) 免疫病毒–数据安全性等同普通磁带库;
3) 避免磁盘碎片–保障性能持续性;
4) 兼容性好–标准FC、SCSI或iSCSI接口设备,兼容流行的主机设备和操作系统。
5) 实用性好–与现有磁带库应用方式一致,不用更改现有存储应用软件的管理策略,保护用户投资。