数据存储产业服务平台

某备份系统方案技术分析

    某应用系统目前有2TB应用数据需要进行备份,目前有两种备份系统方案可供选择:

    1、备份软件采用Veritas BackupExec,备份设备采用HDS 9520V磁盘阵列;

    2、备份软件采用Legato Networker,备份设备采用光纤接口的虚拟磁带库(虚拟磁带库)SureSave DL 2000E;

    针对这两种方案,我们从备份系统可靠性、备份系统性能、备份系统的可管理性、备份系统的日后的升级等多个角度进行分析,具体如下:

    1、 备份系统的可靠性:

    第一种方案的备份系统采用了磁盘阵列作为备份设备,备份软件采用Veritas BackupExec。这个方案是通过备份软件将所需备份的数据自动备份到与备份服务器连接的磁盘阵列中,是典型的 Disk to Disk备份模式,在这个方案中,备份软件为了实现硬盘备份配置了相关的磁盘备份软件授权。在该方案中,我首先要将用于备份的磁盘阵列HDS 9520V进行分区,创建文件系统,以确保操作系统能够对磁盘进行读写,继而备份软件可以对HDS 9520V进行读写操作,备份的数据是以一个大文件的形式存放在HDS 9520V中的。从数据安全性的角度考虑,这样的备份系统是存在很大安全隐患的,HDS 9520V是暴露在操作系统以及所有应用程序之下的, 除了Veritas BackupExec备份软件以外,备份服务器中的其他应用程序均可以对HDS 9520V进行读写操作,因为对于操作系统来说,HDS 9520V就是一个大容量的物理硬盘,与备份服务器本地硬盘没有区别;

    人为的误操作、恶意病毒、远程黑客攻击都会造成备份软件生成的备份数据文件损坏或被删除,直接造成所备份数据丢失!

    第二种方案的备份系统采用了虚拟磁带库作为备份设备,备份软件采用了Legato Networker。这个方案是通过备份软件将所需备份的数据自动备份到备份服务器连接的虚拟磁带库中,是典型的Disk to Tape备份模式。这里使用的虚拟磁带库是由虚拟磁带库引擎和高可靠磁盘存储系统(磁盘阵列)组成的,对于备份服务器来说,虚拟磁带库与传统的物理磁带库没有区别,在备份服务器中我们看到的是机械手臂、磁带驱动器,而不是像第一种方案中看到的大物理硬盘。与传统的物理磁带库一样,虚拟磁带库对于备份服务器的操作系统以及应用程序是不透明的。用过物理磁带库的技术人员都很清楚,除非使用相应的备份软件,否则我们不可能对备份到磁带中的数据进行读写操作,虚拟磁带库与物理磁带库在这一点上是完全相同的,因此,使用虚拟磁带库作为数据备份设备是不存在使用磁盘阵列时出现的安全性问题的。

    分析结论:第一种方案在备份数据的安全可靠性上存在一定的问题,建议采用第二种方案!

    2、 备份系统的性能:

    在分析备份系统可靠性时,我们了解了第一种方案中要求必须对磁盘阵列创建文件系统(在Windows平台就是格式化),备份软件才能进行数据备份恢复工作,第一种方案中HDS 9520V对于备份服务器来说就是一个大硬盘,操作系统和备份软件对HDS 9520V的读写是随机I/O的模式,写入HDS 9520V的数据是零散的分布在磁盘的各个角落的。

    第二种方案中的虚拟磁带库对于服务器来说就是一个外挂的物理磁带库,通过对备份软件的管理界面,我们可以清楚地看到虚拟磁带库的磁带驱动器、机械手臂、磁带插槽以及带有条码标示的磁带(这跟物理磁带库没有任何区别),在虚拟磁带库内部,虚拟磁带库引擎根据用户的虚拟磁带库中虚拟磁带的设定将虚拟磁带库的硬盘空间划分为多个区域,每个区域都是裸设备的形态存在的,每个区域与虚拟的磁带相对应,因此每盘虚拟磁带的物理存储位置是固定的,也就是说,备份软件对虚拟磁带库写入的数据都是按照顺序写的方式写在相对固定的裸设备上的。

    通常情况下,裸设备(未创建文件系统的硬盘)的I/O性能要比创建了文件系统的物理磁盘的I/O性能要高,这也正是为什么很多大型数据库的应用(如Oracle、Sybase、DB2)都采用裸设备的方式存储数据的原因,第一种方案的备份设备采用带有文件系统的磁盘I/O方式,第二种方案采用裸设备的磁盘I/O方式,在实际测试中,第二种方案的备份速度是优于第一种方案的。

    在第一种方案中磁盘的随机I/O读写持续时间一长就会产生大量的磁盘碎片,这与我们平时所使用的PC是一样的情况,PC使用时间长了I/O性能就会下降很多,需要进行磁盘整理,作为备份用的备份服务器以及磁盘阵列也存在同样问题。这样的备份系统运行一段时间后,我们就会发现备份效率比刚开始降低了很多,解决的办法就是进行磁盘碎片整理,然而几个TB容量的物理硬盘进行碎片整理需要耗费一周甚至几周的时间,这在备份系统中是不太可行的。

    第二种方案中虚拟磁带库引擎为每一盘虚拟磁带都划定了固定的磁盘区域,而且数据的写方式完全按照物理磁带的写方式进行顺序写入,长时间运行也不会出现磁盘碎片,因此我们看到,在实际应用中虚拟磁带库的I/O性能是很稳定的!

    分析结论:第一种方案备份设备采用文件系统的随机磁盘I/O方式,由于文件系统自身的I/O瓶颈以及磁盘碎片等因素在备份性能方面会受很大影响;第二种方案备份设备采用裸设备的固定区域的顺序读写I/O方式,不存在文件系统的I/O瓶颈以及磁盘碎片问题,在备份性能方面表现优秀,不会随着备份系统运行时间的延长而降低。

    3、 备份设备与操作系统的兼容性

    第一种方案中,如果在备份服务器损毁、备份软件出现故障的情况下需要恢复数据,由于通过备份服务器我们已经将HDS 9520V格式化并创建了NTFS的文件系统,如果备份服务器操作系统更换为非Windows平台,则HDS 9520V中的备份的数据均无法使用。

    第二种方案中采用的SureSave DL 2000E虚拟磁带库是一个独立的物理设备,与操作系统无关(OS Independent),将SureSave DL 2000E连接到任何主机或操作系统中都可以识别出虚拟磁带库的机械手臂、磁带驱动器、磁带插槽以及每一盘虚拟磁带,备份软件可以轻易读取虚拟磁带库中的数据。

    分析结论:第一种方案由于文件系统类型的问题,在备份系统迁移、变更时无法做到很好的原有投资保护;第二种方案的虚拟磁带库是独立的物理设备与主机无关,在备份系统迁移、变更时可以很好的保护原有投资。

    4、 备份数据的归档管理

    第一种方案中,Veritas BackupExec将数据备份到HDS 9520V中,一旦HDS 9520V出现故障,或HDS 9520V的物理硬盘故障导致整个RAID数据丢失,备份数据都无法找回。通常情况下,我们会将重要的备份数据归档导出到物理磁带中存放来保证数据的可用性,然而Veritas BackupExec不支持将备份到硬盘中的数据再导出到物理磁带库中进行归档,这在一定程度上会影响到整个备份系统数据的可靠性。

    第二种方案中,备份软件把数据备份到SureSave DL 2000E虚拟磁带库中的虚拟磁带中,SureSave DL 2000E虚拟磁带库具备将虚拟磁带数据导出到物理磁带的功能,如果用户需要将存放了重要备份数据的磁带复制一份到物理磁带中,通过简单操作虚拟磁带库的管理界面即可实现(导出的物理磁带还可以导入回虚拟磁带库中),复制好的物理磁带放置到异地或安全环境中保存,做到了备份数据的安全保护。

    分析结论:磁盘备份存在磁盘损坏的风险,第一种方案无法对备份数据进行离线数据保护,在备份数据高可用方面存在很大隐患;第二种方案中虚拟磁带库支持将虚拟磁带数据导出到物理磁带的功能,可以实现数据的真正离线保护,提高了备份数据的可用性。

    5、 异地容灾的实现成本

    如果用户需要对备份数据进行异地容灾,第一种方案中,用户可以在远程购置一套同样的 HDS 9520V,购买磁盘阵列相关的复制软件授权,然后添置两套FC to IP的协议转换设备,将两台HDS 9520V通过WAN连接起来进行LUN的复制,远程节点如果需要进行数据的恢复工作,也同样要配置一套Veritas BackupExec备份软件,这样的投资与管理成本都是很大的。

    在第二种方案中,最廉价的方案是:将SureSave DL 2000E中的虚拟磁带导出到物理磁带中,然后将物理磁带在异地保存,需要的时候可以放入物理磁带库中进行恢复。另外,Legato Networker具备克隆的功能,在远程配置一个存储节点,用户再添置一台同样配置或者更低配置的SureSave DL虚拟磁带库,购买相应的存储节点软件授权,备份软件在备份数据的同时,可根据用户的要求,定制一个备份策略,把用户认为重要的数据备份到远程的SureSave DL虚拟磁带库中,从而实现备份数据的异地容灾。

    分析结论:第一种方案如果要进行备份数据的异地容灾需要追加大量的后期投资以及管理成本,同时技术实施难度也很高。而第二种方案无论在投资成本还是管理成本上都做到了资源利用最大化,对用户的远期规划很有意义。

未经允许不得转载:存储在线-存储专业媒体 » 某备份系统方案技术分析