一、前言
在当今复杂的商业环境中,每天都可能面对各种自然灾害和人为灾难的发生,当这些灾难降临时,对于企业的关键业务来说,哪怕是几分钟的业务中断和数据丢失所带来的损失也常常是难以估量的。信息时代的来临已使企业和IT日益紧密地结合在一起,企业业务的发展离不开IT系统。然而硬件与软件都无法构成IT系统的核心价值,只有存储于计算机中的数据才是真正的财富。企业自身发展中的众多信息和数据如何保护,对保证企业业务的持续性至关重要。因而,数据备份越来越得到企业的重视。
在数据变得越来越举足轻重的今天,一套稳定的备份系统已经成为保障系统正常运行的关键环节。数据备份不仅仅是数据的保存,还包括更重要的内容即管理。备份管理是一个全面的概念,包括备份的可计划性,磁带机的自动化操作、历史记录的保存以及日志记录等。而备份策略体现了一个备份管理的可行性。
二、备份的历史发展
数据备份的发展由来已久,在计算机诞生的初期,运行在如同电冰箱大小的驱动器上的穿孔卡片,打印输出带,穿孔纸带和磁带便可以用来复制大型机驱动器上的一切内容。不过真正的数据存储备份技术和存储管理源于70年代的终端/主机计算模式,当时由于数据集中在主机上,因此易管理的海量存储设备–磁带库成为必备的设备。那时每台主机都配备专用的磁带系统,主机中的数据必须备份到位于本地的专用磁带设备中。不过备份工作和对资源的总体管理相对复杂,磁带资源利用率也很低。
80年代以后,由于PC的发展,尤其是九十年代应用最广的客户机/服务器模式的普及,网络上文件服务器和数据库服务器成为要害数据集中的地方,而客户机上也积累了一定量的数据。数据的分散分布造成数据存储管理的复杂化,推动数据备份向容量大、具有先进自动管理功能的方向发展。具有自动备份功能的磁带机及磁带库产品将多盘磁带、存放磁带的智能机械臂系统和磁带库管理、控制、监测、诊断系统集成在一个产品里,从而实现自动换带,提高磁带库的可用性。整个备份过程不会中断,无需人工干预,也不会影响其他过程,而且可以提供极快的、低影响的恢复。先进的存储管理软件,让IT人员按几个按纽,就可以完成企业范围的备份,并实现对数据有效地管理、恢复和查询,不仅满足用户现在和将来发展的需要,而且降低数据备份的管理成本。
三、为什么需要备份?
备份过程是预防由介质,操作系统、软件和其他导致重要数据损坏的唯一安全措施。给数据备份,其实就是给数据买了一份保险。
每一次灾难都在不断提醒着人们,确立安全防范意识并付诸于行动是多么的重要,但事实并非如此。在国内许多企业的安全防范更多还只是停留在嘴上,并没有采取相应的行动。很多企业没有增加保护重要数据的预算,也几乎没有采取必要措施以保证公司万一发生灾害后能继续开展业务。尽管他们认为安全性问题应放在首位,但他们并没有为此增加必要的资源投入。目前国内企业中只有不到15%的服务器连有备份设备,这就意味着85%以上的服务器中的数据面临着随时都有可能遭到全部破坏的危险。而从国际上看,以美国为首的发达国家都非常重视数据存储备份技术,并且得到充分利用,企业中服务器与磁带机的连接超过60%,数据备份放在许多企业IT投入的第一位。
应该说,国内IT应用水平不高,多数企业和用户对数据备份的认识并不深,对如何保护数据了解也不多。许多企业对整个系统数据存储管理和备份缺乏专业和系统的考虑,有时仅仅依赖磁带备份、磁盘阵列或者磁盘镜像,这是远远不够的,因为它们都属于硬件备份,只是拿一个系统、一个设备等作牺牲来换取另一台系统或设备在短暂时间内的安全,解决的只是系统可用性的问题,一旦发生灾难并不能保证在紧急情况下快速恢复原有数据。
因此,国内企业除了意识上要重视数据的存储备份,还要付诸于实际行动,把数据存储备份视为头等重要的大事,在力所能及的范围内尽可能采用先进的数据存储备份设备来确保网络数据的安全。事实证明,只有完整的数据存储备份才能为人们提供万无一失的数据安全保护。
三、什么叫备份策略?
简单一句话来说,备份策略就是定义备份任务执行的一种方法。定义完备份策略后,无需人工进行干涉,备份系统会按时备份各类数据。而备份的软硬件平台就是实现备份策略的工具。
制订备份策略需考虑几个要素:
1、 需要备份的数据
- 数据的类型:依据各种应用软件的不同会有不同的数据类型。如文件型、数据库型等。
- 数据的大小:主要根备份介质有关。所需备份的数据的大小,备份的介质的容量的大小。
- 数据的重要性:数据保存相对的天数。如美国宇航局数据中心、简单的小型数据库。
- 数据的变化程度:数量的是否经常在变化。如电信的营业中心的oracle 数据库、图书馆的借阅系统等。
2、 备份的硬件平台
- 备份设备的类型:磁盘、带机、带库等。各种硬件的特点,比较设备的不同,制订不同的备份策略,所产生的效果不同,而且使用的方法也不同。
- 设备类型决定介质类型:软盘、磁盘、磁带、光盘。
- 备份介质的单位容量:数据的大小和介质容量的大小决定着备份策略的制订。
- 备份的速度:由于各种不同的设备类型,进行备份速度也是不相同的,这也是在制订备份策略时需考虑的一个重要因素。
3、 备份的软件平台
- 备份软件在执行备份任务中可以使用的备份类型。增量备份、差异备份等。这与软件在支持数据备份能进行那种备份方式相关。
- 备份软件在进行备份时所支持设备类型。磁盘、带机、带库等。
- 备份软件支持的架构。备份软件的备份架构可分为单机备份、服务器/客户端备份、分布式备份、LAN-Free等各种不同的架构。(附表1)
- 在企业制订备份策略,应该考虑以上几个方面的因素,来实现备份的策略化。备份策略能更有效的使用当前的备份资源,既有多少东西办多少的事;能统筹安排备份资源,备份任务,来提高备份效率;能成批处理备份任务,简化备份作业。一个备份策略体现了一个企业的数据的安全性及快速性。
四、怎样来定制备份策略?
综上所述,既然知道定制备份策略的要素,那如何来定制一个完整的备份策略呢?
在定制一个备份策略的时候,首先第一步应该考虑的是需求分析。这是最重要的一点。根据企业资源及上述,进行需求分析,好的备份策略应能最大限度达到需求分析的要求。很多企业会忽略这一点,随意制订备份策略,最终会导致备份的失败,而无法检查出问题点出现在哪,应该如何来解决问题。因此,企业备份的需求对备份策略起一个主导的作用,不能忽视。需求分析中如何进行备份媒体的选择,请查看附表2。这里就不多谈了。
有了企业备份完整的需求分析,其次才可以定义备份策略。
(一)、 定义备份的数据。按需求分析,根据应用的不同来选择不同的备份模块。如文件资料、数据库(Oracle、SQL、Notes…)、办公室自动化等。
(二)、 定义备份的类型。为了实现最大限度的使用现有的备份介质容量,增加备份速度,应该定义好备份的类型。备份类型基本上分为以下三种:
1、 全备份。(full backup)
全备份是指某一个时间点上所有数据的一个完全拷贝。
2、 增量备份。(Incremental Backups)增量备份指备份上一次正常或增量备份后,创建或改变的文件。备份后标记文件(换言之,清除存档属性)。如果使用正常和增量备份的组合,您需要具有上一次普通备份集和所有增量备份集,以便还原数据。
注:增量备份,是指在一次全备份后,在以后每次的备份只需备份前一次增加的文件或者被修改后的文件,意思就是说,第二次进行全备后的增量备份,第三次进行备份第二次备份到第三次备份之间这段时间增加或修改过的数据。在恢复数据时,必须把每次的增量备份按顺序恢复。
3、 差异备份。(Differential Backups)
所谓的差异备份,就是从上次正常或增量备份后,创建或修改的差异备份副本文件。备份后不标记为已备份文件(换言之,不清除存档属性)。如果执行了正常和差异备份的组合,还原文件和文件夹要求您执行了上一次正常和差异备份。
注:差异备份,是指在一次全备份后,每次差异备份是备份从一次全备份或增量备份到每次进行差异备份这段时间的文件增加或者文件被修改后的备份。恢复时只需恢复第一次全备份和最后一次差异备份。
上述为备份的基本三种模式,这要根据备份软件的不同和不同数据库应用来选择。应该从软件供应商处或者集成商得到相应的支持。
(三)、 定义备份策略的三个时间
在定义完备份的类型后,剩下的就是定义一个备份时间,可以让备份系统在指定的时间开始备份。在定义备份策略时,主要需定义三个时间:策略执行时间、每隔多长时间执行一次备份任务、备份的数据多长时间内能被覆盖。定义这三个时间的标准以前面提到的备份介质及备份速度有很大的关系。一定要通过严格的现场测试,来得到每次备份的速度,只有这样,在每次备份系统自动发起备份任务的时候不会产生冲突,备份任务不会去排队等待备份。这样,才能做到对正常应用影响最小,提高备份的性能;满足数据安全性的要求和数据历史性的要求;尽量高效率使用介质,使介质被循环使用,减小管理员的负担。
一个完整的备份策略应该严格考虑到以上所有的各方面,才能使你的备份系统完整化。
附表一
单机架构
服务器/客户端架构
分布式备份架构
LAN-Free备份
附表二
关于在需求分析中所需求的备份资源及介质的选择:
备份介质应该按以下几点进行选择:
根据业务性质选择介质
顺序存储 —- 磁带设备
随机存取 —- 光盘、磁盘设备
根据数据量及备份日程表选择容量
根据极限备份量选择驱动器数量
存储媒体容量的选择:网络中的数据量Q1
数据备份时间表(增量备份的天数d)
每日数据改变量Q2
需要归档的数据量Q3
期望无人干涉的时间(三个月或六个月)m
数据增长量的估计i
考虑坏带,不可预见因素的余量,一般为30%(u)
C=((Q1+Q2*d)*4*m*(1+i)+Q3)*(1+u)注:C为存储媒体容量大小
驱动器数量的选择:日极限备份量P
允许进行备份的时间段T
驱动器读写数据的速度V(单位:M/S)
N=[P/(T*V)+0.5]
注:N为驱动器数量。
本文首发于DOSTOR《信息存储》杂志创刊号封面故事。
点此免费订阅《信息存储》杂志,让“信息创造存储价值”。