保护,在词典里是守住、保全的意思。相应的,数据保护包含两个方面:一是保护数据不泄漏,防止未经授权的访问;二是保护数据不丢失。
一、保护数据不泄漏
据报告,美国2005年发生过180起敏感信息被泄露的事件,涉及 8 千万条客户记录。企业已经构建了诸如防火墙、杀毒网关和VPN等物理安全边界,但仍然面临着保护数据的困境。我们知道,客户和企业的数据是动态的,不停地在公司内、外之间进行移动,运动过程中数据很容易受到各种威胁。传统的办法是通过保护网络、服务器、桌面和边界,在外围来保护信息的安全,很难有效地确保数据的保密性和完整性。那么,能否从直接保护关键的业务数据出发呢?
这就是以信息为中心的安全战略。它将信息安全从网络边缘向信息本身转变,由内而外的考虑信息的安全。从信息的存储载体,延伸到信息基础架构的各个层面和使用者。下图显示的是两种不同的保护:边界保护与以信息为中心的安全保护。
以信息为中心的安全(Information-Centric Security)战略包括评估风险、确保人员安全可靠、加强基础架构安全、加强数据安全、确保法规遵从五个关键要素。以加强数据安全为例,我们根据信息资产安全等级划分,按照等级保护的原则,直接保护关键的业务数据。它的关注点如下:
1、底层数据加密:对数据进行加密,对数据在静止、传输等生命周期的各个形态下进行保护。
2、信息权限管理:数据和内容的动态访问和使用。
3、密钥管理:数据加密的密钥管理。
4、数据擦除服务:从老化或损坏磁盘上永久删除数据的服务,以防止私密数据的泄漏。
二、保护数据不丢失
保护数据不丢失,可分为多个保护级别。这些级别是根据数据的可用性包括RTO(恢复时间目标:使系统恢复所需要的时间)和RPO(恢复点目标:可接受的数据丢失量)来划分的。
保护级别越高,RTO和RPO也就越少;不过实施的相对成本也就越高。这些级别分别是备份、本地复制、远程复制和实时连续复制。
1、备份
备份是为了在系统出现故障时进行数据恢复,包括磁带备份和磁盘备份等。
磁带备份(B2T,Backup To Tape)是经典的备份方式,将数据备份到磁带上。磁带备份具有容量大、成本低的好处,但是备份和恢复的时间较长,而且恢复成功的概率较小。
磁盘备份(B2D, Backup To Disk)指的是把磁盘阵列作为备份设备,它改善了备份和恢复的性能,提供高可靠性和可用性。
虚拟磁带库(VTL, Virtual Tape Library),又称为磁盘库(Disk Library),用磁盘来存储数据,并且能够仿真成物理磁带库。这种备份方式是磁盘备份的主流方式,它的优点是:相对磁带备份的性能大幅提高;同时,还能沿用原有的磁带备份软件和备份策略。
还有一些衍生的备份方式,例如多级备份(B2D2T,Backup To Disk Library To Tape),先备份到虚拟磁带库,再备份到磁带,采用这种方式可以充分利用存储空间,在信息存放到适当的存储设备上。
备份关注的有以下几点:备份的数据量;备份和恢复的速度和可靠性;备份、恢复操作的方便性等。为了减少备份数据量、加快备份和恢复的速度,可以通过全面的备份、恢复和归档策略及采用新一代的重复数据删除备份技术。其中,全面的备份、恢复和归档把不活动的、最终形式的数据进行归档,以缩小生产数据的大小,这样就减少了备份的数据量,恢复时间也更短,性能更加稳定,并且可实现分层存储的优势。
任何备份技术的恢复机制都需要一个和备份过程相反的过程,这个过程一般时间会很长,如果用户对恢复时间RTO要求很高,采用磁带备份就捉襟见肘了,为了满足要求就必须采用磁盘备份。
本地复制和远程复制技术会为源数据制作一份副本,这个副本除了能够提供近于即时的恢复外,还可用于无中断备份、决策支持、应用程序测试和开发、第三方软件更新等;它们的目的在于保证系统数据和服务的“在线性”,即当系统发生故障时,仍然能够提供数据和服务,使系统恢复正常。
2、本地复制
本地复制包括快照和克隆。快照是数据在某个时间点(拷贝开始的时间点)的映像。它是基于指针、节省空间的逻辑拷贝,通常要求少于 30% 的源卷容量,速度较快。克隆是数据的完整复制,是真实的拷贝,它的过程较慢,而且每个副本需要与源卷容量相同的存储空间。
3、远程复制
远程复制为业务连续性和灾难备份提供了强有力的保证,通过远程站点故障切换确保数据和系统的可用性,在生产中心停机后数分钟内,数据能够恢复,业务继续运营。
远程复制包括同步远程镜像和异步远程镜像。同步远程镜像是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。异步远程镜像保证在更新远程存储系统前完成向本地存储系统的基本I/O操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息,远程的数据复制以后台同步的方式进行。
4、实时连续复制
持续数据保护(CDP, Continuous Data Protection),它的关键词是持续。就给定的数据集而言,CDP提供恢复点的连续体,能够存取任何时间点上的数据,而不仅仅针对那些由快照流程预先确定的特殊时刻。CDP允许应用恢复到特定的时间点之前,而不是恢复到预先确定的时间点上。恢复点在时间发生后选定并动态重建。它提供了粒度无限的恢复点(RPO)。
5、新一代数据保护技术
随着数据不断地激增以及集中化存储的趋势,数据访问开始面临着一个新的困境:当大量用户访问集中的数据时,有限的带宽可能会造成严重的影响。于是,具有分布式的网格存储日益受到关注,它将网络视为一台超级计算机,充分利用分布在不同地理位置上的存储资源,构建一个动态响应用户需求的虚拟数据中心资源池,实现存储资源的全面共享。网格存储具有更高的容错与冗余度、在负载波动的情况下有更好的性能、以及更低的成本等优点。实现网格存储的道路还很漫长,有许多问题都必须解决,例如存储虚拟化和全局资源管理。
三、结束语
数据保护是针对信息丢失和滥用提供的保护,从信息安全角度来看,就是确保数据的保密性、完整性和可用性。涵盖的范围很广:
1、保护数据不泄漏:身份和访问管理;数据加密;安全信息和时间管理;法规遵从等。
2、保护数据不丢失:备份、恢复和归档;灾难备份;重复数据删除;持续数据保护等。