前言
大型企业的数据中心动辄就拥有上千台服务器和数百TB、甚至超过PB(1000TB)的数据量,备份操作的复杂程度与困难程度超乎想像,近年来急速升温的VTL虚拟磁带库技术,已经被公认为是解决大型企业备份难题的最理想方案。但是,并不是市场中的所有VTL产品的功能都能符合大型企业的需求。
全球最大VTL解?方案供应商美国飞康软件公司,凭借为全球超过4000个企业级用户提供优质的备份服务所累积的经验,深刻的了解企业级数据中心所面临的备份难题与挑战。飞康公司认为,适用于大型企业数据中心的VTL解决方案,应该满足以下五项标准:
1. 高性能
2. 易管理性
3. 高可靠性
4. 高扩展性
5. 成本效益
高性能
备份速度追不上备份数据的增长速度,一直都是让数据中心的系统管理人员深感头痛的问题,如何保护有限的备份窗口,让日常运行不受备份操作的影响?唯一的解决之道就是提升备份速度。然而磁带库的性能不理想,单台VTL的扩展能力也有限,使得几乎没有提升性能的空间。许多用户投入大笔预算升级高级磁带库或部署单台VTL,却发现效果不如预期,备份窗口的问题仍旧无法解决。
数据中心级VTL的首要条件,在于能够“打通备份系统架构内的性能瓶颈”:
从连接VTL前端的备份服务器,到后端的磁盘阵列与磁带库,都必须支持速度在4Gb以上的光纤通道协议,以保证备份数据在整个传输过程中都能享有最充裕的带宽。
具备多进程数据流并行备份的能力,可以同时连接多台备份服务器,并同时执行多组备份程序,大幅缩短备份时间。
具备智能的I/O负载均衡技术,可以自动分配备份数据流写入到磁盘阵列的位置,避免多个备份数据流同时写入VTL时,集中在少数的RAID控制器和LUN上,造成负载不均衡的情况。
部署了VTL后,不能对物理磁带的产出速度和备份服务器的运行性能造成影响,应该支持Server-less磁带备份。
可管理性
VTL对数据中心的意义在于“提升备份操作的品质”,而不是“取代物理磁带设备”。磁带不仅是单位成本最低的存储介质,可以离线的长期保存数据,对于必须遵守法规遵从的大型企业企业用户而言,更是不可或缺。由此可知,数据中心级的VTL不仅要提升备份性能,更应该可以与现有的磁带设备无缝整合,具备与磁带设备协同工作的能力。
在深入分析了许多大型数据中心的备份环境之后,飞康公司归纳出以下几点VTL应该具备的磁带管理能力:
应该支持所有主流的备份软件。
应该具备仿真所有主流的物理磁带库、磁带格式的能力。
应该支持完整的磁带入库/出库,确保所有主流的物理磁带库都能直接与VTL连接,且不能限制导入/导出的磁带格式。
应该具备多磁带输出功能。可以按照备份策略的要求,在同一时间输出多组相同内容的磁带,节省了磁带复制的时间及过程。
应该支持磁带整合功能。可以将多卷数据量少的磁带导入VTL后,再统一导出到单卷大容量的磁带,节省了介质和管理成本。
应该支持磁带缓冲功能。允许备份数据在黯然失色成虚拟磁带格式后,直接从VTL出库到物理磁带,大幅降低了备份磁带器的性能负载,同时简化了管理程序。
应该能够保障信息安全。磁带出库时的加密功能、进行远程复制时的加密功能及虚拟磁带的彻底销毁功能都必不可少。
具备完善的报表生成功。通过报表,管理员可以轻松管理存储资源的使用率、备份速率、重复数据率、远程复制情况等信息,满足数据中心的严格管理要求。
可以通过单一介面同时设定管理多台VTL。
高可靠性
根据调查,磁带备份有高达20%的失败机率,从磁带恢复数据的失败率也相当高,导致备份恢复失败的原因在于,磁带库的组成,如机械手臂、读写头、磁带匣等,相当容易故障和损耗,轻者会造成备份恢复操作中断,消耗管理成本;重者则会造成备份数据无法恢复,令损失难以预估。
在磁带库本身的可靠性无法提升的情况下,通过配合高可靠性的VTL的协同工作是最好的提升可靠性的方法:
VTL提升备份服务器和磁带库之间的备份缓冲,将大多数备份恢复的操作负载集中到可靠性较高的磁盘阵列,磁带库仅负责数据归档,如此可大幅降低磁带库的使用频率,故障率自然也随之降低。
VTL本身应该支持高可用性、多节点架构及双工的故障切换机制,以避免单点故障造成停机,确保备份操作持续运行。
高扩展性
数据中心内充斥着各种操作平台的服务器和不同品牌的存储设备,只有具备高度兼容性和扩展性的VTL,才能在不更改架构的前提下,无缝的部署于数据中心,才不会造成资源浪费和管理上的困扰。
数据中心级VTL应该符合的条件:
开放平台存储系统:VTL应该完全支持开放系统的存储架构,可以支持FC、SCSI、iSCSI,甚至是InfiniBand等多种传输协议,并与各种品牌的磁盘阵列及存储系统相兼容,企业用户可以灵活的选择并配置存储资源。
可扩展至多节点的存储架构
支持企业级专有规格的磁带库传输协议:如ACSLS、IBM 3494 Library
支持NAS文件服务器的备份传输协议:NDMP v4
支持存储资源按需分配功能:备份数据用多少空间就分配多少空间,提升了存储资源的利用率。
支持异地灾备:VTL应该具备远程复制的功能,虚拟磁带可以从数据中心复制到远程的灾备中心,将本地端数据保护直接延伸到异地灾备。
成本效益
企业内容的所有数据中,备份是占据最多存储空间、最浪费数资源的,原因在备份数据的重复比率太高,以全备份为例,两个备份时间点相近的全备份间的数据重复率往往高达90%以上,也难怪最近几年才兴起的重复数据删除技术会如此热门。通过重复数据删除技术,不仅可以节省大量存储空间,还可以进一步降低异地灾备的网络带宽需求,提升备份系统的投资回报率。
目前市场上有5种类型的重复数据删除技术、10种以上不同品牌的产品都宣称具备重复数据删除功能,我们必须思考的是,究竟哪种技术和产品能真正符合大型企业数据中心的需求?
重复数据删除比率的迷惑:几乎所有重复数据删除方案都会强调自己可以达到的重复数据删除比率有多高,事实上,重复数据删除比率完全取决于数据的形态和备份方式,和技术本身的关联性极小,比较不同方案之间的重复数据删除比率是完全没有意义的。
成本效益的迷惑:重复数据删除技术的主要目的是节省存储空间,但是对大型企业而言,备份性能与磁带管理的重要性,远高于省下了多少存储空间。试想,如果重复数据删除操作导致备份性能变差,造成备份操作无法在备份窗口内完成,企业可能遭受的损失绝对远远高于节省的存储成本。
飞康公司认为,在不能妥协性能的前提下,数据中心级VTL的重复数据删除功能应该符合以下条件:
重复数据删除操作不应对备份性能造成任何影响
重复数据删除操作不应该影响到应用服务器的性能
重复数据删除操作不应该影响物理磁带的出库/入库操作
支持压缩功能,加倍节省存储空间
支持多对一远程复制的全域重复数据删除功能,对于拥有多个分公司、远程办公地点的大型企业而言,这可以节省集中备份所需的带宽和存储空间。