对于云存储的讨论通常是关注节约开支、在线保存所有的东西并在某个地方保证它们可以被访问,而且还不像磁带一样占用宝贵的空间。所以,是不是基于云的架构和应用的进步就意味着磁带终于要消失了呢?调查现在磁带的应用,结果是否定的——不管我们听到磁带的丧钟响过多少次。
最近几年,磁带集中精力于数据中心和中小企业市场的中高端,在这以下的市场中的占有率在下降。磁盘入侵了磁带的传统备份和恢复领域,利用的是看起来像是磁带库的更快的磁盘阵列——虚拟带库(VTL)和基于磁盘的去重来降低所需的存储量。
最近,磁带被很多企业用于访问较少的应用。这一技术正在把自己定位于正在迅速增长的3层存储市场,包括那些需要固定的内容和需要遵从法规而保留数据的要求。
磁带仍是数据存储架构的一部分,部分原因是它较低的每GB成本,降低运营成本和能源开销。而且磁带有额外的安全功能例如加密和WORM(一次写多次读),还有更长的介质寿命(某些情况中超过30年)。那些“磁带已死”的说法忽略了这些。在2011年早些时候听说Google承认从磁带上恢复4万个基于云的邮件账户时,我们发现磁带的这些优势即使在云时代仍然存在。
保护云中的数据
在考虑数据保护方法的时候,IT部门还需要考虑物理和逻辑数据保护。物理保护确保数据在磁盘、阵列或站点失效的时候数据受到保护。逻辑数据保护则保护数据不受最常见的数据丢失原因——机器或人为错误(数据损坏或意外删除)的威胁。一个好的备份计划可以同时提供两种保护,这也是为什么好的备份如此昂贵的原因。
对云,你的云服务提供商很可能通过某种镜像或者远程复制来提供物理数据保护(针对磁盘失效、阵列失效、站点事故),而这已经计算在你支付的每GB价格中了。不过供应商没有进行逻辑数据保护(人为或机器失误),这是云的一个关键缺点。
在很多情况下,基于磁盘和磁带的技术可以也应该一起使用来应对数据保护要求的广泛性(参见表1:数据保护方法和级别)。同步远程镜像可能对你公司的最核心业务的数据和全站、近零数据丢失灾难恢复来说很合适。磁盘备份则适合那些不那么关键、可以容忍一点数据丢失的数据,而磁带备份通常适用于更不关键的数据或者是低成本地长期保留数据拷贝。
为什么要在云中保留磁带?
多数公司都使用传统的备份软件,备份服务器软件和备份客户端软件(处于数据存在的系统上)通信。数据被通过本地网络(LAN)从客户端传送到存储设备上,或者直接通过存储网络(SAN)直接从客户端传到存储设备。
备份软件获取的数据可能是公司生产数据的完整拷贝(完全备份),或者只是自上次完全或者增量备份之后改变了的数据(增量和差异备份)。最佳实践建议保留备份数据的多个副本——一套放在站外一套放在站内——而且保留它们一定的时间。
备份可以首先直接做到磁带或者磁盘上,然后在备份窗口之外再向磁带上做一份拷贝。磁带是有很好的保存时间的流行介质;而且,随着时间的推移每GB的投入和维护成本都迅速下降。磁带有很好的扩展性,而且能提供真正的“随需容量”,因为你可以在需要的时候才买磁带,而不是像投入那些“旋转介质”那样一次性买来再一点一点地使用。磁带还是低成本和可移动的,使得它成为开始使用云存储或者转移云存储供应商时的一种理想的介质。磁带校验技术的进步使其成为一个恢复时的更可靠的媒介,而且磁带是可以被搜索的。可能最重要的是,磁带是一个非常好的多租户平台。它支持分区,加密并有很强壮的密钥管理,所以它可以打消用户对云存储的最大的疑虑——安全和私密性。
但是备份到磁带还有很多众所周知的问题。如果磁带保存在站外,获取它可能会需要数小时甚至数天。因为备份通常是一个每天进行一次的操作,恢复时间点是上次备份进行的时间,所以可能会存在一个24小时的时间差。磁带介质还可能由于种种的原因变得不可使用,例如暴露在磁场中,或者外壳受损。
不良或不足的介质管理和验证测试可能加剧这种情形。而且磁带可能会丢失。但是数据仍然需要针对逻辑错误的保护,例如意外删除和软件错误。如表1所示磁带可以提供所有的基本功能。除了它的缺点,由于对云安全的担忧和今天的电力、空调和空间价格,要无视一个站外加密媒介上的拥有备份数据的拷贝带来的长期价值,还是很难的。这就是为什么磁带可能会在云中获得第二次生命。