当归档工作意味着把磁带上的数据转移至远程设施中供长期保存时,这项技术已与其早期形式之间产生了巨大的变化。如今的归档技术,既可以如同自动归档电子邮件信息一样轻松,又可以如同在一个外场存储站点中放置传统物理存储磁带一样负担沉重。
其中,云归档是一个特别具有吸引力的选择,因为这项技术提供了可访问功能和数据保护功能,而其成本仅为构建一个现场归档基础设施的一小部分。我们将讨论评估基于云计算技术归档时需考虑的关键因素,其中包括:价格与性能、云计算归档的优缺点、服务等级、可访问性、灾难恢复选项、合规性等等。
虽然“归档”一词意味着数据将被存储很长一段时间,但是其具体的时限却是随行业不同而各有差异。例如,大多数的财务数据要求的归档时间为七年,药品研究数据则要求二十年,而那些医疗记录和核记录数据则必须保存长达五十年之久。一般来说,在磁盘上保存数据长达十年甚至更长时间的的成本是非常昂贵的。同样,我们也很难预测哪一种归档技术将存在十年之久,因此,本文中用于云归档的“长时间”一词是指一年至七年的时间。
价格与性能
云归档恰恰实现了成本与可访问性之间一个“恰到好处”的平衡。存储磁带一直以来都是,甚至仍将是长时间存储数据方法中成本最低的一种。一个典型的LTO存储磁带存储数据的成本约为35美元/TB•每月。即使是最便宜的云计算存储也无法在这个价格方面体现其竞争优势。而其不利的一面在于,存储磁带归档的正常检索时间为次日交付加上安装和恢复所需的时间。这就意味着用户在能够访问所要求信息之前必须等待不少于一个工作日。
归档与备份
虽然众多IT公司仍然考虑采用他们传统的备份磁带进行“归档”工作,但也有一些具有不同于归档、用于数据备份的特殊用例和访问需求。执行备份可保护目前正在被使用的数据;如果必须把数据从备份中恢复出来,那么该操作必然发生在完成备份工作之后不久。一般来说,备份数据的保存时间相对较短。
归档数据是一组出于合规性、公司管理或知识产权等目的而将被保存相对较长一段时间的数据集合。归档数据可被不定期访问,但具有较高的易搜索性,因此可相对较快和较容易地恢复特定数据。
存储网络行业协会为云备份和云归档服务的区别给出了一个定义:“对于云计算备份来说,云计算是一种备份数据的简单存储,而对于云计算归档和存储来说,云计算是执行具体操作的所在,以便于确保数据的长期存储、保存以及存在。”
另一方面,云存储的价格为10美分/GB•美元及以上(根据容量不同而不同)。当涉及数以百计TB时其成本就相当可观了,但是它往往仍然要比在一个中央数据中心中采购、部署和管理阵列低。而存储磁带的检索时间要以工作日为单位,而访问在基于云计算技术存储中托管的数据,其单位则是以秒来计算的。对于某些应用程序,这可能是价格与性能之间最为理想的平衡点。
云归档的优缺点
但是在真正实施云归档之前,IT人员需要权衡云归档和内部归档两者各自的优点。从技术上来说,云计算供应商无法提供任何可供内部实施的东东哦。例如,一家公司可能会选择一个具有三层高容量SATA磁盘的层存储基础设施来实现一个更低的平均成本(每GB)。通常情况下,如果组织无法承受与远程场所连接中断的风险,那么他们往往会倾向于实施一个内部实现的解决方案,这个解决方案有监管要求,要求具备严格的数据安全监督或数据检索需求,而其中是无法接受远程延迟的。这是一个相当严格的列表,但是仍然还有众多的应用程序适用基于云计算技术的归档。
即便IT组织可以把迁移至云计算的物流工作量进行量化,但是他们却不应忽视这样一个可预测而不可预见的调整:从以技术为中心的角度到一个服务等级管理角度的心态转变。之前已习惯于进行技术决策和部署的IT人员们需要更深入地了解云计算供应商的架构和“建议”产品或特定技术的实施。当供应商完全承担管理云计算基础设施的全部责任时,很少有这样保证的请求。如果合同中规定的服务等级已得到满足,那么IT部门确实不应该关心底层技术。随着经验的进一步积累,工作人员的注意力应逐渐从底层细节转移至高层次的管理。
服务是云归档的关键因素
那么,服务等级管理是进行云归档最初决策以及日常运行中至关重要的环节。当选择一个云归档服务供应商时,应当考虑如下的服务等级问题:
正常运行时间。对于大多数的应用程序来说,三个九或四个九等级的可用性就足以满足它们的业务需求了。如果你对可用性的要求达到了五个九等级,那么可能你的数据服务需求并不适合于一个归档层。根据定义,在归档层中托管的数据一般都是非关键数据。正常运行时间需求很大程度上决定了供应商必须提供多少的基础设施,因此该指标对于托管成本的影响较大。不要去猜测;在实践中确定访问数据的实际时间、访问模式以及停机成本。这些计算方法可比较各种保证正常运行时间的成本,根据比较结果可以较容易地提出有说服力的理由采纳或拒绝。由于违反云计算存储服务等级协议(云计算SLA),供应商会经常推出托管费用折扣或其他的性能补偿。但是,相关附加说明常以小字形式显示,所以请仔细找到并认真阅读。
可访问性。可访问性和正常工作时间并不一定相同。存储可能是忙碌的,但是子组件会导致一个应用程序无法使用。例如,如果你需要实现数据链接的冗余或 多个冗余,那么你必须为它们支付额外费用,但是不这么做可能带来的后果就是无法接受的应用程序中断。请确定服务等级能够确保数据的可用性。
性能。对你应用程序需要的IOPS数量进行量化,请确保这个数字是SLA的一部分。IOPS数量可取其均值或峰值。如果你要求的IOPS保证数量是 峰值,那么你就必须支付费用让供应商来确保这一指标。有些供应商可能会提供计量计费,但是很多企业组织并不希望采用这种方式,因为其中存在着潜在的不确定 性。大多数企业都会减少一定量的约束操作(尤其是对归档层)以实现一定成本的回报。在这种情况下,SLA可保证IOPS,而不是最终用户所体验的绝对性 能。如果应用程序要求超过合同规定的IOPS容量,那么那就是IT组织的问题了;总是可以购买额外的IOPS。
数据可恢复性。正如他们为内部应用程序所做的那样,IT组织需要为云计算归档指定恢复点对象(RPO)和恢复时间对象要求。这关系到正常运行时间, 而且还覆盖诸如数据损坏这样的意外事故或不影响整体正常运行时间但有些个别应用程序的组件故障。供应商应有RPO和RTO的默认值,其值已可满足归档层。 再次强调,不要试图猜测。了解何种数据丢失和应用程序不可用是业务单位在财务上可以容忍的。在很多情况下,它要直观得多。
灾难恢复(DR)。如果云计算归档被用于异地复制存储以满足数据冗余的需求,那么可能不必考虑这一层的灾难恢复策略。但是买家应注意:大多数托管存 储并不包括任何的灾难恢复意外事故。如果托管数据是混合云计算存储提供的“随时可用”数据,那么灾难恢复计划是必要的。托管供应商可能会定时备份数据,但 是他们一般不会把数据转往异地,即使他们这么做了,他们也不会经常这么做(例如每月)。虽然在一个SAS-70兼容数据中心发生灾难是不可能的,但也不是 完全不可能的。托管公司的灾难恢复容量通常是一个额外显眼的费用支出,并可以快速改变托管的经济性。确保数据不会处于脆弱的状态。
备份和恢复。即使托管供应商定期地备份数据和频繁地转至异地,IT组织可能仍然无法走出困境。通常,托管公司拥有数量有限的备份软件选择和磁带技 术。这意味着他们的备份格式(硬件、软件或两者)可能并不与你的IT系统兼容。如果一个组织被迫从供应商的存储磁带中进行恢复,那么在获得必要基础设施时 就可能会出现一个重大延误。请确保在最坏的情况下仍然有一个脱困方法。
合规性。要求特殊合规性对待的归档数据可能仍然是云计算托管应用的一个理想对象。如果有必要的话,你将需要确定数据是否保存在永久存储介质上。你可能还需要确保,遵循和审计严格的访问指引;SAS-70 供应商就已具备了这样的程序。
成本的确定性和粒度。对归档采用云计算存储托管技术而不是使用内部基础设施的主要好处之一在于,你只需为存储的消费支付费用。虽然计费是有一个最低消费的,但是它也应根据实际使用而变化。
放弃存储磁带 使用云归档
很显然,对于拥有大量存储在相对昂贵内部基础设施中历史数据的公司来说, 基于云计算技术的归档是具有相当吸引力的。更多的质疑在于,将基于存储磁带的归档转变为云计算归档是否真的有意义。更大型规模的组织可能在异地归档中有着 数以万计的存储磁带。检索所有这些存储磁带并将它们读取写入至云计算归档基础设施中的整个过程是令人望而生畏的。它还假定,供应商拥有必要的硬件以读取所 有的存储磁带,其中部分的数据格式可能已过时。此外,云计算供应商也无法以接近于磁带归档的成本来管理这样一个数据量。磁盘压缩和重复数据删除技术将极大 地帮助实施这项工作,但是成本方面的差异仍然是一个问题。
即使从存储磁带归档到云计算归档的转变难度极大,它可能仍然是一个可供考虑的选项。使用期限超过七年的磁带是非常昂贵的,同时可能在数据恢复方面也 存在问题。最好的实践表明,组织每隔五年时间进行一次检索和磁带重写入可确保数据可读、格式不过时。这是一个不容小觑的任务。例如,如果一个公司拥有 10,000个磁带归档,而其更新周期为五年,那么它就必须每年更新2000个磁带。也就是说,每个工作日更新近八个磁带,这是可行的,但是这就要求近一 年的时间都花费在基本上无生产产出的工作上。这里再次强调,问题的症结在于检索的概率。一些组织选择允许磁带在存储中过时,其恢复过程是相当痛苦的,但是 需要修复的概率已低至可承受由其产生的风险本身。另一方面,如果你知道恢复是不可避免的,那么你可以选择在眼前承担把数据从磁带转移至云计算所带来的时间 和花费,从而在未来可以预见的紧急情况中节省大量的时间和精力。
我们并没有认为,存储磁带已在归档应用中失去了其地位和意义。它仍然是大多数应用的成本最低选择。此外,LTO的线性磁带文件系统(LTFS) 可使磁带在四层存储中承担新的角色,它可作为云计算(或数据中心)中的另一层,从而为0、1、2和3层配置。在一个云计算归档环境中,这将有效地实现混合 云计算,从而提供相对高速的访问(分钟级),但其访问数据的价格与磁带几乎无差。磁带还将拥有内置压缩、加密以及WORM等功能。使用自动分层软件,数据 可自动转移至归档层。
不可回避的“如果”
到目前为止,我们已描绘了云计算归档服务的一个相当正面积极的轮廓。通常,只需努力就能够实现预期的效果,但事实并不总是如此。组织应当考虑到,他 们把数十TB的数据迁移至供应商所带来的可能后果,因为有可能会发生不希望发生的事件或合同违约事件。 当然,赔偿可能有所心理安慰,但是小额的经济赔偿完全不能弥补对企业组织的交付声誉所带来的实际成本、恶化或损害。一旦发生意外事故,如果无法满足特定的 性能等级,合同可能就会终止且无任何赔偿。它还应当包括一个替换托管服务的计划,要么是内部的要么是另外一家供应商。虽然云计算归档的风险相对较低。