归档研究 你到底需要多少个归档(下)
wangfei 发表于:12年07月09日 11:17 [编译] 存储在线
最后的想法
那么你需要多少个数据副本呢?将数据保存在什么样的媒介上?将数据副本保存在何处? 这取决于你的数据归档的大小。如果你有1PB的数据,你也许用两个企业RAID SATA硬盘就够了。 另一方面,如果你有50PB的数据,而且希望数据完好率达到99.9999999%,那么在企业磁带上保存2套数据副本是不够的,因为某些数据可能会丢失。数据副本的数量取决于你能够承受的风险有多大以及你的预算有多少。
你也许情愿承担较高的数据丢失风险而将更多的数据归档,那也许是你的企业的政策。另一方面,如果你是一家医药公司,而食物及药品管理局要求你将所有 的药品试验信息都保存下来,如果不幸有些数据丢失的话,那么你就有的忙了。如果你的数据数量很多而且对数据完好率有很高的要求,比如 99.999999999%,那么两个副本显然是不够的,可能三个数据副本都不一定够。 媒介类型也很重要。在non-RAID磁盘上保留三套数据副本可以解决自然灾害的问题,在企业磁带上保留三套数据副本可能是为了解决媒介故障的问题。然 而,如果三套数据副本都位于飓风区,或者遇到员工故意破坏的情况,那么你所有的努力就都白费了。
由于可变因素太多,因此这个问题没有固定的答案。有些可变因素如人为错误或故意破坏是很难量化的,但有些东西比如WORM媒介显然还是有帮助的。 另一些可变因素比如自然灾害也许可以量化,但是那个过程既复杂又成本昂贵。所有相关员工都必须了解这些风险和问题,然后根据预算做出最佳的选择。
现在回到我经常提的那个问题:在廉价的、可靠性较低的媒介上保存两套数据副本是否比在企业级媒介上保存一套数据副本更好一些? 我认为,对数据数量较大的归档来说,从媒介可靠性的角度来说,在企业级媒介上保存一套数据副本比在廉价的、可靠性较低的媒介上保存两套数据副本更好一些,因为媒介故障发生的概率可能比自然灾害和恶意员工故意破坏发生的概率更高。
所有人都必须了解这些潜在风险,对于大型归档来说,要想保证100%的数据可靠性,代价是非常高昂的。正如培根爵士所说的,知识就是力量。