数据存储产业服务平台

归档研究 你到底需要多少个归档(上)

DOSTOR存储在线 7月9日国际报道:归档群体一直都在问同一个问题:多少个副本是必要的?让我们将问题反过来问一下,多少个副本是你可以承受的?这是争论的起点。大多数有关文件副本数量的问题其实是在问关于数据的可靠性问题。例如,我经常被问到说低成本低可靠性存储媒介上的两个副本是否比企业级媒介上的一个副本更好。

在分析数据可靠性的时候,有许多变量需要考虑。这些变量包括媒介的可靠性、自然灾难概率,以及一些不怎么明显的因素,比如软件漏洞以及意图删除数据或修改数据的恶意攻击。

我经常被问道说应该保留多少个副本。这些人还是不愿意或不能问他们真正需要的可靠性水平以及他们需要防备的因素。无论在什么情况下,保持非常大量数据的100%的可靠性都是不可能的,我们还要考虑自然灾害、设备与存储故障、人工失误以及其他情况。因此问题还是回到说你需要多少副本以及这些个副本会给你带来什么。

首先,考虑一些基本因素:

背景信息

你们许多人已经看过这些表,但是它们值得重复:

 另一个观察数据的方法就是看在100%运行率下设备多快会碰到硬故障率。

显然,看看这些硬错误率,如果你想保证不丢失任何数据,那一个数据副本是不行的。企业级磁带可能是个例外。当然,如果只有一个副本,你的风险会比较大,比如磁盘、磁带或其他媒介的潜在故障(我们都听说过这类事情)。还有许多因素要考虑,比如那些已经在RAID(独立磁盘冗余阵列)组中使用的设备。这些因素都会带来成本,在讨论归档数据的时候始终需要考虑它们。

不过,有意思的是,这还是没有回答你到底需要多少个副本的问题。

相关阅读:归档研究 你到底需要多少个归档(下)

未经允许不得转载:存储在线-存储专业媒体 » 归档研究 你到底需要多少个归档(上)