随着我们越来越多的工作和个人生活变得数字化,可以看到我们产生、存储和访问的数据量增长惊人。多项研究表明,谷歌每天处理35亿次搜索, 430万个视频在YouTube上被观看,而每天有超过3.5亿张照片被上传到Facebook。估计到2025年,全球每天将产生463EB的数据。而世界上仍有约40%的人口待联网,因此我们需要存储和管理的数据量将进一步飙升。
如今数据是贯穿企业一切工作的共同点。无论是推动我们习以为常的日常活动,还是提供新的见解以重塑我们对人类重大问题的思考,数据都能增强并赋予人类智慧。
考虑到这些,我们可能需要从根本上重新考虑现有的数据存储技术。我们所产生的惊人的数据量已经带来了挑战,加上数据中心技术需要大量的电力和冷却,以及持续的维护和监控。随之而来的数据量的增加和访问速度的进一步提升,将会让我们现有的能力遭遇巨大的瓶颈。更重要的是,服务器、硬盘和闪存等硬件可能会退化。其实我们可以从自然界学到很多关于数据存储的知识,虽然乍看之下这似乎不太可能。这里的媒介是DNA,当涉及到保存和归档重要信息时,它的记录无与伦比。
大自然的存储媒介
对于目前存储设备的一种替代方案可以是基于DNA的数据存储。鉴于DNA在创造生命方面的主要作用,它有“超小体积”和“易于复制”这两大优势。据《新科学家》报道,一克DNA可存储多达455 EB的数据。这比目前世界上所有数字化的数据都要多出一大截。虽然DNA本身非常脆弱,但当储存在适当的条件下时,它可以非常稳定。数千年前的化石遗迹被发现时,DNA仍然完好无损。磁带和CD的寿命是无法与之相比的,因此从归档和备份的角度来看,DNA可能是最完美的介质。
这项技术的进展极为喜人,微软和华盛顿大学的研究人员去年开发了世界上第一个全自动DNA存储设备。利用该设备,研究人员将“hello”一词编码到DNA上,并能够将其转换为计算机可读的数据。
从DNA到玻璃
在寻找未来数据存储介质的赛程中,玻璃是赛道上的另一员。例如,微软的Project Silica就是一个使用石英玻璃作为存储介质的概念验证。激光永久地改变了玻璃的结构,使存储数据成为可能,然后可以被机器学习算法读取。由于只占一小部分空间,而且不需要气候控制存储或其他典型存储介质的定期维护,因此在归档和备份方面具有巨大的前景。
但是,尽管技术可能会稳步改善,解码信息的时间和成本需要降低,DNA数据存储才能用于商业用途。举例来说,虽然自2012年以来,科学家们一直在尝试将数字化数据存储在DNA中,但要将5个字节的“hello”信息写入并读出需要21个小时。然而,进展稳定:2001年,对一个人类基因组进行测序的成本是1亿美元,如今只需两天时间和1000美元。
备份业务可以通过DNA实现转型。档案库和数据中心,以及他们庞大的物理足迹可以被消除。总有一天,世界上所有的知识都可能储存在你需要显微镜才能观察到的东西上。随着我们产生更多的数据并达到现有存储技术的极限,强有力的替代方案的价值只会变得更强大。当前复杂的备份工作可以简化到单次记录,即只需创建一次,其存在的时间远远超过任何活的记忆。下一代的存储技术在某种程度上来说已经出现,我们只需要学习如何利用它。
本文作者:Michael Cade, Veeam全球高级技术专家