数据存储产业服务平台

DoSTOR存储分析 复制和存储庞大的DNA研究数据

DoSTOR存储在线 12月29日国际报道:Mostafa Ronaghi是斯坦福大学基因组技术中心(SGTC)的研究负责人,他是一名生物技术的专家,在DNA测序领域拥有多项专利,并开发了一项名叫Pyrosequencing(焦磷酸测序)的用于人类基因组序列分析的技术。在谈到他的SGTC小组时,他说:"我们是生物专家。对于存储相关的软件,我们一无所知,而且就技术来说,我们的耐性是很有限的"。

因此,由于SGTC的DNA焦磷酸测序机器产生大量的数据和文件,Ronaghi开始寻找能够安全存储及复制这些数据的方法。他很清楚地对厂商表明他所需要的技术必须能够易于使用、易于扩展,而且易于访问其所存储的数据。

超高清存储

按Ronaghi的说法,一个超高清晰度的图片在处理后大小大约为33到160MB,但是如果包括原始数据的话,就高达60到70GB。这些非常有价值(而且昂贵)的数据必须被安全地存储,而且至少被复制一次,以确保在机器故障的时候也能够使用该信息,并且让Ronaghi和他的小组能够和其他科学研究机构的研究员共享这些数据。

直到最近,SGTC还是使用一个归档系统来存储它的超高清晰/高密度数据文件。Ronaghi说:"但是跟踪这些文件是一件让人头痛的事"。而且这些系统在读取材料的时候速度还非常之慢。因此Ronaghi需要寻找更好的解决方案。

2006年,Ronaghi听说了Parascale这家公司。Parascale是一家从事虚拟存储网络(VSN)的厂商,他们的产品可以在x86 Linux或戴尔服务器这样的商品硬件上运行。Parascale VSN一上市,Ronaghi就联系了Parascale,并成为其第一家客户。

SGTC在2007年秋季的早些时候接收了Parascale VSN虚拟存储网络,而且到目前为止对它非常满意。

Ronaghi说,它的安装非常简便,而且软件使用也很简单。"图形界面非常友好,非常简单,因此我们可以跟踪硬件的负荷情况。Parascale允许我们设定规则,并且可以为每张图片保留三到四个备份。因此,即使我们损失两个磁盘驱动器或服务器,我们还是会感到安全,因为我们不会丢失数据。"

让Ronaghi感到的欣慰的另一点是,Parascale VSN可以在SGTC的戴尔x86服务器上运行,这也就意味着SGTC不用购买另外的硬件或设备,并且可以根据需要进行升级。目前,SGTC可以存储3TB数据,但是它计划在2008年上半年将系统扩展到能够存储10TB。

Parascale VSN除了为SGTC提供自由升级以满足存储需求的能力外,它还很快。"它可以同时扩展其存储容量和带宽",Ronaghi说,"而且,这对于我们来说很特别,因为在归档系统上,你只能扩展存储但不能扩展带宽"。通过使用Parascale,他说,系统可以在不降低速度的情况下让更多的用户访问该系统,这确实很好。

可扩展的商品解决方案

将Parascale VSN区别于其他存储解决方案的是:它能够存储非常大的文件,例如超高清晰度的图片;其软件能够在商品硬件如x86服务器上运行;以及它的扩展性。

"我们是唯一能够在行业标准的硬件上部署文件存储的存储解决方案",Parascale的首席执行官Bill Evans说,"有很多存储解决方案需要NAS(网络附加存储)设备。还有其他的存储解决方案需要SAN(存储局域网)设备。但是所有这些产品都是根据特定硬件和软件的定制解决方案。而我们所提供的软件,你可以在你从Best Buy(百思买)所购买的计算机上运行它们。"

Parascale VSN的扩展性也是如此。

"斯坦福研究中心所面临的问题是……他们需要处理超高清晰度的图片…….这些图片非常大。但是通过使用我们的产品,他们不需要进行疯狂的升级(例如,购买10TB的NAS或SAN设备,并每年更换成50TB…….),他们可以自由地扩展他们的存储,只要连接到他们所部署的另一个或另两个以上的机器就行…….因为我们所提供的是一个网络解决方案,而不是设备解决方案",Evans解释道,"因此,如果他们现在部署的是三个存储节点,他们可以按顺序给每个节点增加更多的磁盘,或他们可以增加存储节点,所有这些都不会打断他们的运行和操作–而且最主要的是,他们不用拼命升级"。

所有这些加在一起就意味着能够为像SGTC这样的客户节约成本。

至于谁是Parascale VSN的潜在客户,Evans说:"只要你需要一个以上的服务器来管理你的存储,我们就是理想的提供商"。更准确的说,这个产品适合于那些至少需要存储3TB以上数据,使用x86服务器,而且希望能够自由扩展存储的企业。

未经允许不得转载:存储在线-存储专业媒体 » DoSTOR存储分析 复制和存储庞大的DNA研究数据