块存储已过时,对象存储能比文件存储更快,存储级内存会成为服务器上唯一的本地存储。Robert Novak如是说,等等,他是谁?
Novak近期还曾是惠普服务器的超大规模业务部门出色的技术专家,有一段工作经历很有趣,2012年4月-2014年12月任Nexenta系统架构主管,在2014年VMworld大会上推出NexentaEdge——跨集群提供全域名空间的横向扩展型存储架构,同时还提供全局在线删重技术,动态负载均衡,容量均衡等等。
在此之前,2007年7月-2012年4月,他曾任超微企业服务器主管。他的简历里还有8年Sun,2年MIPS和6年Pyramid的工作经历。Novak去年还曾出版了《软件定义数据中心手册》。
他正在为其7月份就职的初创公司筹募资金,该公司在新管理对象存储方式上已经申请了2项专利。
在这里我们咨询了Robert几个大家可能感兴趣的问题。
1. Robert,为什么块存储过时了,这跟Hollerith卡有什么关系?
Robert Novak:我在存储行业工作了相当长一段时间,曾经教大二计算机科学专业的学生有关Unix文件系统以及它利用元数据如何追踪放置在磁盘驱动器块上的文件。
近期的一项工作是寻找新的文件系统,我搜集了所有已出版的存储和文件系统数据书籍着手研究。
这些书每一本都是从单元记录设备开始描述。但读者中只有少数人能记得它们,IBM大型机全盛时期它被称为80列打孔卡。这种卡实际上是有由称作Hollerith卡的一种源于打孔火车票技术的改造而成。
Hollerith打孔卡
由于“单元记录”太小,无法作为独立记录保留在存储设备上(如磁带),所以单元记录被收集到称之为“块”的记录组。这和块存储有什么关系?其实是与Hollerith卡的首次广泛应用有关——1890年,美国人口普查局已经将所有户口普查资料编码到Hollerith卡上,然后使用分类机将数据进行制表和分类。
这就是我认为在计算机上使用的块存储已经125岁高龄的原因。
2.基础文件存储是基于对象存储的吗,怎么来的?
Robert Novak:大部分对象存储都是作为文件收集从存储对象开始的。一些对象存储实际上在自身文件系统里直接管理块顶部的对象,但大多数是在文件存储顶部构建,采用文件存储内的独立空间从数据(图片,视频,文件)中分离元数据(对象名称,创造日期,拥有者等),如图分层:
3.键/值存储和直接磁盘寻址会如何改善?
Robert Novak:让我们先来谈谈键/值存储。2013年,希捷发布其构建键/值存储设备计划——Kinetic驱动器,但实际正式出售则晚了一年。
对于这些驱动器,你不需要了解它的大小,块存储大小或者数据实际存储地点。只需要知道“键”(在Kinetic模型里高达4096 bits)。我有时会把它比作洗衣房存储模式。你把衣服放到洗衣房存放,然后洗净甩干。老板会给你一个带编号的票据。
几天后你回洗衣房取衣服(值),但你忘了拿票据(键),老板说,没票据,没衣服。
键/值存储驱动器工作也是类似模式。但不是老板给你票据(键),而是你创建自己的键用于数据,这是独一无二的。
而造成的差异是主机服务器对数据存储地点一无所知。它并没有像其它文件系统那样对数据建立任何依赖关系。而这种依赖类型也导致了块指针重写(Block Pointer Rewrite)问题,阻碍了叠瓦式磁存储用于许多文件系统。
在键/值存储驱动器里没有数据“地址”。驱动器的“地址”是一个(或多个)IP地址分配给驱动器的。使用正确的广播或多路广播技术,你甚至不需要知道这个驱动器的地址。换言之,键/值代表了一种延迟绑定形式。
对象存储/块存储速度竞赛
4.对象存储要如何改为使用直接IP地址驱动器?
Robert Novak:具备直接把对象存储到一个存储设备的能力,没必要把对象名称转化为一系列代表元数据文件 “家族”的文件名。
5.对象存储能在速度上能比得上块存储吗?
Robert Novak:我的想法和大众观点截然相反。对象存储的速度确实能超过块存储。在块存储模式里,它已经在促进最快访问到数据方面有了逐步的转变。
磁盘驱动器的早期,所谓最快访问就是数据可以顺序从磁盘驱动器读取连续的块。随着复杂度增加,RAID技术演变成了跨多个驱动器对数据进行分段。
然而,对于对象存储,如果你将数据划分成块,跨许多不同的驱动器存储这些块(可能冗余),那么你会在读取数据时实现一个比特流效果,使得读取速度限制变成你的入站数据通道带宽(如,以太网)。
6.你对现下存储行业的状态怎么看?
Robert Novak:我个人的看法,并不反映任何主流行业厂商的心理——业内处于整合和收缩状态,因为它在努力解决我们所产生数据量的巨大转变,而这些转变阻碍了我们管理和存储数据。
许多人还未意识到采用对象存储模式,与过去的40-50年相比,我们实际上只需要更少的存储来进行可信赖地保存数据。
在过去,作为一名CIO,你被勒令不但要你的主要RAID/MIRROR存储持续在线,每年月周天还要尽可能多地存储数据副本进行备份。
其中一些备份会发送到异地用于环境灾难(飓风,龙卷风,洪水,地震),政治灾难(将数据放置在海外以防止政府访问)或冲突灾难如911事件的恢复。
对象存储能够不仅能实现所有这些相同目标,而且相比传统存储还能节约50-80%的成本。
7.公有云将如何影响存储业界?
Robert Novak:公有云是通过对象技术实现空间节约的一部分。现在的问题是云里的数据只能以广域网速度访问。如果数据是在你的手机或平板上那还不错,但如果你想在存档记录上运行分析应用程序并不合适。
此外,公有云在成本上有一定迷惑性。对于手机或平板数据,价格相当划算。但当你达到海量数据需求时,检索云数据的成本甚至能压垮一家不在内部进行数据保存的公司。
短期内我们会看到,由于IT经理停止购买决议同时评估它们用于容灾和云存储需求的公有云成本,存储部门数量将呈现扁平化。
8.大型存储供应商的并购浪潮有没有对您造成影响?
Robert Novak:并购风表现出在存储供应商管理团队部分明显地缺乏想象力。他们根本无法想象这是导致我们进入一个全新模式的条件。作为并购的一部分,很多公司也正在进行裁员。而许多裁员正在影响最具创新性的团队和技术。
9.创业公司可能会出现什么情况?
Robert Novak:因为投资商对收购产生了一些警觉,新的创业公司数量会有短期下降。主要有两家之见。一种认为并购产生是因为业界容不下更多的厂商。
另一种则意识到并购发生是因为大型厂商都没有采用和推广新技术,而这时可能是投资新创业公司的最佳时机。
后者最初可能会很弱小,而由于研发周期问题,证明它们的投资价值也需要一定的时间。
10.如何看待业界的未来?
Robert Novak:业界将会远离圈在单一服务器里的SAS/SATA存储。采用无状态UDP访问的以太网连接存储设备将逐渐变得更加智能化以便处理更多重要存储和搜索功能。服务器除了启动和交换将不再使用本地存储,甚至随着时间推移还会有变数。
唯一的“本地”存储会是0层存储级别内存,在一段时期内数据未被引用,它将迁移到更慢的层。