存储在线专栏文章:大家周一好,西哥瓜很高兴又和大家见面了。前几天我们发表了EMC Symmetrix、IBM DS8000系列、HDS VSP和富士通高端存储的专栏文章,今天西瓜哥就来白乎一下IBM XIV吧。
话说我们的高端存储之父,也就是那个以色列的坦克军官Moshe Yanai在2002年,对自己发明的Symmetrix DMX不满,但EMC又不让他去变革这个产品,我估计应该是EMC想DMX卖得好好的,是奶牛产品,你把它革了,我靠啥挣钱啊。因此,双方不欢而散,因此,Yanai回到以色列,找到他的同学,一起创办了一个XIV公司,打算革掉DMX的命,创造一种全新的高端存储架构。
XIV确实是一个革命性的产品,主要体现在以下方面:
1、硬件紧耦合—>硬件松耦合。传统的高端存储架构设计严谨,而XIV采用网格架构,节点之间硬件独立,只是通过软件(MPP架构)来实现紧耦合的功能。
2、高贵专用的硬件—>普通的通用的硬件。专业节点变为普通PC服务器,FC盘变为SATA盘,节点间光纤的连接变为普通以太网的连接。
3、取消RAID。传统的RAID不用了,直接在系统里面随机存放两份数据。
4、COW—>ROW。ROW几乎可以实现无限快照。
5、管理复杂—>0管理。系统不用像传统的高端一样去划分RAID,调优,而是拿来你就用,需要多少空间分多少空间,其他的你就不用管了。……应该很有很多吧,我总结主要就是这几点。
关于XIV这名字的由来,XIV是罗马数字十四的意思。一种说法是指Yanai和他的创业同学曾是以色列军队精英Talpiot技术项目的第14届毕业生的高材生,因此产品和公司都起名XIV。另外一种说法代表他们对法国国王路易十四的敬仰。我个人更加倾向于第一种说法,因为Yanai前面我们说过,这个人还是比较自恋的,哈哈。据说国内存储圈某高人几年前也曾拜访过此牛人,发现Yanai的名片上有一行字“The Flag of Storage",存储的旗帜,何等的意气风发,哈哈。
关于路易十四这个人,我这里不免八卦一下。路易十四(Louis XIV,外号太阳王)是法国最出名的国王之一,在位的时间很长,经历和我们的康熙大帝类似,恰好他们也是同一个时代的人,据说还有书信来往。Louis XIV通过文治武功,建立了一个强大的法国。那个时候,欧洲以说法语为荣(我也觉得法语是最好听的外语,年轻的时候特别崇拜那些能说法语的美女,哈哈),他还建造了著名的凡尔赛宫(10年前去旅游过,确实宏伟),当然,Louis XIV是个矮子(154cm),因此他发明了高跟鞋(这个发明我认为是对妇女的不尊重,哈哈,穿起来难受死了,我那位我从来就很关心她,不让她穿高跟鞋,当然,她穿起来比我高一点,哈哈)。
不过,最让我感兴趣的是这个统计,路易十四在位72年.实际执政54年,是有准确历史以来世界上执政时间最长的君主之一。然而,这位君王洗澡却没有超过7次。哈哈,估计是法国香水比较厉害,都不用洗澡,不知道这个洗澡次数是如何统计出来的,真是我们男人的榜样。
扯远了。话说XIV开发出来后,主要在以色列销售了40套左右,主要销售给金融客户。IBM当年被Yanai发明的Symmetrix把高端存储份额抢光了,后来虽然搞了一个Shark存储,但都不能力挽狂澜,只是抢回了一点份额(参见我前面的文章”IBM高端存储的前世今生“),因此,IBMer估计对Yanai应该是非常的膜拜的,于2007年底决定花3.5亿美金收购XIV。从此,IBM开始学会了左右互搏之术,如周伯通一般,于2009年进攻中原,造成中原武林一段腥风血雨。
前面西瓜哥把XIV这个十四阿哥的历史八卦了一下,接下来我们来看看XIV的市场表现情况。
IBM收购XIV后,XIV得到了飞快的发展,但去年XIV全球出货台数下滑,我也不知道具体原因,大家有知道的告诉我。
我们先来看一下XIV全球的销售情况。我分析了Gartner全球的XIV销售数据,我们一块来看看我的统计数据。从收入的情况看,XIV卖得最好是在2011年,但也不到5亿美金。2010年以前增速很快,但2010年以后增长非常平缓,甚至出现倒退。
从台数来分析,大家更加能看出问题。2011年销售超过了2000台,但2012年急剧下滑,这个到底是什么原因呢?
从容量来看,由于硬盘越来愈便宜,因此,销售的容量还是一直增长的,不过这个趋势在我的意料之中。
当2009年,IBM把XIV引入中国后,在中国的高端存储市场掀起了一阵腥风血雨。由于XIV太激进了,因此,江湖分出两大派系。
一派以传统保守势力为代表,认为XIV根本没有高端存储的基因,不能算是高端存储,这个产品必死无疑,不可能得到社会的认可(对于高端来说)。
确实,XIV不支持高速硬盘(FS/SAS),采用廉价的机架服务器,纯粹靠软件把这些服务器集成在一起,和大家对高端存储的理解没有任何共同点。
但也有另外一派新潮少年,他们一方面是YANAI的粉丝,一方面对传统的高端存储已经厌恶,感觉没有任何新意。
突然看到XIV这个玩意,认为代表高端存储的方向,必将具有旺盛的生命力。也是,XIV不需要规划,不需要调优,不需要管理,拿来就用。一个高端存储居然做得如家用NAS一样易用,加上拉风的界面,确实吸引了很多追新一族。
其实这一切最令人纠结的就是IBM,IBM的DS8000用户基本都属于保守派的,而XIV在营销材料里面又是列举出无数传统高端存储的“罪状”,如功能少,效率低,成本高,管理难等等(现在XIV的红皮书也是这样写的,哈),因此,XIV横空出世,用来解决这个问题。这可难为了IBM的营销人员,革命太猛,就打着DS8000,不革命,XIV就没有活力。
IBM没有办法,只能独立出一个团队去销售XIV,因为这两个团队肯定会打架的,文化理念差异太大。从IBM内部的定位上,XIV定位是比DS8000要低一些,是中端到高端的一个补充。
XIV的中国市场表现
废话少说。我们来看一下历年XIV在中国的销售情况。关于中国区的销售数据,我采用IDC的数据来进行分析,因为这个数据比Gartner的要详细。
我们先来看一下出货台数。我们可以看到,从09年进入中国以来,XIV出货快速增长,2012年全球XIV出现下滑,但中国区还是上涨。但2013年,Q1 的数据显示XIV比2012年同期下滑严重,甚至不如2011Q1。看来XIV确实遇到了增长问题,中国区只是滞后一下而已。
从行业来看,XIV在金融、制造、医疗、电信、交通、公安等政府行业占比最高。
从区域来看,北京、广东、辽宁、浙江、山东等销量较大。但上海的销量并不大,看来上海人不是太认可XIV。
上次听一网友反馈,四川公安对XIV很感冒。我查了一些数据,其实四川XIV只销售了5套,只有2套在公安里。因此,应该说成绩不算特别突出。
而北京我们拆开来看,由于电信和金融集采,因此量最大。其次交通、教育方面也做得不错。
XIV截止今年Q1,一个销售了324台,平均每台容量只有53TB。不算太高。我们前面统计过,去年高端存储平均每套容量将近100TB。
IBM XIV,说句心里话,如果不是IBM和Yanai,我是不会把XIV当高端存储的。DS8000由于支持大机,因此虽然是双控,但列为高端存储我也认了, 因为Gartner一直认为,高端存储必须支持大机。而XIV,我真的看不出来它为什么是高端。感觉和DELL的Compellent差不多啊。
我们再来看一下XIV的SPC-1测试结果,没有超过20万IOPS,比DS8000差距甚远,但有一点我比较意外,也就是时延控制在了5ms以下,做得比DS8000要好(DS8000是10ms以下)。
我分析,XIV为什么销量再下滑, 可能刚开始用户尝鲜(确实XIV有很多卖点),因此销量一下起来了。但这些老用户二次购买的欲望再下降,一是XIV的扩展性比较差,二是性能确实一般,三 是只支持SATA盘,这玩意的故障率应该比较高(XIV把所有数据平均分布到每块盘上,如果有不同节点的两块盘同时坏了,要丢数据的),应该也影响到用户 的体验。当然,这些都是我个人的猜测,如果你有更多的看法,欢迎反馈给我。
因此,2013年,我不看好XIV。但XIV的辉煌,也是值得我们纪念的。
这真是:
高端存储江湖险,几人笑傲;
十四阿哥出身奇,谁与争锋。
XIV销售下滑这个趋势也是我分析数据的时候不小心发现的,我也很意外。我提出了我的观点,认为XIV靠一招鲜赢得了第一波客户,但由于本身的固有缺陷,因此回头客不多,这是我的猜测。另外,一个热心网友分享了他的观点:
这个是有可能的。毕竟DS8000的双控架构天天被EMC/HDS打击,但XIV的理念确实和DS8000差距太大,IBM要融合谈何容易。
另外一个网友也反馈了一个有用的信息,XIV曾经和大机的LINUX系统对接过。
联想到目前网络上工信部调研PRISM门事件和金融行业讨论去IOE(IBM/ORACLE/EMC)化,我就想,最困难是大机环境,因为所有的国产存储都不支持大机。但是,我们可以变通一下,如让HW HVS考虑支持大机的Linux环境,这样很多金融和公安购买的大机可以更换为Linux操作系统继续发挥作用,后面接国产存储。也许我异想天开了,哈。
感谢两位热心网友提供的反馈。
今天我们来简单看一下IBM XIV的系统架构和特点。
XIV是我见过的最简单的高端存储了,结构和功能都感觉很简单。感觉真是大道至简。
这个一个满配的XIV,一个机柜搞定。所有的Module都带12块盘。你可以理解为12盘位的机架服务器,但只有6个Module可以插接口卡。
至于逻辑图,也更简单了。典型的网格MPP计算架构。节点之间通过InfiniBand交换机互连在一起。理论上应该可以支持很多的节点,但IBM XIV目前最多支持15个节点而已。估计是算法太复杂了?
大家可以看一下,InfiniBand交换机的连接方式和以太网交换机一样,但和传统的FC交换机的组网不同,即交换机之间有两条直连线路。(大家想想为什么,不明白可以私信问我)
节点每3个组成一组,用USB转串口线交叉连接,作为备份的心跳线。这块我不是特别理解,以前做IBM小机双机的时候,用串口线做备份心跳很正常,为啥把USB也牵涉进来?可能结构上更加可靠,做硬件设计的网友帮忙看看为啥这么设计?可能由于串口只有一个,无法支持3个节点,但USB口有很多啊,全部用USB也可以啊?
每个节点有一块CF卡,XIV的OS(据说是基于Linux)就安装在上面。
IBM最新发布了新款的节点类型,CPU、内存都得到了提升,而且支持10GE接口卡了。
从每个节点的后视图可以看到,每个节点都支持插SSD卡,但所有的节点都必须同时插才行。
但是这个SSD没有做任何冗余,不能用来保存数据,只是用来做读Cache使用。XIV发布了最新的版本XIV Software V11.2,号称采用SSD后,对数据库的加速提高了4.5倍(上一个版本是3倍),估计是采用了DS8000的一些复杂的Cache算法,因为 DS8000的Cache的管理是DS8000的最大亮点。
但是读Cache只针对随机I/O,大的I/O和顺序I/O就直接读NL-SAS盘,而不放到SSD中。Cache算法会识别这些I/O而不把热点数据复制到SSD中。
至于和主机的连接,由于XIV最多有6个I/O节点,因此每台主机可以支持12个路径到一个LUN,XIV测试性能的时候就这么连接,但最佳实践使用IBM建议每个交换机连接3个I/O节点就可以了。
至 于支持的硬盘,IBM也耍滑头,全部文档的都说是SAS盘,不提SATA和NL-SAS字样。因此,你标书写要求支持FC/SAS盘,XIV肯定答复满 足,哈哈。但你一看容量,你肯定知道这是NL-SAS盘。因此,如果你写要支持15K转的高速硬盘,XIV只能答不支持了。
至于XIV的RAID 2.0-(前面的帖子我这么称呼),其实非常简单。就是XIV彻底抛弃RAID,所有的硬盘都切成1M大小的块(XIV叫Partition),然后采用伪随机算法,数据保存在两个分区上。有一点像RAID 10的味道。
IBM的算法,数据Partition和它的副本绝对不能位于1个节点内,因此,坏了一个节点(12块硬盘),数据是不会丢失的。IBM的红皮书说系统最多支持坏1个节点和另外任意3块盘(不能同时坏),而整个系统数据不丢失。但 在RAID 2.0可靠性分析我也分析过了,XIV的可靠性其实是比较差的,本身SATA盘的可靠性就不如SAS,而且RAID 10的可靠性不如RAID 6,加上XIV不能控制LUN的分布,LUN都分布在所有的磁盘上,因此,整个系统同时坏两块盘(不在一个节点)的概率还是比较大的,因此数据丢失的风险 很大,江湖上也有XIV丢数据的传闻。
IBM XIV的Thin和Thick LUN的分配粒度都是17GB(准确来说是16GiB)。17GB是XIV一个神奇的数字,IBM的红皮书一直没有说如何计算出来是17GB的,只是说这是网格架构的一个自然属性,保证每个LUN平均分配到各个节点中。有谁知道17GB怎么来的网友麻烦告诉一下,我一直没有想通为什么是这个颗粒度?
好,相信通过我的分析,大家对XIV的架构有了一个基本的了解。另外,XIV支持QoS,可以对IOPS和带宽做限制,不支持数据完整性标准DIF(据说现在叫PI了)、磁盘加密、Tier等这些传统的高端存储的特性。
至于快照,采用COW方式,前面我们分析过了。远程复制方面,XIV最多支持1对8复制,而且RPO应该比较大,复制的间隔最少在20s以上。
XIV其实没有太多的东西,卖点我前面总结过了,但我相信还是有些人不接受XIV是一个高端存储的,但肯定也有人喜欢XIV的。XIV就像榴莲,喜欢的人爱得不得了,不喜欢的连碰都不碰。因此我把XIV比做高端存储的榴莲哥,大家就印象深刻了。
我总结一下,高端存储架构里面,按照架构的保守和激进程度,我排一个序:
保守度—DS8000–HDS VSP–EMC VMAX–HW HVS–XIV–激进度
IBM处于两头,难为IBM的销售了,必须学会老顽童周伯通的左右互搏之术,才能把两个高端存储卖好。
最后,我看到IBM正在招募XIV新版本红皮书的作者,好像XIV有新的硬件和软件特性要发布,RAS,GUI和镜像方面好像有增强。等我拿到红皮书会第一时间给大家解读。
如果你爱她,请送她XIV,因为那是天堂;
如果你恨她,就送她XIV,因为那是地狱。
最后给大家推荐一款可以管理IBM XIV的手机软件吧。
IBM XIV Mobile Dashborad是业界第一块高端存储的手机管理软件,只支持iPhone和iPAD。大家有iPhone的可以下载试用一下,有demo模式供你熟悉相应的界面
进入demo模式后,可以看到5套XIV系统。
每一套demo系统,都有一个总仪表盘,可以看到总体的IOPS,带宽,thin的空间使用情况等等信息。
每一套系统,可以看到每个卷的IOPS、带宽、时延等信息。
同时针对每一个主机,也可以看到带宽、IOPS、时延等信息。
总体感觉,IBM XIV Mobile Dashborad还是很方便的。管理员在任何地方,都可以通过手机很方便监控存储的运行情况。这种功能一般在中低端可以看到,但高端好像就XIV这么干了,看了XIV还是很潮的嘛。
希望大家积极反馈你的意见和建议,微信扫描如下二维码,关注微信公众号“高端存储知识”,与作者微信互动。