数据存储产业服务平台

15万买到64万? 一台全闪阵列的生意经

数据时代的到来,存储对于企业越来越重要。

如何找到最佳解决方案破解企业存储瓶颈?

曾经“高富帅”的全闪存阵列

如何重新定义存储经济效益?

一起来看企事录专业评测,剥笋得“金句”!

作为存储管理员,以前只要守卫技术象牙塔,真是怎么爽由自己!

偶尔被拉进一个什么销售动员大会,还可以教育台下一众“技术小白”,讲一讲我们存储的技术原理、管理流程,让他们明白,所谓的促销战役对于我们存储来说,是极为不靠谱的!

可是现在,连平常甚少逛街的我都发现了,电商还真是“多快好省”啊!但说归说,那些销售部门分分钟搞出来的造节、大促,对于IT部门仍然是“被战役”!要上线新服务,提供新的存储卷,做数据分析,真真一个“烫手山芋”啊!

短暂的纠结过后,还得面对现实,毕竟“互联网+”给各行各业带来的冲击是有目共睹的!作为企业的IT管理人员,岂能坐视不理?

该干的活儿还得咱自己想办法!找个专业人士咨询则个!

甩掉“偶像包袱”的全闪存

第一个想到的,便是去拜访主张“加速促进新解决方案落地”的企事录团队,联合创始人曾智强在企业级存储领域有很多独到见解,想必能给我一些中肯的建议!

果然,了解我的问题与困惑以后,曾智强迅速把解决方案锁定为全闪存阵列,“你要的是性能,又不太重容量”,而且,“一台配6个SSD的全闪才15万起步,每IOPS才一块钱!”

后来的沟通证实,这个建议背后源于企事录团队刚刚做过的一轮全闪存阵列评测,针对目前企业存储的挑战与存储管理员的困惑,犹如剥笋一般层层分解,最终得来“金句”。

一起来看专业评测如何剥笋吧,有图有真相!

拓扑图显示,整个测试环境采用传统的SAN架构,最上是戴尔PowerEdge R930四路服务器(72物理核心512GB内存),安装Oracle Linux 6.6和Oracle 12c,通过两块双端口FC HBA与中间的Brocade 6505 16Gb/s FC交换机相连接,因为是测试环境,交换机只有一台,并没有冗余设置。

最下即全闪存阵列,来自戴尔的Storage SC4020,配备了20块200GB容量的SSD,一块为热备盘,19块盘以一种类似于RAID 10的方式冗余。

据说,戴尔官方售价15万8千8百8十8的SC4020全闪配置的是6块容量为480GB的SSD,可以根据用户需求以“颇为惊喜的代价”升级为6块容量为1.92TB的SSD,曾经的“新贵”甩掉偶像包袱啦!

一个小插曲是,测试中前端Oracle数据库服务器上插的两块FC HBA卡,却只有3条FC通道,企事录团队的解释是一个光模块出了点问题,实验室里面也没有适合的备件。

这个问题倒是很常见,光模块跟HBA卡、FC交换机不是同一家厂商供货,指不定就有链路不通,或者带宽降低等兼容性问题。

问题一:

15万8的全闪存到底有多强?

看过价格和架构,重点来看数据库性能,见下图“8K数据块的随机读性能”▼

测试8KB数据块随机读取获得的结果:最大IOPS接近29万,平均响应时间在1ms(毫秒)以内,突发响应时间(最大延迟)在32ms左右,这样看来,性能非常好。我现在使用的高端存储,配了几百块盘,加上优化以及缓存的作用,IOPS也不过才几万。

同一个测试中的另一组成绩,8KB随机读的带宽最高到2264MB/s,考虑到服务器只是用了3条8Gb/s FC通道,理论带宽是2400 MB/s,已经可以认为是到达FC通道的极限了。

来自测试团队的另一组数据证实了我的想法,果然是服务器与FC交换机之间的带宽瓶颈。

128KB数据顺序读测试结果,最大带宽2268MB/s,与8KB随机读带宽2264MB/s相差无几,确认带宽是瓶颈

问题二:极限性能在哪里?

想必你也想知道“15万8的全闪存极限性能在哪里”,企事录团队的测试结果,如下面这张统计图显示▼

4KB数据块随机读取测试结果,IOPS接近37万,平均响应时间在1ms以内,最大延迟也在32ms左右,变化不大。

3条8Gb/s FC达到37万IOPS,但FC通道仍有成为瓶颈的可能。

而国外某权威机构有用6块SSD测试,IOPS超过10万。通过我们的验证,排除一块热备盘,国外机构实际使用5块SSD。企事录测试团队实际使用了19块SSD,接近4倍的盘数量获得了接近4倍的性能。

问题三:不是“为跑分而生”吧?

这个基准测试成绩跟应用性能的差距有多大?

我们调出Oracle性能测试成绩来验证一下▼

Oracle数据库性能测试主要考虑三个指标,即TPM(Transactions Per Minute,每分钟在线事务处理数)、TPS(Transactions Per Second,每秒在线事务处理数)和响应时间(ms)。

从上图可以看出:

峰值TPM最大为64.5万,平均TPM约为61.5万;

峰值TPS超过1.1万,平均TPS在1万以上;

性能较好,基本与前面基准测试中的8K数据块随机读取的性能相吻合。并且,其平均响应时间为36ms,突发响应时间为250ms,性能的稳定性很好。

单看性能数字,也许对业务部门并不“带感”,放在具体的业务情景来分析一下:

在今年双十一开始的头30分钟,天猫每秒交易峰值17.5万笔,相当于17.5万的峰值TPS;每秒支付峰值12万笔则相当于12万峰值TPS。这两者加起来差不多要接近30万TPS性能!

简单换算,不考虑其他因素影响,差不多30台同等配置的SC4020全闪存阵列就能满足天猫交易和支付的性能需求(登录、浏览等操作不在此列)。

当然,这个简单换算只是为了有一个直观印象,并不反映实际情况。毕竟“双十一”是全球最大规模的“购物狂欢”,系统架构将是其性能发挥的关键。绝大多数企业也不需要达到那么高的交易性能,在能够完成任务的前提下,,设备越少,其架构的复杂度越小,运维也更加方便。

重新定义企业存储经济效益

搞清楚技术问题的种种只是开端,更重要的是,曾经“高富帅”而又甩掉了偶像包袱的全闪存,为存储重新定义了经济效益,具体来说,有以下几个方面:

更低的实际功耗:按照企事录团队的算法,目前市面上最快的磁盘是1.5万转(RPM)的SAS盘,功耗约为8W(实际为7.92W),IOPS大约为200,要达到10万IOPS,需要500个硬盘,仅硬盘的功耗就接近4KW(3960W)。也就是说,光是使用磁盘系统,一年的电费就够买好几台全闪存阵列了!

某知名硬盘制造商的一款高性能磁盘——15000 RPM、300GB容量的SAS磁盘,红框中显示其平均功耗为7.92W。而SC4020的开机功耗最大为380W左右,10倍于测试配置。

如果使用SC4020这种最大可配置24块2.5硬盘的2U机箱的话,500个硬盘需要21个机箱,正好满配一个42U机柜。

而如果要达到企事录测试获得的30万IOPS(实际4K随机为37万IOPS,8K为29万IOPS),则需要1500个硬盘,功耗接近12KW,而SC4020正常运行和全速运行时的功耗为260W-280W之间,不到前者的四十分之一。

更小的占地空间:SC4020满配24块SSD,提供超过30万IOPS,只占用2U高机架空间。而提供10万IOPS的磁盘系统需要一个满42U机柜(500 HDD),而提供30万IOPS的磁盘系统则需要3个满42U机柜。

卓越的单位I/O成本:从成本的角度来看,提供相同的I/O性能,SC4020的成本远低于磁盘系统。计算单位IOPS成本,考虑到SC4020在6个SSD的配置下能提供10万IOPS,而售价才15万人民币,相当于每IOPS成本1.5元人民币,不到2元钱。

需要明确一下,与每IOPS成本相对的则是每GB成本。目前而言,按IOPS成本计,闪存占优,即闪存能够更好地支撑性能需求型应用;而如果应用主要需要的是大容量的话,则基于低速(7200RPM及以下)大容量硬盘的系统更占优势,每GB成本更低。

总结

随着“数据时代”的来临,存储对于企业的角色越来越关键。以戴尔SC4020为代表的全闪存“新贵”,必将为企业带来更加优异的存储性能,重新定义存储经济效益。

未经允许不得转载:存储在线-存储专业媒体 » 15万买到64万? 一台全闪阵列的生意经