说说PCIe闪存卡“丢数据”那些事儿
[导读] 造成PCIe 闪存卡应用数据丢失的原因有很多,有产品质量问题,也有应用方法的问题。
我的电脑用的是SSD,感觉也没有多快,但当我有时候需要用一下旧电脑,或者接触同时的非SSD电脑时,我就难以忍受这些电脑的速度。同样的,对于企业OLTP的应用来说,在PCIe插槽上,安装上一块SSD闪存卡,8TB的容量,70万~80万的IOPS性能,让人爱不释手。如此表现,应该秒杀磁盘甚至全闪存阵列,但这样的景象并没有发生,很重要的原因在于PCIe闪存卡也有短板,会有数据丢失的现象,而这是用户最怕踩到的“坑”。
从“跳蚤”药说起
造成PCIe 闪存卡应用数据丢失的原因有很多,有产品质量问题,也有应用方法的问题。
首先质量的问题。SSD毕竟是新技术,应用经验积累一个需要长期的沉淀过程。例如于ECC引擎,不同设计就会有影响(详见:PCIe闪存卡揭秘:请问你用了多少ECC引擎);再例如浴盆曲线和双曲线、控制供电和温度、磨损均衡策略等,都会对PCIe闪存的可靠性、稳定性带来影响(详见:告诉你:影响PCIe SSD闪存卡使用的几个关键点 )。总之,影响可靠性的因素有很多,市场发展初期难免良莠不齐,劣币驱逐良币也是有的。
其次就是使用的方法。这让我想到一个笑话:说是一个人买了不见效双倍赔偿杀跳蚤的药,使用之后仍然被咬的浑身是包,找店家赔偿。店家问是怎么用的。这个人说,就撒在床褥下面,店家说:“这是用药的方法不对,我们用药的方法,是抓到跳蚤,把药放到跳蚤嘴里,如果跳蚤不死,我们就双倍赔偿。”“可是如果我能够抓到跳蚤,捏死不就完了吗?为什么还要这么费事。”“这个吗……,这就是方法的不同了。”在这个笑话中,店家显然是狡辩。但PCIe闪存卡的确有一个使用方法的问题。
PCIe卡的使用方法
在SanDisk闪迪,闪迪中国区销售工程师经理艾昆介绍了Fusion IO PCIe闪存卡的一些案例,从中也可以看到一些不同的使用方法。
这是一个基于Oracle数据库加速的案例。在这个案例中,我们可以看得存储部分,用使用了两台Dell PowerEdge R720 Intel E5 x86服务器,各配有2块IO Drive2 容量3.0TB MLC PCIe闪存卡,彼此之间,通过FC交换机连接,借助ION Accelerator高可用软件构建高可用解决方案。该系统每分钟可以处理96万个新订单和250万次交易,100万IOPS读取,时延0.5秒。我想这样的一个方案,应该可以确保高可用性,不会出现数据丢失的问题。当然,这样的系统成本会有些高。
这个案例应该更加常见,估计多数用户是这样使用的。好处在于方案简单,性价比也比较高。对于这样的应用,艾昆的建议是用户可以借助分布式系统应用,从应用的层面解决数据丢失的问题。
艾昆指出,针对不同的应用需求,会有不用的选择。针对闪存业内关于Host Based和Device Based,不同PCIe闪存卡实现方式的争论(详见:未来属于NVMe 也许只是未来)。艾昆的观点是各有利弊,如Host Based设计会占用部分主机CPU的资源,但Host Based能耗低;与之相反,Device Based能耗会高一些。目前二者性能相当。艾昆表示:SanDisk 并不排斥Device Based设备,也不会排斥NVMe。关键在于时机和选择。他指出,SanDisk PCIe闪存卡生态已经比较成熟,这是闪迪的优势。
全闪存存储系统
除了PCIe闪存卡之外,超大规模闪存系统应用,这也是另外一个适用的场景。对此,闪迪推出了InfiniFlash全闪存存储系统。
所谓全闪存存储系统强调大容量,通过SAS/SATA扩展卡,InfiniFlash在3U空间内继承了 64个8TB的PCIe闪存卡,系统总的存储容量可以达到512TB,IOPS性能达到了78万。其中,每个闪存卡的读IOPS为2万,随机写性能为1.2万IOPS。(关于SAS扩展卡,详见:常换常新 PMC SAS/SATA HBA 不输“乌镇”)。
据闪迪的官方数据显示,与传统的硬盘驱动(HDD)阵列相比,InfiniFlash其存储密度可达5倍,性能达到50倍,可靠性达到4倍,而功耗则可减少80%。无需压缩或去重技术,其全闪存系统的最低起价不足1美元/GB。借助可提供数据缩减方案的软件栈,每GB的实际成本甚至可大幅下降至前所未有的水平。
这样的一个产品设计可以用于大规模对象数据存储,也可以适用于数据库快存储;即可以用大数据应用,也可以用于数据库应用。
小结
不同于消费类市场的产品化,企业级应用市场表现出更多的差异化,并不存在一款产品通吃的现象。因此对于用户来说,就需要根据应用的实际需要选择好产品。
一方面,用户需要一定的鉴别能力,要防止滥竽充数带来的问题;另外一方面,也需要根据可靠性、稳定性的需要,选择合理的方案。可以预见,随着产品设计和用户应用水平的提升,类似“丢数据”这样的“坑爹”会逐步减少。所谓挑战机遇并存!因此对于用户来说不要因噎废食,同时也需要小心谨防,拿捏好分寸和尺度。