数据存储产业服务平台

存储可靠性会成为中国第十二届存储峰会大咖分享的引爆点么?

生活中经常会遇到一些受人们心里预期影响而改变的事情,例如在股市、房市上的那种买涨不买跌。在企业级存储市场也存在类似的情况。例如,两三年前业界在闪存、软件定义存储上的创新寥寥,那是大家会更关心这是否成为未来。而如今,业界在这方面的创新则是遍地开花,大家的关注重点则转向了这些创新对自己是否靠谱。

例如,那些宣称采用SDS方式部署的存储新架构有着和传统存储相同的可靠性,或是ZB级存储规模扩展与性能的持续增长……当大家围绕SDS、闪存、云存储这些创新在市场上开始大踏步走的时候,用户很容易相信这会是个趋势,但更多开始关心这个趋势对自己可靠么。

今天,受邀参加中国第十二届存储峰会的几位相关专家学者相聚国家电子计算机质量监督检验中心,共同就此话题进行了各自的分享,包括国家电子计算机质量监督检验中心技术总顾问罗洪元、国家电子计算机质量监督检验中心软件与存储评测实验室主任阳小珊博士、华中科技大学武汉光电国家实验室副主任谢长生教授、华中科技大学武汉光电国家实验室吴非博士、西北工业大学计算机学院副教授张晓等。

wechatimg22 wechatimg21

众专家共同探讨存储可靠性评测

罗洪元、阳小珊:存储系统国家质检还有很大改善空间,企业也应重视可靠性测试的自建

wechatimg17

国家电子计算机质量监督检验中心软件与存储评测实验室主任阳小珊博士

政府存储招标的检测项目主要集中国家电子计算机质量监督检验中心,但阳小珊介绍,检测工作实际上还有很多困难或模糊的地带,例如系统兼容性方面没有能力获得所有厂家的设备;扩展性方面如厂家宣传的PB、ZB规模扩展性更多依赖于方针手段,缺乏实际测试环境;针对安全,很多安全堆栈的测试没有统一衡量标准;针对商家宣称的若干个9的可靠性测试也还存在模糊地带。

wechatimg18

国家电子计算机质量监督检验中心技术总顾问罗洪元

罗洪元认为,可靠性检测之所以存在模糊地带,一方面在于厂家在可靠性衡量上并不受重视,以及相关可靠性测试人才的缺乏。例如,当前大多数厂家在保障可靠性细节方面重视不够,特别是在电磁兼容性设计、产品形态设计与用户交互性、安全性设计几方面,厂商缺乏建立完备数据以及计量的重视。罗洪元认为,在这方面存储企业可以多向中国的领先制造企业学习,例如格力、长虹等,都有针对系统可靠性完备的衡量标准与数据积累。不过,罗洪元也谈到一些优秀厂商也开始重视这方面的体系建设,例如他用华为招聘可靠性测试工程师的招聘广告看到了华为在这方面的重视。

存储业界的一些变化也给存储系统的可靠性评测带来的一些新的挑战。例如,现有针对某些应用环境的系统实测MTBF维持在8000小时,而随着如今存储系统容量变得越来越大,用户期望这种评测可以达到10万小时,但MTBF测试环境修改并不容易,但业界愿意在为此事讨论。

在用户方面,罗洪元也建议有能力的企业可以搭建自己的测试平台,在温度、湿度和振动性方面。由于企业应用存储从部署到上线的周期大幅缩短,以至于很多厂商在生产存储系统时原有研发定型和生产定型两个环节上做了很多省略。毕竟,可靠性测试直接关注后面运维的复杂度与成本。

吴非:国家闪存可靠性测试标准亟待建立

wechatimg19

华中科技大学武汉光电国家实验室吴非教授

来自华中科技大学武汉光电国家实验室的吴非教授则分享了在闪存方面的可靠性测试关注。

众所周知,这一年来国家大量投资以闪存为基础的新型存储系统,例如在大基金支持下在北京、武汉、福建等地的大规模闪存存储研发、生产、制造体系,特别地如紫光集团近一年来的各项举动等。从国家层面推动的利用闪存弯道超车战略固然值得支持,但这背后与国际上的欠缺也需要注意。

吴非谈到,她在今年参加美国闪存峰会时发现,针对于闪存的测试专业服务供应商开始多了起来,有十多家以上。但这些厂商均是分布在日本、韩国、以色列、美国,这得益于闪存的发展在这些国家有着引领作用。可以看到,面对国家在闪存投入的决心,欲实现弯道超车,也需要在这方面做好功课才成。

吴非讲,闪存的制造和HDD有着很大的不同,有着更为严苛的生产标准,才使用上针对上层控制系统也要作出再设计。例如,在制造方面,即使来自于同一晶元同一批次的产品,在块的质量上也会表现较大差异,这就需要在品控上作出更为严苛的设计。还有,如今单卡、单盘的闪存容量不断加大,甚至到了10多TB,很多传统控制器的设计就会显得不足,如FTL层的调用就会成为瓶颈,需要再设计,LDPC校验也要重视起来。

仅闪存本身来说,从平面走向3D的过程也牵涉了很多需要重新思考的环节,如数据的写入方式导致的性能抖动。吴非谈到,很多厂商在提供的性能参数上其实隐藏了很多细节,如IOPS、带宽等,由于受到压缩去重、数据块大小、数据存储格式、系统容量与用户容量的平衡等,现有的可靠性评测方法还有很多探索空间,例如SNIA就提出了稳态问题的评测方案。

张晓:云存储系统的评测与优化

wechatimg20

西北工业大学计算机学院副教授张晓

如今,随着云成本的不断下降,云存储的应用得到了更大范围的认可。张晓分享了云存储系统的评测与优化的相关研究,其中特别指出,针对大规模云存储系统的评测已经建立了相对完善的方针设计体系,但由于受到用户需要利用互联网的环节,测试的认可度并不是很高。

从通过存储业界这些研究专家们的讨论,从传统存储到云,从闪存的国家大计到用户的应用,我们可以肯定存储可靠性的议题已经摆上了台面。伴随着业界前沿存储科技使用的不断升温,相信这种讨论还会继续。

其实,对于业界热点的讨论,这次大咖们的相聚不过是冰山一家,至少本年度这领域的重头戏应是12月9日的第十二届中国存储峰会。

以上提到的各位大咖中不少是本次峰会重要嘉宾,除此之外,那天现场我们还会看到SNIA前主席Wayne、国家集成电路产业投资基金总裁丁文武、紫光集团有限公司董事长赵伟国、清华大学微电子所所长魏少军、福建省晋华集成电路有限公司董事长邵玉龙、存储专委会冯丹、存储专委会舒继武……

或许只是听说没见过的各位大咖们能在这一天和大家面对面,或许你察觉出差的就是一张第十二届中国存储峰会门票了。

点击下方链接,快速领取第十二届中国存储峰会门票。

http://csw.dostor.com

未经允许不得转载:存储在线-存储专业媒体 » 存储可靠性会成为中国第十二届存储峰会大咖分享的引爆点么?