2021年全球闪存峰会如期于7月29-30日在杭州萧山国际博览中心举行。值得一提的是,30日下午,闪存技术学术专场里的内容果然没有让人失望,这里出现了许多凝聚智慧和实践经验的精彩分享。
笔者对于这场论坛的期望值还是很高的,因为,2019年在杭州举办的全球闪存峰会的这一场演讲中,出现了后来作为天才少年加入华为的优秀毕业生,刷屏的“天才少年”可谓是赚足了眼球。
当时作为论坛出品人的是上海交通大学计算机科学与工程系副研究员、博士生导师吴晨涛,而今年的论坛出品人还是吴晨涛。
在吴晨涛的策划和组织之下,邀请到了包括之江实验室研究专家曾令仿、华东师范大学海内外公开招聘教授,博士生导师,上海市计算机学会存储专委主任石亮、浙江大学研究员,博士生导师何水兵、上海科技大学信息学院 助理教授、研究员殷树四位老师。
在峰会召开期间,有杭州本地的芯片设计公司找到作为工作人员的我,希望我能介绍某位学校的演讲嘉宾,能让他们去做学校做校招,可见其对于人才的迫切需求,也从侧面看到了杭州科技公司的朝气。
而在学术论坛现场,几位老师的介绍不仅内容很前沿,很有干货,也极具实用价值。
吴晨涛老师分享的内容是关于用纠删码来解决云存储系统面临严重的数据丢失问题,研究主要是针对于闪存阵列里,特别有纠删码场景下怎么样去降低写延时。
云存储系统通常有两种提高数据可靠性的方式,一种多副本,一种就是纠删码,多副本的方式适合热数据,温冷数据适合采用纠删码机制,既可以保证很高的可靠性,也可以降低存储成本。
基于纠删码的技术存在着写放大的问题,有可能会带来性能下降的问题,吴晨涛的分享总结了现有一些写更新方法,提出一种基于图匹配算法来解决数据更新策略和垃圾回收策略,减少更新中读写IO放大问题,进行了许多优化。
这一种技术适合用在超大规模数据中心里,实际应用中,这些技术研究是在于阿里云的合作中完成,并在阿里云得到了实际应用。
之江实验室研究专家曾令仿分享的主题是《面向新型存储器的双模文件系统》,闪存要实现容量和性能之间要平衡,就需要有多种模态,如果容量更大就需要模数增加,但可靠性会急剧下降。SLC的性能非常好,但MLC和TLC性能就比较差,做双模文件系统工作需要就需要比较深入的考虑。
之江实验室成立于2017年9月6日,是浙江省委、省政府深入实施创新驱动发展战略、探索新型举国体制浙江路径的重大科技创新平台。实验室主攻智能感知、人工智能、智能网络、智能计算和智能系统五大科研方向。
华东师范大学海内外公开招聘教授,博士生导师,上海市计算机学会存储专委主任石亮教授分享的是移动分布式智能终端存储系统方面的研究,这一研究已经在手机厂商的手机里得到了实际应用。
石亮教授分享的内容是一种内存交换技术,解决手机系统因内存不足导致打开应用过多时,需要重新加载应用的问题,普通手机能在两三个应用之间无缝切换,当打开应用过多时,就需要重新打开,究其根本是因为内存不足造成的。
石亮的分享提到了内存交换技术是将部分不是特别关键的内存数据迁移到NAND存储中,当需要用这部分内存的时候再加载回来,以此实现多个应用随时可用的状态,提高手机用户的使用体验。
当然,这一过程需要做很多优化,也需要做安卓系统层次上的调整,需要以比较高的性能完成数据在内存和闪存之间的来回迁移。
石亮的分享还提到了跨设备内存共享的技术,让手机通过无线网络传递内存数据,让手里的手机使用别的设备上的内存,这一做法还是非常新颖的,如果将来能实现这一技术,可以解决大部分设备上内存不足的问题,听起来就让人激动。
浙江大学研究员,博士生导师何水兵介绍的主题是基于忆阻器的自动深度神经网络剪枝和映射,使得机器学习运算中的矩阵向量运算更加高效和正确。
深度神经网络在自动驾驶、自然语言处理、图像识别等领域应用的越来越多,市场上出现了包括GPU、TPU、ASIC的各种加速器,主流的深度学习计算架构主要还是基于传统的冯·诺伊曼体系结构,随着摩尔定律失效,冯·诺伊曼结构会带来延迟强和功耗强的问题。
而新的存算一体技术因为少了在计算完成再写入数据的过程,少掉很多数据传输的操作,不仅降低了延时,还降低了功耗,目前比较流行的存算一体化介质就是忆阻器(ReRAM),在存算一体化的工作中,如果不加修改的进行比较完全的矩阵操作则会存在精度下降的问题。
经研究发现,可以去掉应用矩阵里的一些不重要的值,从而降低部分资源开销,这就是量化或者裁减。研究提出的软硬件协同设计的卷积神经网络裁剪和映射方案,使得矩阵向量运算更加高效和正确。
上海科技大学信息学院助理教授、研究员殷树介绍如何为生物分子动力学可视化应用提供计算就绪数据,落点是一个叫ADA的轻量级文件系统层。
如今的高性能计算不再只是做仿真和科学模拟,还要处理数据分析的问题。高性能计算在存储方面的特点是写入一次读取多次,需要优化读性能。
Molecula Dynamics(MD是分子动力学应用)是科学计算领域或者传统高性能计算领域是常见的应用,生物学家更希望看到分子的运动的图,这需要用一系列可视化工具。
可视化工具需要加载大量的数据,其中包括水分子的数据,研究发现可以剔除水分子部分的数据,从而节省很大部分的内存,反复的加载过程需要反复进行多次压缩和解压缩操作,耗费CPU算力。
轻量级文件系统中间层ADA,转为分子动力学可视化应用做了优化,性能最高提升达14倍,内存利用率提高大概2倍多,而且能耗也大幅下降。
以上是此次学术论坛的精彩内容梗概,受限于作者本人的知识体系限制,只能部分呈现精彩内容。
如需了解更多2021全球闪存峰会的最新动态,可点击阅读原文进入官方查看,感谢您的关注!