数据存储产业服务平台

英特尔倪锦峰:推动NAND技术创新释放存储潜力

人类社会正处在一个数字爆炸的时代,当下新冠疫情促进了远程办公、在线教育等需求的增长,进一步加速了全球数字化进程,预计到2025年全球数据量将增长到175个ZB,数据会像石油一样成为未来社会宝贵资源和发展的源泉。

过去二十年以至到未来的五到十年,数据的量和质都在发生根本的变化,从规模、形态到处理需求等等都在发生根本的变革:数据量正呈指数级爆发,数据形态日趋多样化,数据实时处理需求也在不断僧长,所有这些变革都驱动着存储技术、存储架构、存储方案、存储产品的不断创新。

英特尔NPSG亚太区销售总监倪锦峰

“英特尔作为行业领导者持续推动创新、释放存储潜力,以帮助行业伙伴们充分挖掘数据的价值。”2021年11月23日,英特尔NPSG亚太区销售总监倪锦峰在“2021中国数据与存储峰会”线上会议说。

英特尔3D NAND固态盘源自悠久的闪存技术创新历史,30多年来英特尔一直是闪存单元演进和扩展的领导者:1988年,英特尔推出了基于NOR flash的SSD原型,于1992年随IBM PC出货;英特尔首创的PCle规范,协同生态伙伴们不断推进规范的演进;英特尔也主导了NVMe规范的建立,于2008年首次发布。

从NOR flash到NAND flash,英特尔商业化了17代的闪存单元技术,利用这些经验实现了诸多业界首创:第一家交付了64层TLC固态盘,第一家交付了QLC PCle固态盘并且首创CMOS under Array(CuA),第一个发布EDSFF/Ruler创新接口等。

“我个人有幸参与其中一半多的进程,做了17年的flash,其中2013年SSD。这个是2008年推出的X25—E,基于50纳米的SLC技术32GB,当初我们第一笔生意是北京某互联网公司做数据库加速,那时候是1000美元左右,差不多$30 /GB;这个是最新的 32TB 144L QLC固态盘D5—P5316系列,十多年来容量翻了差不多有1000倍,$/GB下降了数百倍。我们的愿景就是持续推动NAND技术的创新,发挥数据无限潜能来推动人类发展。”倪锦峰说。

倪锦峰展示英特尔最新的 32TB 144L QLC固态盘D5—P5316系列,

存储技术创新三要素:密度、可靠性和性能

如何实现这样愿景?谈到存储技术创新,倪锦峰表示要从密度、可靠性和性能三个层面来看。

存储技术创新三要素:密度、可靠性和性能

半导体行业对摩尔定律有着执着的追求,以持续满足行业的容量密度和成本的苛求。

3DNAND技术很好的续写了NAND领域的摩尔定律。从2016年推出第一代32L 3DNAND,到2020年推出了144L 3DNAND,一共发展四代,结合CuA以及QLC等相关技术,使得存储密度实现了5倍多的提升,数十年来Floating Gate经验积累,帮助Intel 3DNAND拥有更好的单元可靠性和数据维持能力,从而实现更好的QLC性能和寿命,并为后续的PLC即5dpc打下坚实基础。

“此外,性能提升方面的创新也是至关重要的,随着Die Size的增加,同样容量的SSD所容纳的NAND Die数目不断减少,因而损失并行数据处理能力,因此我们有必要在NAND架构方面做文章,不断提升其本身性能。”倪锦峰表示。

从密度角度,英特尔144L 3DNAND已于去年规模量产,并基于此推出了一系列企业级SSD,包括D7—P5510系列TLCSSD以及D5—P5316QLCSSD,D3—S4520 SATA TLC SSD, 2018年,英特尔发布了第一款QLCSSD,到现在第二代QLCSSD最大容量达到32TB,其在CDN、大数据、温存储等Read intensive Workload方面取得很大的成功。此外,结合Optane等Fast Media能够促进存储架构的创新来加速TLC的替换。

行业其实对摩尔定律有执着的追求,但是这单单靠3D层数的堆叠是不够的,因为从32到64到96到128等等所取得的收益呈递减的状态,一来本身层数不可能每次都翻倍,二来层数增加其实对Fab工艺整体生产的Lead Time带来很大的挑战,因此有必要从另外一个维度来追求存储密度的提升。

QLC、PLC相对于TLC来说取得有益的密度提升和成本的下降。

得益于Floating Gate优异的Data Retention能力,Intel QLC产品在企业级应用中取得了可喜的成绩。Intel Floating Gate技术拥有更好的Read Window Budget,因而也更容易加速PLC的实现,英特尔在PLC研发方面已经较长的时间,也取得很好的进展。

分享简单两个例子。

上边左图是拿当前144LQLCNAND做了PLC仿真,经过了1K PE Cycle以及Data Petention Bake后的看一下Vt分布图,结果显示没有做配置优化情况下依然能够取得比较好的Margin和RawBER,也能较好满足ECC目标。右图是英特尔下一代3DNANDPLC的Vt分布,这个是Time Zero时候的Vt。

倪锦峰表示:“我们还有很长路要走,会继续开发优化并且最终产品化,这将进一步提升密度,降低成本,从而加快HDD的替换。”

所有这些技术创新同时也非常注重技术实际的可用性

英特尔在芯片设计层面也持续创新同一芯片会支持所有这些模式,SLC、TLC、QLC、PLC、All in one,这当然包含很多复杂的设计工作,使得在成本没有显著增加的同时,性能不受影响的前提下面实现All in one的设计,大大提升了应用弹性,这将大大简化开发人员的工作,供应链也会大大简化,因为无需很早就决定到底需要Config成SLC Die还是QLC Die,从而精简库存。当然,在SSD层面也可以将DieConfig成不同模式,从而为变化的市场需求提供更多更好的产品选择。

可靠性方面,其中很重要一个概念是RWB(Read Window Budget),读取窗口越大、准确性越高,性能也是越好,另一个概念是Leakage Current,它其实恢复导致读取不准确性,当从SLC演进到TLC到QLC的时候,读取窗口越来越小,对Leakage Current的敏感度也越来越高,读取准确性也会有更大的挑战。得益于Floating Gate优异的Data Retention能力,英特尔QLC产品在企业级应用中取得可喜一个成绩。

同样,Floating Gete技术拥有更好的Read Window Budget因而也更容易加速,QLC相比于TLC来说,Endurance有所降低,英特尔 QLC在行业的诸多QLC技术中拥有更好的Endurance,但依然比Intel TLC的Cycling Capability更低一些,因此有很多朋友对QLC有较多一个顾虑。

绝大部分SSD的DWPD其实都是小于小于1的,大部分实际使用寿命损耗又远远小于SSD额定Endurance Spec,Intel的QLC SSD结合了较高的Cycling能力和领先的容量,可以显著增强全生命周期的整体写入能力,满足诸如CDN、大数据、本地盘等诸多应用市场寿命需求,可以想象一下从4T到32T接口不变情况下面,全盘写入能力提升了很多。

英特尔同时也和诸多的行业伙伴们开展平台软件方面一些架构创新,对Incoming Workload进行顺序化这样能极大提升QLC的适用度,因为QLC相比TLC其实在顺序写、随机读能力方面其实很接近的。

来看一下存储创新三要素中一个性能

英特尔在不断创新NAND架构以提升其性能,改进SSD层面的性能可扩展性,因为对客户来说,他们希望从1T到2T到4T到8T到16T容量翻倍的时候性能也能翻倍,听起来是不可能完成,但英特尔并没有放弃在软件架构等方面的创新,也希望在NAND Die本身方面做更多的创新,除了ONFI接口等演进以外,也Enable了BBD和MPRO等相关的一些技术。

3DNAND层数增加会导致Block Size不断增大,从而影响到SSD层面的Flexibility以及性能,Intel 144L 3DNAND拥有3个Deck,每个Deck有48层,中间由Dummy层隔开,Block by Deck技术有效地缩小了Active Block Size,每个Deck可以单独进行擦除,同时可以保持其它Deck的数据完整性。此外,Deck也可以按照需求Configure成SLC、QLC等不同的模式来进行分配,大大提升Flexibility,从而带来更好的SSD级别的优势。

另外一个NAND Die方面的创新是IMPRO,即多个Plane Group可以相互独立地接收和执行的读取命令,使得读取性能特别是随机读取性能翻倍。

帮助行业客户充分挖掘数据价值

英特尔拥有数十年的内存经验积累,并在密度、可靠性和性能等方面持续推动创新,释放存储潜力,以帮助行业伙伴们充分挖掘数据价值。

英特尔 QLC在诸多行业得到广泛的应用,并拥有很多成功的案例,举几个简单的例子。

首先看一下Lightbits。

客户案例之 Lightbits

Lightbits是NVMe TCP标准的倡导者,他们推出了为数据中心存储带来超大规模敏捷性和简单性的存储解决方案,Lightbits软件定义分解重构解决方案可以帮助企业私有云、SaaS和Iaas提供商前所未有的节省时间和Cost,同时实现更高的应用程序性能和公共云级别的超级可扩展性。Lightbits lab充分认识到了将新推出价格合理的闪存解决方案与高性能标准网络相结合所带来的机遇,其LightOS软件和LightField储存加速卡是第一个提供在高性能标准网络上可运行全局闪存转换层NVMe TCP解决方案。

Intel和Lightbits合作利用QLCSSD搭配Optane Pmem为客户提供了高效、敏捷、可扩展高密度存储解决方案,其中Optane Pmem作为元数据存储提供非常细颗粒度的日志结构元数据存储能力,而Intel QLC SSD则作为主存储使用,低成本、高密度,单节点可以达到数百TB。

客户案例之 XSKY

再来看一下XSKY。继2021年7月发布了星飞8000全分布式闪存系统后,XSKY和Intel继续深度合作,又发布了星飞9000产品,成为国内第一个支持QLC的NVMe企业全闪系统。

星飞全闪系统基于XSKY领先的DATAOS底座打造,比业界TLC全闪系统成本有显著的下降,并且具备更高容量密度,同时保持全闪达到了性能、容量和成本均衡,使机器学习、实时分析等新型负载理想存储平台。星飞9000全面采用英特尔认证高科技部件,包括最新一代CPU、智能网卡,傲腾介质和QLCSSD产品,产品功能先进、稳定可靠,性能比星飞8000有大幅度提升,特别是大容量的NVMe QLC SSD,单盘容量超过30多TB,具有TLC相同质量和可靠性,给用户带来巨大性价比优势。

客户案例之 京东云

英特尔也跟京东云合作,基于Intel QLCSSD打造高性能、高性价比一个存储基础服务,英特尔QLCSSD在容量和寿命方面一些优势帮助京东运提升了弹性扩展能力,并降低TCO,在诸如618、双十一等业务洪峰期考验中取得显著成效。

倪锦峰最后说:“英特尔希望跟更多的行业伙伴们一起加入NAND flash技术方案一个创新和生态系统方面一些演进,释放存储潜力,挖掘数据价值。”

(根据演讲速记整理, 未经本人审定)

未经允许不得转载:存储在线-存储专业媒体 » 英特尔倪锦峰:推动NAND技术创新释放存储潜力