大公司只会用新的技术来改进一些现有的产品,而创业公司是则将利用这些新技术做出一个崭新的、融合的新物种。
右二为MemVerge联合创始人兼CEO范承工
在很长一段时间里,能否分清内存和外存的概念一直是鉴别计算机/手机玩家专业与否的一道入门测试题。
从功能上来讲,内存和外存都是用于存储和读取数据的设备;但在经典的冯诺依曼体系结构中,只有内存才属于存储器,而外存则属于输入/输出设备。它们之间最为关键的差异不在于存取速度,而在于能否与CPU直接交换数据。
由于工作环境的不同,内存通常只有在通电的情况下才能读写内容,一旦断电,内存上存储的内容也会随之消失;而外存则须要在断电的情况下,也能保证其所存储数据的安全。
不同的功能与角色,让内存与外存走向了不同的进化路线。内存技术随着CPU不断迭代,频率与带宽成为了内存的主要性能指标;而外存技术的进化则更加多样,从打孔纸带到磁带,从磁带到硬盘、光碟,多种不同存储介质彼此竞争、不断迭代,容量、速度与成本的平衡是外存设备的生存准则。
然而,随着技术的进步,内存与外存开始出现融合的迹象,英特尔和镁光新近推出的非易失性内存成为了介于内存和外存的中间态产品。它兼具内存的高速和固态硬盘的大容量,并且不会因断电而失去其所存储的内容。
依托于非易失性内存的出现,一些新的应用场景与产品开始出现,内存融合基础架构(MCI)的发明者MemVerge就是其中之一。
日前,MemVerge宣布完成2450万美元A轮融资,投资方包括高榕资本、美国光速创投、北极光创投、JVP、LDVP等。本轮融资将用于扩大MemVerge在硅谷的工程师、销售和市场团队,加大研发投入,进一步推动MCI技术的发展。
我们采访了MemVerge联合创始人兼CEO范承工博士,和他聊了聊内存融合基础架构(MCI)在人工智能领域的应用。范承工毕业于加州理工学院,曾任VMware高级副总裁、EMC高级副总裁。
机器产生数据已超过90%
范承工表示,随着物联网技术的发展,越来越多的数据由机器直接生产,人类输入的数据已经不足10%,机器产生的数据则超过了90%。监控摄像头拍摄的视频文件、联网传感器传回的数据等等,都属于机器产生的数据。每天有超过2.5亿千兆字节的数据以极快的速度在人工智能、机器学习、物联网和数据分析等应用中产生。
人类产生数据通常拥有一个CRUD(Create,Read,Update,Delete)生命周期,先是创建,再是读取,然后是更新,最后是删除,这一流程也是大多数数据库的底层设计;而机器产生的数据的生命周期则是CRAP(Create,Read,Ad-hoc queries,Pipeline),一般机器产生的数据只会写入一次,不会经历多次修改,人们对于它的需求更多是实时查询,比如从监控数据中找到嫌疑人的影像,或者从大量数据中寻找特定数据等等。
对比人类产生的数据,机器产生的数据结构化程度较差,缺乏合适的管理手段。这给互联网巨头和大型企业的数据科学家团队带来了巨大挑战。
人工智能、机器学习与大数据分析是处理机器产生数据最为主要的应用场景,MemVerge希望以新的数据基础架构,消除了内存和存储之间的界限,让相关应用能够以更快的速度运行,以此解决机器生成数据时代的挑战。
MemVerge系统的核心是由英特尔和镁光联合推出的傲腾内存,据范承工介绍,傲腾内存在物理层面上属于相变内存(PCM,Phase-Change Memory),采用的制造工艺是3D XPoint。英特尔从1999年就开始研发这一技术,但直到近期才将其商用化。傲腾先推出了SSD产品,这是因为SSD相对比较低端,在速度要求上没有内存那么高;而英特尔新近推出的内存形态的傲腾内存可以直接插到内存插槽里,这是一个革命性的产品——它足够快可以做内存,又足够可靠可以作为外存,这使得内存和外存第一次有了融合的可能。
MemVerge是全新物种 将帮助企业用户降本提效
范承工表示,MemVerge的核心产品是一款具有DRAM、傲腾内存、SSD三层结构的一体机系统,它的内存由DRAM加上傲腾内存提供,它的存储由SSD加上傲腾内存提供,内存和存储共享傲腾内存,并且根据不同的需要向企业用户提供整合后的内存与存储逻辑接口。对比传统服务器,MemVerge的一体机可以提供更大的内存空间和更快的存储速度。与目前最先进的存储和计算解决方案相比,MemVerge的内存融合系统提供了10倍的内存容量和10倍的数据I/O速度。
范承工预计,在正式发布之后,MemVerge一体机的每GB存储成本将会在1美元以下。
范承工表示,当前的企业级存储市场中,高端存储系统的单位存储价格在3~5美元/GB,中端存储系统的单位存储价格约为1~2美元/GB,低端存储系统的价格则在50~60美分/GB。MemVerge的系统能够以中端存储系统的价格提供高于高端存储系统的性能。
需要指出的是,MemVerge并非是传统的存储系统,它是一个融合了服务器、存储系统、软件服务的全新物种。通过MemVerge的系统,企业可以完成此前无法完成的事情。
例如,领英拥有约5.62亿用户(2018年5月数据),这些海量彼此关联的用户数据形成了一个复杂的“图”(Graph),拥有数以百亿计的“节点”和“边”。
这里的“图”是指是由若干给定的点(节点)及连接两点的线(边)所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物,用连接两点的线表示相应两个事物间具有这种关系。
如果想通过机器学习对这个“图”进行训练和处理,这个“图”的数据库/模型就必须存储在内存中。此前,没有机器拥有这么大的内存,但现在,通过MemVerge的系统,领英可以将多个节点的内存连在一起,使得研究人员可以有足够大的内存完成这个工作。
由于内存空间的大幅增长,MemVerge的系统还可以在一定程度上减少企业的成本支出,大幅削减此前受单个机器内存空间制约而不得不添置的机器。而随着机器整体数量的削减,企业的管理成本——耗电、空间、管理人员——也将随之下降。
此外,MemVerge还搭建了自己的应用商店,企业用户可以非常方便的一键部署所需的开源软件。
目前,MemVerge还处于早期的Alpha阶段,客户包括领英、腾讯和京东等知名互联网公司。MemVerge预计将于明年初正式推出自己的第一版产品。
今年6月,MemVerge将进入Beta阶段,范承工表示,希望可以有更多来自传统行业的企业能够成为MemVerge的Beta用户。
大公司难逃创新者的窘境 创业公司更能把握新技术红利
毫无疑问,傲腾内存是一项突破性的技术,它在MemVerge的系统中扮演着至关重要的角色。但作为一种全新的硬件产品,傲腾内存的未来还有很大的不确定性。如果傲腾内存发展不够顺利,英特尔选择停止生产这种硬件,MeMVerge是否也会遭到连带的打击?
对此,范承工表示,傲腾内存这类产品有一个统称叫SCM(Storage Class Memory),意为“存储级别内存”。存储级别内存的概念在过去十年里一直是比较热的一个概念,业界很多厂家都在研发这方面的技术,比如微软、三星、海力士等等。未来三到五年会有更多企业加入到存储级别内存的竞争中来。
“英特尔的傲腾内存只是第一家真正面市的商业级产品,它给了MemVerge这样的软件公司一个参照物,让我们可以在上面开发软件产品。”
范承工表示,创业公司没有大公司的历史包袱,能够更快、更彻底地拥抱全新的技术,推出革命性的产品。大公司对市场的掌控非常强,对客户掌控非常强,但这也意味着,它对一些技术的依赖性也非常强。
当大公司面对颠覆性的技术,它往往会陷入“创新者的窘境”。从商业模式上来看,如果新的技术使得它现有的产品卖不出去,或者价格暴跌,大公司将很难做出这样的决定;而在技术上,大公司传统的架构经历了过去十年或更长时间的积累,这导致它面对新技术的自然反应就是怎样把这个新的东西放到它已有架构中去,而不是为这项新技术做一个新的架构,这很难让新技术发挥自己的全部优势。
这两个是大公司很难克服的劣势。面对傲腾这样的新硬件,传统的数据库公司会考虑怎样改进他的数据库,传统的存储公司会想着怎样把这个产品加入已有的架构里做一个缓存,它们都不会成为MemVerge的直接竞争对手。
“它们(大公司)只会用这个新的硬件来改进一些现有的产品,而MemVerge是则将利用这个硬件能够做出一个崭新的、融合的新物种。”
文章转载自腾讯科技