数据存储产业服务平台

H3C万兆存储发布 谢长生教授受邀发表主题演讲

存储在线 10月10日北京消息:今日,H3C公司在北京举办了题为"志存高远 万兆领航"的万兆产品发布会,正式推出其全系列万兆存储产品。其中,Neocean IX3620是世界上第一款采用12Gb SAS交换架构融合10Gb以太网iSCSI技术的高端万兆存储产品,实现万兆端到端的整体架构。此次万兆产品的发布,对于H3C,同时对于存储业界均可视为一个里程碑。

H3C公司全球营销总裁 吴敬传女士、H3C公司副总裁王巍先生、H3C公司存储产品线总裁李治先生出席本次发布会并进行了精彩的演讲。同时,本次发布会特邀信息存储系统教育部重点实验室主任谢长生教授,针对当前存储领域的发展进行了主题演讲。以下是信息存储系统教育部重点实验室主任谢长生教授题为《从信息领域的两个原理看网络的发展趋势》的演讲:

女士们、先生们,大家上午好,首先祝贺H3C万兆存储产品的发布,从我个人的研究和体会讲一讲网络存储技术的发展,这样也可以看到万兆存储产品在这里起到什么样的作用。我是来自华东科技大学信息存储教育部重点实验室的重点实验室主任谢长生。

IP领域似乎是一个技术期望的领域,新发明、新技术不断涌现,新产品更加日益改善,可以说是信息技术的洪流目不暇给。人们在对信息技术的需求不断向前,但是我们看不到总体趋势和发展方向是什么。信息领域需要我们从洪流中走出来,我们站在山端上来观察,就可以看出来龙去脉和问题本质,可以更好预见未来的发展。

我们要看清整个问题,需要在四个层次上来看,一个是哲学层次、科学层次、技术层次、应用层次。哲学层次是宏观的认识,科学层次是根本的原理,技术是发明和实现,应用是解决问题。我们现在信息领域集中在下面几层,上面几层研究比较少。

信息领域的根本原理到底是什么,我们知道早期机械原理和电器时代从牛顿定理和麦克斯韦方程从原理上得到最根本的解释和透彻的理解。

信息领域有没有类似牛顿定理这样的定理呢?相对论这样的定理呢?同样,相同的信息伦是不是这样的定理?事实上虽然相同的信息伦反映了天才的光辉,但是,主要是解决通信的定理。我讲的理论对存储只是提及没有阐述,对信息的处理的本质没有解释。而对信息的处理,对他的本质也没有解释。而有一个原理多少弥补了这个缺陷。所以,美国科学家Wolfman在2002年试图从结论上解决这个问题,但并没有得到国际上的认可,所以值得进一步的探索。我对这方面也比较感兴趣,今天讲两个原理进行探索,一是信息时空传递原理。信息是需要传递的,传递作为跨越空间的传递和跨越时间的传递。跨越空间的传递我们称为通信或者传输,比如打一个电话,跨一个大洋传过去了,这是空间的穿越。而跨越时间的传递,我们称为记忆、存储,比如我们读《离骚》把几千年的信息传递给我们。信息传递的本质就是跨越时间进行信息传递的过程。

如果只有通信,没有存储,信息是否可以传递呢?我们设计两个产品,产品一,如果打电话没有人在,这个信息传递是失败,没有把信息传递出去,解决办法就是留下电话,留下电话就是存储,这个信息传递成功了。第二个产品,假设大家看足球赛,如果足球是直播的,我错过了,这个信息没有传递给我。解决办法有两个,一是看重播,重播是电视台录下来。第二是我们自己录下来。信息传递当中如果只有通信,没有存储,在很多情况下是难以传递成功的所以,我的信息传递给时空的关系是这样的?我认为信息传递的一般形态是时空结合的,就是时空二元,单独的通信和单独的存储是两个极端的情况,太多太多的例子是时空结合,比如书籍,它既可以时间传播信息,也可以传得很远。所以,存储在信息传递当中起到很重要的作用。我们把时间轴和空间轴拉大,可以想象任何信息都是跨越时间和跨越空间传递给我们的。比如我们看到的星系的影像,其实是几十万的影像,既跨越时间,也跨越空间。通信是在时代二元中的空间维,而存储是在时空二维传播中的时间维,它们都是信息传递不可缺少的环节。

通信是传播知识,而存储是基本知识,是促进人类文明发展的双刃,缺一不可。通信技术和存储技术,如果一种技术以空间传递为主,我们称为通信技术。如果一种技术以时间传递为主啊,我们称为时间技术,很多技术,实际上是同时具有时空传递的特性,我们对历史的传递技术进行时空的评价,比如说演化,比如说看到1万年前的化石,时间跨度是一万年,但是,我空间传递数据,那么大的山上有一个化石,是不可移动的,空间跨度是0,所以是纯粹的存储技术,没有空间移动的功能。这是石刻。我们的甲骨文,竹简,甲骨文跨度三千年,那时候空间传播的距离和我们人走到哪带到哪。竹简时间跨度二千年,那时候有马车,马车走到哪里,就把信息载到哪里,这也是时空传播。我们以前说这个人学问很大,论五千,我们中国伟大发明纸和印刷是四大发明最重要的发明,是信息很重要的发明。蔡伦造纸有1900年的历史(时间跨度),空间跨度,纸张可以传递到全球,印刷数据也是这样。后来我们有伟大存储发明造船的留声机,由于存储技术的发明,我们可以看到毛主席的形象和毛主席的声音,记录了历史的时刻。后来电影和录像使我们看到二战的身影,但看不到世界大战的身影,这就是我们的发明,信息存储技术的发明。

我们发现一个有趣的规律,存储技术走过了石器时代时代到了纸器时代,还有磁器时代,重量是越来越轻,物体就越来越容易携带,越来越具有通信功能。而容量是越来越大,但是可靠性和自主性越来越差,因为刻在石头上一万年,纸张可能两千年可以看到,现在一个硬盘、一个光盘可能五六年的时间磁带源就不行了,所以,这个可靠性反而越来越差,而通信技术走过风火狼烟、纸张、电缆、无线电、光纤的时代,最后通信和存储一起走向信息传递的数字时代。

探索信息变化二是对数字时代的一个解释。信息技术已经发展到历史的变化,一个是数字化,还有就是数字垄断。信息技术从上世纪50年代开始了信息的转移,多种多元的信息形式和过程都变成统一的0和1,估计我们要用100年的时间来完成这个过程,正好是在世纪之交前后50年,大家想一想人类信息技术历史有一万多年,而这100年具有重要的历史意义,这有深刻的道理值得我们探索。我在这里发现有一个原理可以解释这个现象,叫变换反演原理。变换反演原理是数据上的原理,比如一个域A,一个域B,遇A的事情很难解决,可以放到域B,域B很容易解决,解决完之后再返过来。比如对数变化,乘法是很难的做,假设1999乘1999,这很难算,如果取对数,用一个加法,这就很容易,一加就出来了,我们查反对数,一查就出来了,这就是一个变化反演的原理。比如把位元方程变为代数方程,现在原理的要点是这样,一个是域色转换关系,A域的元素和B元素是一一域色的,而且能相互转换,还有优越原则,B的处理优于A,A领域很难解决,B领域很容易解决。比如就变为语言,这样在信息领域的反演,实际人类已经有很多色。还有模拟电信号,最终是数字。最后这一次变化是最为成功,因为数字是最佳的信息成本投放,不仅可以表示所有信息形式,不像图形、声音,各种各样的数据,而且可以表示信息的过程,包括思路的过程都可以表达,它是一个最佳的信息源。我们人类历史上有三大变化传言现象,一个是钱,现在把物质变为钱,钱可以买东西,这样钱可以很好沟通了,这是物质变化的因素。第二次变化是能量的变化,把各种各样的能量变为电,电很容易传输,电拉到哪里,能量就拉到哪里,电是能够很好的用。数字也是这样的,各种各样形式的过程都变位数,数就很容易传输、存储,做完以后,我们把它变换回来到各种各样的形式和过程。

三大变换反演过程有重大的意义是这样,因为物质、能量、信息是人类信息发展的重要因素。变化和反演大大方便和加快了物质能量信息的流通和变换过程,因而极大处理了人类文明的进步。因而钱、电、数是物质能量数据的最佳媒介,因而必然在这三大领域占统治地位。现在缺钱不行,缺电不行,信息缺数也不行。所以,现在数据有强大的功能。大家从科学探索上万物皆可数,表达一切信息形式,也可以表达一切信息过程,甚至包括思维过程。所以,世间的一切都可以用数据和程序,程序就是数据的区位变化来表达。

在数据领域有软件和硬件的关系。我们刚才讲的原理,软件是数据和存储的集合,我们刚才讲万物结可数,软件可以达到的能力理论上是无限的,什么都能够表达。而硬件是对数据处理存储、传输这样的记忆,而能力是随着技术而进步,但是能力限于软件的发挥。硬件上一个台阶,软件能力就会释放一大片,所以追求性能的不断提高就是硬件十分明确的发展方向。所以,硬件的发展方向是不断的追求能量的提高。所以现在万兆取代千兆,释放出一大片的软件的能量,使一钱不可能的应用变为可能。我们以前的千兆环境下很多应用难以实现的话,到万兆就可以实现了。我们这两个原理与网络存储有什么关系呢?我们一个是信息时空传递原理,一个是反演变换原理,而网络存储是跨越时空而传递数据的系统,所以有两个关键词,一个是时空传递,一个是传递的是数据。什么是网络存储呢?网络存储就是通过网络链接起来的存储系统,有网络是负责空间的传递。而存储是负责时间的传递。数据传递的要素是什么?我们对数据传递,第二个原理告诉我们传递的是数据,数据是符号的一种,而符号信息传递要传递成功有两个要素,第一,要有传递的物力介质通道,不管是存储还是工具,要有介质和通道,我把信息、声音传达给你们,到达你们耳朵里面,这是一个通道。这样,要有相互理解的协议,如果我说印第安语,大家光会听到声音,但不知道形成。所以,有一个主流协议现象。就是说最为广泛使用协议会得到发展,使用的使用的越多会得到更加多的发展,不管从硬件还是软件上都支持它。像英语的流行,从美国、英国这样强势的国家推出来以后,英语变为强势语言,英语也是语言的协议,在IP领域,IP就是一种协议,IP协议是占统治地位的协议,IP就是信息当中的英语,是一个强势的协议。数据传递还有什么特点呢?数据不能简单的认为它是统一的0和1,是一样的存,根据反演变原理,相同的0和1代表不同的信息形式和过程,把原来的信息变化以后,有些价值就变得很贵重。假如是一个垃圾信息过来是一文不值,不能等同的处理这些0和1,这就是原理所要阐述的一个原理。所以,不同原代的信息需要在变化换需要不同的性能、不同的安全性要求,要区别对待,这是一个很重要的理论,不能等同看待它。

网络存储技术的发展趋势,我们分为存储技术和传出技术。今天不能多讲,数据存储本身是以硬盘为主,硬盘是目前大容量存储的通知技术,80%的信息保存在硬盘上,这样存储里面十年之内还没有与硬盘竞争的技术,硬盘现在发展非常快,目前美国人把硬盘叫Krgders Law,就是希捷公司前CEO,是他对硬盘贡献很大,每年把密度翻一番,超过摩尔定律,而目前硬盘变为大规模的存储使用技术。再往后,为了保持每年翻一番的容量,下一个技术叫混合存储,就是激光磁盘存储,再往上还有一个技术。这样可以使硬盘继续保持翻番的趋势。

去年最大硬盘是1个G,现在是1个T,到2005年,这个趋势到250个GB一个硬盘,我计算了一下,一个单位硬盘可以记录一生的事迹,按照这个算法,记录人的一生需要315Gb,除去睡觉时间,剩下的时间需要的容量是210Gb。我们一个硬盘,就把你一生的信息记录,一生下来就记录,记录一生就够了。对硬盘前景的预测,在移动存储领域也面对挑战,一个小硬盘,闪存就差不多了,笔记本里在五年内会遇到挑战,但是在PC领域,十年之内还不会被淘汰,而在网络领域,这种大规模的接受的挑战会更大,可能有二十年。所以,没有其他技术在密度上这么大。传输数据,IP的技术在网络通信领域成为了主流,但是,光线通道一直没有和网络存储的技术,但是随着万兆技术,IP存储在网络协议中已经达到了超过了光纤的物理性能,效益低一点,但总体上超过光纤的性能。所以,成为存储领域的主要协议已经非常明显,而且这个争论已经尘埃落定。应该说IP存储领域的前景已经非常明朗了。可以预见,凡是跨越空间的传输,IP大于一统的局面即将到来。不管是有限的还是无限,不管是通信网络还是存储网络,IP都会变为主流协议。

现有发展思路是这样的,我们处理一个存储有一个对比,现在第一是扩大规模。从硬盘到阵列再到存储网络、数据网络。第二是不断提高传输带宽。第三是更复杂的系统管理软件,第四是建立统一的标准接口。

总的来说,越来越大,越来越快、越来越难,这是网络现有发展思路。但是还有新的问题,一个是如何定价不同的信息,数据同是0和1,代表原始数据,不同的代表原始信息有天壤之别,如果区别它的重要性。对数据要进行描述,数据到底是重要还是不重要,要对原数据进行扩展,元数据不仅表示电子信息,还有重要性、可用性的描述,这样对象分起来对于原数据的描述。再根据数据的属性分配存储资源,每一种数据得到正确的资源,每一种数据不同的周转性要给予不同的资源,在容量、速度、可靠性、安全性都要有资源保证,不能不够,也不能过多,比如你买一些垃圾信息来保护的话,那叫过头。所以,正确的数据要有正确的分配资源。新的问题出来的是管理混杂性,现在存储结构是异存,规模越来越大,管理成本越来越高,解决的途径目前是因为存储设备,因为设备的管理对设备的管理是在下面进行,面对这些设备,上面的管理越来越复杂,就给经济性的总量,经济活动已经非常大了,中央来管理是非常难管理,所以解决途径是把存储消化,使它在设备运行中有更多的自我调整,这样就简单起来了。所以,从计划经济向市场经济转变以后,管理起来就简单了。

另外还有可靠性,现在的系统主要可能保障十年,怎么解决呢?我们有一个结构,80年不换,不是因为材料的特别坚,而是有新的材料出来,保持动态的结构,这样就最可靠。像美国做的一个研究,我们在数据损坏之前,就是在损坏了,我们就转到新的产品上去,这样可用性就最高。还有生命周期的问题,就是把一些存下来的东西,无限量的扩大容量,管理和保存无用的数据是最大的浪费,而且无用的信息用在信息存储上,解决的途径就是把重要的信息是生成信息,不重要的信息就忘记了,不进行存储。

现在存储面临着一些挑战,还有哪些?目前宽带是要解决的问题,下一步是高性能视频,还有虚拟现实,还有全景影像等,迎接挑战,比如数据现实需要的存储容量,还有空间影像,立体和显示需要的存储量特别大,还有记录人的一生,已经成为了现实,把这一生记下来,在任何时刻你到了什么场景,参加了什么会议,都可以记录下来。

最后,总结一下,信息传递的一般形态是时空二维的,信息存储是信息跨越时间的传递过程。数据关系符合变化反演,数字表达信息的能力是极为强大的,在数字硬件提高同时,软件的能力大大提高一步,因为提高性能是网络硬件非常明确的发展方向。所以万兆在目前上市是意义重大的。万兆之后,IP存储将成为网络存储的主流协议,不同的数据要不同的对待,扩充源数据对数据的表达,不同的数据要不同的对待,不同的数据得到正确的资源。我们下一步管理部门给存储设备更多的支持,将有效的解决管理复杂性的问题。利用的一定的原理,在数据丢失之前转移,提高可用性,提高数据管理的数据,存储技术的发展将为各种新型的应用开辟广阔的空间。谢谢大家。

未经允许不得转载:存储在线-存储专业媒体 » H3C万兆存储发布 谢长生教授受邀发表主题演讲