旧时王谢堂前燕 飞入寻常百姓家
东京工业大学高性能计算机(TSUBAME)成长特写
“旧时王谢堂前燕,飞入寻常百姓家”,这是中国古代的一首诗,讲得是曾经在帝王将相家门口的燕子,今天已经成为百姓家的常客了。
无独有偶,在IT界的高性能计算机领域,也有这样的事情,我们最近就采访了东京工业大学高性能计算机(TSUBAME)的主要发明人松岗博士(Satoshi Matsuoka),他想我们详细的介绍了这只王谢燕是如何成为今天百姓可随便享用的机器的。
说到高性能计算机,相信对服务器有些了解的人就会知道一些,之所以将其跟古诗中的燕子联系起来,并不是非要这么有文采,而是东京工业大学的校徽就是一只燕子,算是个巧合吧。由于日本的IT技术发展相比于中国要早一些,所以超级计算机的研制和开发很多是由个人发起的,而TSUBAME也是这样一个情况。
“很多人都觉得TSUBAME超级计算机是一夜之间建成的,但是我们知道那是不可能的,” 松岗博士对我们说,“TSUBAME从1996年开始,经历了十年的时间,才一朝成名天下知。”
由于这个系统是博士自己的个人爱好,所以在十年前其实就是一个集群服务器(Cluster),一共用了Sun的14个SuperSPARC处理器。由于当时也没有多少对性能的要求,而且费用也很少,所以最初的雏形就是10M的Switched 10Base-T + Myrinet网络。而整体的性能最高的峰值是32Gflops,系统传输64Gbps,总存储容量为4GB。
今天的TSUBAME显然要比当初时髦且强大了许多,它采用了Sun Galaxy 4服务器做节点机,共计10480颗Opteron处理器,而存储也是采用的Sun的产品,我们在问博士关于存储产品的采购是否与服务器一起的原因而选择Sun的产品时,博士的回答让我吃惊:除了Sun,我们别无选择。考虑到如何提升整体网络的系统性能,他们采用的是Infiniband Network,这对网络存储设备的要求就提高了很多,而当时的存储产品,只有Sun可以满足这个条件。由于Sun的技术人员也在场,我也来印证此事,而且我还发现TSUBAME在2004和2005年的时候,就已经开始采购这些设备了,熟悉服务器市场的人都清楚,Sun的X4600和X4500是去年才推出的,这也说明博士当时敢于在自己的系统中用最新的产品,还是非常大胆啊。
提到高性能计算,很多人以为就是超级计算机,其实系统的设计和网络以及存储的搭建才是最重要的,否则,很多应用都不能跑,那没有什么意义。这方面博士显然早就考虑到了,所以博士对网络的高性能要求做得很明确,采用了Voltaire公司的Infiniband高速网络交换机。
可以这样说,TSUBAME之所以能够成为日本最大的高性能计算机,跟Infiniband高速网络密不可分。我们知道,这种胖节点的PC服务器在成本上比传统的大机集群要占优势,但是存在的问题就是性能瓶颈。教授采用了这种联结方式之后,则很有限得解决了这个问题。如果把主服务器和存储服务器等比喻成一个人的骨骼和各个器官,那么告诉交换网络就是血管和神经系统,高速网络如果没有好的信息交换系统,计算机如果不能共享存储,那后果可想而知。显然,博士将IP存储融入到Infiniband高速网络中是很明智的选择。这方面,Voltaire公司应该说是非常重要的,他们的Voltaire Grid Director ISR9288交换机在这里建了奇功。因为只有Infiniband网络才能提供博士所需要的性能,另外,这款交换机的288个端口让整个系统的布线变得简单了许多。不要小看这个设计,就这一方面,就让以后的系统管理与升级和设备排查变得轻松了。因为交换机就那几台(一共就8台),从控制台上就可以发现是哪个交换模块或者端口的故障,这要比用传统的网络方便许多。
整个系统就这样不可思议的搭建起来了,占据了大学的三层楼房,面积达到350多平方米,共计50吨。在我们的眼里,它那是我们心中的小燕子啊,应该是神秘莫测的凤凰才对。
然而,尽管TSUBAME今天已经成长得落落大方,但是,她还是平民血统,因此,应用TSUBAME的人很多,可以说她非常平易近人,这也是很多高性能计算机不能做到的。
由于TSUBAME生在东京工业大学,所以她也肩负这学校的学籍注册与管理的功能,你可以用自己的学生证登陆到TSUBAME上,用她来查阅资料,或者做自己的毕业设计等大型程序运算。
现在很多学校的老师领到科研经费后,都用TSUBAME来做科学计算。比如我们知道的海啸模型的运算,以及汽车的工业设计。很多学生也会根据自己的需要,分到几个CPU,去做自己的动画设计或者图形视频的处理等。可以说,在大家的眼中,TSUBAME根本就不是我们传统意义上的超级计算机。
也正是因为这样,现在整个高性能方面大家开始探讨新的模式,到底该怎样做到低成本而高应用率,因为这如果现实可行的化那么计算经济时代可能会提前到来,这比先前我们经常提的网格经济还要实际。目前,日本很多大学纷纷效仿,都在做这方面的工作。博士这次趁着亚洲学术交流会议的时间,也走访了中国的清华大学,希望更多得展开合作和技术交流,让TSUBAME的计算能力为中国的用户出力。
最后,博士还告诉我们,TSUBAME也在升级,2007年TSUBAME将达到 110 TF, Storage 1.6 PB, 128GB nodes。而到2010年,TSUBAME2.0的计算能力将达到1PF ,还会保持日本第一的位置 ,到那时候,TSUBAME一定会让世界人们所共享的,真正实现飞入寻常百姓家!
笔者起笔这篇文章的时候,也正值国内高性能计算要继续冲击新高度的时候,博士以学者的朴实和直率建议我们,中国的高楼大厦起来的非常快,但是对高性能的投入并不是很多,希望中国在这方面多多努力,迎接信息爆炸时代的到来。