美国能源部日前发出警告,声称新一代超级计算机每隔几分钟就会出现一次硬盘故障,它现在正在筹款建立一个千万亿次量级数据存储研究所以解决这个问题。
洛斯阿拉莫斯国家实验室已经向IBM公司定购了一台32000CPU的超级计算机“RoadRunner”,据称这台超级计算机属于千万亿次量级产品,也就是说这台计算机每秒可进行1千万亿次运算。
成千上万个CPU需要成千上万个硬盘来提供数据。卡内基梅隆大学的计算机科学副教授加思•吉布森将出任新成立的研究所所长,他声称这个系统很可能需要几十万个硬盘来处理系统仿真运算时所需的数据、提供检查点/重启容错功能以及保存模型试验得出的结果数据。在如此规模浩大的工程中,肯定有些组件会时不时出错。
据洛斯阿拉莫斯国家实验室首席研究员加里•格雷德说,目前的千万亿次量级超级计算机一般每天会出现一到两次的硬盘故障。一旦超级计算机规模提升到数个千万亿次量级上,硬盘的故障率就会迅速猛增,达到每分钟1次的频率。
美国新一代超级计算机面临硬盘故障挑战求解
未经允许不得转载:存储在线-存储专业媒体 » 美国新一代超级计算机面临硬盘故障挑战求解