DOSTOR存储在线 6月24日国际报道:有时候,大数据比你希望的还要大,而出于合规或商业上的原因,你还必须将它们存储更长的时间。没什么比从磁带中获取旧得要发霉的数据更糟糕的了,而如果还是一大堆这样的数据的话,那就更糟糕了,而且还可能出问题。
有鉴于此,IBM的Netezza将TwinFin数据仓库设备在刀片和磁盘上进行了重新配置,加大了磁盘的分量而降低了刀片的分量。这样用户实际上可以自己创建一个近线的数据仓库。
Netezza High Capacity Appliance(Netezza高容量设备)有双机架设置,也有4机架设置,最终可以扩展到6个或8个机架,同时比起平常的TwinFin设备,这款设备的磁盘容量是TwinFin的四倍,而处理能力则降低40%。TwinFin采用IBM的BladeCenter x64刀片服务器和底盘。去年9月,IBM花了19亿美元的价钱收购了TwinFin的制造商。
该设备采用双插槽HS22刀片和四核Xeon 5600处理器,并配置了一个现场可编程门阵列(FPGA)协处理器。Netezza利用这个协处理器来加快改造后的PostgreSQL数据库的速度。HS22和FPGA刀片的结合被称为S-Blade。Netezza在加速器刀片上有8个FPGA–每个x64核上一个FPGA–而且这些FPGA加快了数据从存储中调出的筛选速度,然后再将这些数据传送给数据库软件并进行复杂的数据库表分类和联合操作以方便数据分析。
High Capacity Appliance的一个机架有4个S-Blade,共有32个处理器核和32个FPGA,在12个磁盘机箱中可存储144TB未压缩数据,每个机箱有12个2TB驱动器。该机架同时还包含冗余主机服务器以便载入数据并将工作负荷在集群上予以分配并规划数据查询。C1000-8型号有2个机架,总共有64个处理器核,64个FPGA,可存储288TB未压缩用户数据或者1.1PB的压缩后数据。C1000-16有4个机架,而未来的C1000-24将有6个机架,C1000-32最终将有8个机架。
C1000-32拥有256个处理器核和256个FPGA,可存储1.15PB的未压缩数据或4.4PB的压缩后数据。这样的一个庞然大物要消耗44瓦的电能。IBM还计划推出C1000-40、-48、-64、-80,扩展到可以在20个机架上存储超过10PB的数据并使数据载入速度达到每小时5.5TB。
下图显示了Netezza C1000机架的样子:
IBM的高容量数据仓库设备Netezza
Netezza部门(技术上来说是IBM信息管理事业部的一部分,而不是System x硬件事业部的一部分)产品管理副总裁Phil Francisco表示,C1000高容量设备将在7月中旬上市。IBM计划在高容量设备上对每用户TB容量收取2500美元的价格,比当前TwinFin设备的每TB 1万美元的价格要低很多。很明显,这些FPGA和服务器节点的价格可不低。