EMC:重视大数据的发展 抓住大数据机遇
ZDNet 存储系统 发表于:12年04月16日 10:19 [转载] 至顶网
EMC Isilon
EMC Isilon是针对大数据提供的技术,有空前的可扩展性,空前的容量和超凡的易操作性,可以管理15PB。同样可以保持很好的文件系统 IO/s 性能,IO操作可能达到百万级。更重要的是易操作性,每次需要扩容的时候,企业根据数据量增长的过程,只需要增加新的节点。
新的大数据分析平台
在数据分析方面,大数据和传统数据时代也有很大不同。传统数据分析仅限结构化数据,分析TB级陈旧数据。整个分析系统受限于纵向扩展体系结构。随着数据量增大,必须进行不同的分级和升级换代。
在大数据分析的情况下,首先必须是更新换代,能够很好处理结构化数据和非结构化数据。Hadoop是处理非结构化数据很好的技术,一个好的大数据平 台必须要同时能够处理结构化和非结构化数据。第二,要有很好的吞吐能力,能够处理PB量级的数据,才能保证所分析的数据,掌握的结果是现在最实时的结果, 帮助企业做出正确的选择。Scale-out架构是唯一的选择。
大数据应用程序需要大数据分析
同样,对于大数据应用也有不同要求。传统数据分析是根据过去的经验、报表预先设定各种不同的场景,通过各种场景指导业务部门。分析和应用的结果可能 跟原来的场景大相径庭,导致IT部门要不停地找到业务部门核实分析结果。在大数据情况下,更多是基于数据本身进行分析,通过业务部门和IT部门的紧密合 作,进行迭代的做法,找出最适合企业的应用程序和商业决策的最好方法。
新的大数据分析能够让企业更敏捷、主动地掌握自己的商业策略,更好的了解企业运行的基本情况,帮助企业改进法规遵从性。
EMC 也有相应的技术,从数据库、数据分析上面满足大数据的需求。Greenplum Database是专用于结构化数据的并行处理的数据库,不仅能够很快地对大规模数据进行处理,原来在传统情况下需要几十分钟几个小时的,在并行的情况下可能几秒钟就可以得到很好的结果。