曙光ParaStor并行存储系统
任新勃 发表于:12年10月10日 13:43 [来稿] 存储在线
信息技术的发展带来数据的爆炸性增长,PB规模的数据越来越常见,这些数据80%以上是视频、音频、图片等非结构化数据,如何有效地管理海量非结构化数据已成为IT管理者所必须重视的问题。传统的SAN和NAS存储架构,主要针对结构化数据和中小规模应用而设计,不能满足海量非结构化数据处理的密集型I/O及海量并发访问的需求,同样由于其架构的缺陷,管理工作极其复杂,会带来高额的管理成本。ParaStor并行存储系统汇集了曙光公司多年以来在并行计算和海量数据处理方面的丰富经验,从架构上彻底消除了传统存储系统的瓶颈,能够满足高带宽和高并发的海量文件存取的需求,为用户带来前所未有的存储性能体验。
产品特性
ParaStor并行存储系统采用了代表存储技术、网络通信技术以及数据管理技术发展方向的并行体系架构,是一款面向海量非结构化数据处理、拥有自主知识产权的高端存储系统。它可以提供数百GB/s的高速带宽和EB级的海量存储空间,能够满足飞机汽车船舶设计、生物基因研究、材料科学研究、天气预报、地震监测、环境监测分析、能源勘探、电子商务、网络游戏、社交与视频分享网站建设、动漫渲染、视频编辑处理等领域中对于存储容量和I/O性能要求极高的应用,可广泛应用于政府、教育、科研、制造、企业、医疗、石油、广电、互联网等行业。
ParaStor系统包含四类组件:索引控制器oPara、数据控制器oStor、管理控制器MGR和应用服务器客户端oApp。其中,索引控制器用于管理存储系统的所有索引数据和命名空间,对外提供单一的全局映像;数据控制器用于提供数据存储空间,并实现文件的并行存取,支持1~4副本;管理控制器提供统一的控制管理界面,管理员通过该节点管理整个存储系统;应用服务器客户端向上层应用提供数据访问接口。
ParaStor并行存储系统先进的架构使其具备超强的横向扩展能力,只需要简单地增加数据控制器,即可获得更大的存储容量和更多的数据通道,从而获得更高的系统聚合带宽和I/O性能。随着数据控制器的增加,所有物理资源(CPU、缓存、网络带宽和磁盘读写带宽)自动实现负载均衡,满足成千上万个客户端的数据并发存取需求。此外,ParaStor高可用、全冗余的架构设计也使其具有及时的系统预警、准确的故障定位和优越的容错恢复能力,可以保障业务系统7×24小时的持续可用,实现海量存储系统最高级别的可靠性。