数据存储产业服务平台

富士通迎“考”广东省教育考试院

2006年下半年的一个普通夜晚,大多数人都已经悄然进入梦乡,广东省教育考试院技术部技术人员却在机房心急如焚。原来,该院数据中心的一台Sun服务器中的内存条出现了故障,即便更换内存也无法使系统恢复正常。经过一夜排查,最终才发现故障是由业务系统所运行的Sybase数据库与内存捆绑,最终导致系统出现问题时无法将软硬件彻底 分盘所造成的。

故障也造成了突如其来的业务停顿,从晚上8点一直到第二天凌晨5点,整整9个小时后系统才恢复了正常运行。由于当时正值考试业务处理高峰,系统停顿让许多利用晚上时间上网的学生感到焦急万分,这也给技术人员带来巨大的压力。

作为社会服务机构,广东省教育考试院的业务系统承载着该省初中以上的各类考试、招生工作,包括普通高考、高中阶段教育、成人高考、自学考试、研究生等,一旦在关键时刻出现问题就可能造成不良的社会影响。广东省教育考试院的IT负责人深感自己身上的责任重大。

近年来,随着考试院的业务数据快速增长,系统日益复杂,关键业务运行及高并发负载已无法适应广东省教育考试院数据增长的需求。该院IT负责人透露,单就高考网上评卷而言,短短10来天的时间就有两亿条数据,包括试卷生成的图片在内,每天要增加100GB的数据量。如何建立更灵活、稳定、安全的IT基础设施,成为该院IT负责人日思夜想的课题。

2007年底,广东省教育考试院决定对数据中心进行扩容,以适应新形势的需要。由于从上世纪90年代末开始,广东省教育考试院的数据中心基本运行在Solaris平台上,因此,选型的范围基本集中在Solaris系统平台。今年3月,广东省教育考试院通过层层招标,最终选择了富士通(中国)信息系统有限公司(Fujitsu China,下称富士通)作为合作伙伴,为该院的数据中心扩容及容灾系统提供技术解决方案支持。

“之所以选择富士通,一方面是由于富士通的产品线相当丰富,另一方面,与富士通接触下来,发现他们的技术、服务实力非常强。”该院IT负责人透露。广东省教育考试院看重富士通的技术实力,而富士通中国的项目经理李启明通过与客户沟通,却发现这并不是一个简单的IT项目,而是一场“大考”。

要知道,广东省教育考试院的项目实施涉及整个IT基础架构的升级、存储的扩容、新服务器的部署、数据的迁移和完整性验证,还有业务系统容灾的实施等。此外,由于事关全省的高考、自考、成考等考试业务,所以业务停机时间少,为了不影响业务的运行,保证高考前有足够的时间调试新系统的运行,实施工期非常紧张。因此,李启明用“项目复杂、工期紧张、实施难度大”来形容该项目。

在设计和实施项目的过程中,李启明最大的体会是“沟通信息量与工作量大”。客户方的技术人员在确定每个实施方案前都会先听取富士通技术顾问的意见,由富士通首先拿出初步框架,然后双方通过不断开讨论会针对实际情况进行调整。

而富士通在设计方案时也非常慎重,李启明透露:“因为系统涉及到高考,我们必须考虑系统的稳定性,并且要减少项目实施对系统的冲击。”为此,富士通首先在公司内部召集多个部门开会,尽最大能力协调资源,满足广东省考试院的实施工期要求,保证按时完成项目的实施。项目组在实施之前做了大量的设计工作,做好整个项目的实施规划;并与广东考试院业务和IT人员充分沟通,提交了完备的实施方案。

考虑到系统的社会服务要求,经过多轮沟通,富士通采用了稳定性高、吞吐能力强的高端服务器系统。在优化本地系统性能的基础上,通过服务器分区和分区间动态资源调整的能力提升系统的灵活性。此外,富士通的解决方案通过利用磁盘阵列远程容灾的功能,进行基于磁盘阵列远程的数据复制,即使主节点的数据库服务器出现故障,也能利用备用站点的数据库服务器提供一定的服务。

在数据中心扩容具体实施中,富士通将其SPARC Enterprise服务器作为数据库服务器划分4个分区,替换原有主中心SF6900的数据库分区,分别运行Oracle和Sybase数据库。同时,富士通使用SPARC Enterprise P900服务器作为应用服务器,划分4个分区,替代原有的SF280运行考试中心的应用,并整合Web应用。

此外,广东省教育考试院采用了富士通的远程容灾方案,生产环境在考试院11楼机房,而远程容灾环境位于10公里外的容灾机房。生产环境存储采用1台富士通的ETERNUS4000 Ml500存储系统,所有生产数据都存储在这台存储器上。

由于考试中心的业务特性,要求系统平台不能出现大的业务窗口时间,因此系统升级的平滑过渡就成为方案升级的重点。富士通解决方案充分发挥了富士通相关产品和系统平台的优异兼容性,以及基于无条件保证投标设备与原有设备的100%兼容,原有应用系统在新设备上无需做任何修改就可以运行,新旧设备的整合和优化调试顺利完成。2008年3月,在考试高峰到来之前,广东省教育考试院利用业务间隙完成了数据的迁移及调配。

系统升级扩容是一个系统工程,每个小细节出现疏忽都可能导致系统故障。2008年5月,在新系统环境搭建完成后,该院IT负责人发现,系统进行存储扫描的速度很慢。最终发现,原来这是由于从原来的Sun 490R服务器更换到富士通SPARC Enterprise服务器后,运行的Veritas集群文件系统(Veritas Cluster File System)与网卡物理地址不匹配。“这说明,从老的系统平台升级新平台也并不是一帆风顺的。”该院IT负责人总结道。

在经过最初的磨合后,扩容后的新系统平台已顺利通过了2008年多次考试、招生工作的检验,事实证明,富士通为广东省教育考试院提供的解决方案更灵活,负载能力更高,容灾恢复速度更快。该院IT负责人对此乐在心头。

不过,广东省教育考试院面临的任务仍不轻松。“备份系统还要跟上,我们还在准备部署身份统一认证系统。”该院IT负责人透露,广东省教育考试院的IT升级之路还在延续。

未经允许不得转载:存储在线-存储专业媒体 » 富士通迎“考”广东省教育考试院