创办于1917年的北京某医学院图书馆,是我国藏书丰富、历史悠久的著名医学图书馆,1957年被国务院指定为"全国第一医学中心图书馆",1990年成为卫生部全国医学文献资源共享网络的国家中心馆和"WHO储藏图书馆",2000年被指定为国家科技图书文献中心医学分中心,长期以来,其一直承担着国家医学图书馆的重要职能。
随着时代的变迁,医学院图书馆如今已经成为了某医学信息研究所/图书馆(简称所馆)。作为国家级的医学信息研究中心,其承担着国家医学图书馆、医学信息研究、卫生政策研究与情报调研等方面的重要任务,是为国家医药卫生事业改革发展和医学科技创新提供决策咨询与信息服务的重要支撑单位。目前,所馆拥有馆藏50余万册、外文医学期刊3300余种、中文医学期刊1300余种、网络数据库和光盘数据库37种、研究生论文7000余册,还藏有1000余部中医古籍、1000余种外文医学史专著和2万余册WHO系列出版物等特色资源,是我国馆藏资源最为丰富的医学图书馆。
然而,随着信息化业务的展开,数据容量的不断增长,所馆在大容量的数据备份方面存在着很大的压力。经过长时间的甄选,所馆最终确定选用众志和达SureSave VTL解决方案来应对这一难题。
严峻的大容量数据备份形势
在国家财政部、科技部的资助下,根据NSTL的统一协调和安排,所馆外文文献的年度订购费用已达2500余万元,品种数达2600种,并以费用每年10%-15%的幅度、品种数年近300种期刊的速度增加。所馆还藏有1000余部中医古籍、800余种外文医学史专著、3000余种外文期刊和2万余册WHO系列出版物等特色资源。此外,所馆采购的中英文网络版数据库10个,数据库系统本地镜像4个,电子版数字资源15种。
在不断加快的信息化建设中,所馆意识到,海量数据的备份已经成为了不得不去面对的问题。同时,由于问题的多样性,因此找到切实有效的解决方案也并不容易。所馆所要面对的问题包括以下几个方面。
一、电子化数据的爆炸式增长
随着数据加工、馆藏数字化等新业务的开展,所馆的数据容量正在急遽扩充。为加强对核心、珍贵、特色馆藏的数字化、再生性保护工作,确保对重点数字化文献信息资源的长期保存和公共服务保障,所馆购置了先进的数字化加工和服务设备,因此预计未来5年内数据将快速增长到200TB。
二、IP SAN+FC SAN混合环境下的数据统一备份
此外,数据结构的不同也为备份带来了一定的问题。由于医学类文献信息分为结构化和非结构化两类,而且大部分是非结构化数据,用传统的关系数据库很难进行有效的管理和查询。因此,所馆方面需要为图书馆数据保护环境同时提供FC和iSCSI接口,以满足不同应用的数据保护需求。
为了能够满足自身的需求,所馆必须要部署高性能、易于扩展的备份系统,同时也要求这一产品能够应对复杂的数据中心,杜绝数据孤岛的产生。当然,由于图书馆在业务上的要求,高可靠、高可用也是所馆关注的一个必然因素。
SureSave VTL应用实战
通过部署众志和达SureSave VTL 3000产品,所馆对于数据备份设施的需求都得到了有效地解决。
海量数据备份问题迎刃而解
采用双控制器的SureSave VTL3000配置有198TB裸容量的SATA硬盘,能够最多提供32台控制引擎并行工作,可以保持正常状态下的高效率。这足以满足所馆每年200%速度增长的超大容量数据对系统备份窗口提出严峻的要求,显然,传统的单控制器架构无法突破这样的性能瓶颈。
同时,所馆应用中配置的198TB仅仅是对未来5年数据增长的规划。不过,即使增长速度突破这个限制,SureSave VTL3000也可轻松应对。众志和达SureSave VTL3000最大可提供2240TB的可用容量,完全可满足未来50年的容量扩展需求。同时,SureSave VTL3000 所具有的高效的硬件加速重复数据删除和远程复制功能还可以节约所馆的数据存储成本,大大降低备份数据容量需求和能耗。未来,所馆可以经济地实现异地数据传输,降低数据保护总成本,提高业务灵活性。
数据孤岛问题不复存在
SureSave VTL3000能够同时提供FC和iSCSI前端主机接口,分别支持非结构化数据和结构化数据库的IP SAN和FC SAN。这一特性充分满足了所馆的多种应用类型的需求。
在实际部署上,结构化数据库服务器可以通过光纤交换机和SureSave VTL3000构成高速SAN备份网络,非结构化数据服务器可以通过IP交换机与SureSave VTL3000构成独立LAN备份网络,而不占用主干网络带宽。
Storage-on-Chip专利技术保证可靠性
在解决海量数据备份和异构环境统一备份的前提下,众志和达SureSave VTL3000的性能和可靠性优势也为所馆的数据存储提供了有力的补充,使得所馆整体的数据保护方案完美无缺。这主要要归功于SureSave VTL3000所配备的Storage-on-Chip专利技术。这一技术能够通过智能控制引擎和备份容量单元独立并行扩展技术,以超群的高集合吞吐量在多个数据流同时备份海量数据时,显现出无可比及的性能优势。同时,Storage-on-Chip专利技术还能够精简部件减少故障点,支持双控制引擎的冗余切换,用最大化的高可靠性满足用户7×24的SLA要求。