项目情况介绍
新疆油田数据中心早在2004年底已经建立起基于SAN架构的存储网络系统,从一定意义上说,那时就已经开始了对服务器、存储系统、备份系统、存储的管理的整合。并在较短的建设周期内、以较高的起点建立了相对完善的IT系统,并成功地支撑起了新疆油田信息系统工程的运营。在采用存储虚拟化技术以前的IT结构如下:
图:数据存储整合前的存储孤岛
新疆油田数据中心根据业务需求,先后购买了两套不同品牌的集中存储系统。但是随着技术的不断成熟、业务种类的不断丰富、用户需求的不断提高,对后台的支撑系统提出了更高的要求。以前的存储架构已经不足以满足业务发展的需求,对现有数据存储的基础架构提出了新的调整要求:在不影响现有应用的情况下,需要对已有的HDS 9585和EMC CX700存储系统实现整合,解决随着业务的增长而不断产生的问题。
新疆油田数据中心在2007年九月购买了在存储虚拟化存储市场领域处于领先地位的厂商–HDS的具有强大虚拟化功能的NSC55产品,实现了对原有系统的整合。目前新疆油田数据中心已经拥有了一个统一的存储资源平台、可以实现统一存储资源调度;并且NSC55带来的一些全新的存储功能可以完全应用到以前的存储资源,使原有的存储空间得到了增值;统一的存储平台完全消除了原有存储基础架构的瓶颈。
图:数据存储整合后的统一存储平台信息基础架构
目前在这个统一的存储平台上运行着新疆油田数据中心的所有应用系统,包括地球科学与钻井系统A1所有的应用(CDS、MDS、PE、LMK、TSM、GQS、PCEDM等)、上游生产信息系统A2所有的应用(EDM、CITRIX、QVM、OpenWells、TWS、Crystal Report等)、勘探数据库、开发数据库、地理信息数据库、基础地理影院系统、三维地理影院系统、项目管理应用系统、办公自动化系统和公司门户应用系统等将20多个应用系统。统一的数据存储平台保证了这20多套信息系统的正常运行,使新疆油田数据中心数据管理的集成度得到大幅度提高。
新疆油田数据中心存储虚拟化存储整合项目的实施为新疆油田公司在2008年力争全面完成数字油田的建设打下了坚实的IT架构的基础,为完善油田信息集成平台、一体化应用系统等重点基础系统建设提供了统一数据存储的保障。为未来油田的数据和应用容灾建设、各种应用升级,ERP系统建设、完善工程技术与生产服务业务信息系统、加强生产自动化技术的推广应用、完善生产自动化数据管理系统和扩大自动化设施数据采集监测等应用提供了充分的数据存储可持续扩展支持能力。这一项目的成功实施将促进新疆油田继续由数字油田向智能化油田不断迈进。
存储系统整合前面临的问题
直接使用各自独立部署的HDS和EMC阵列,随着业务的发展一些问题也变得越来越紧迫:
问题1.数据复制问题。
基于存储的数据复制技术目前已经是最重要的存储技术,它是数据备份、应用开发、数据挖掘、应用测试、数据容灾的基础,几乎所有的企业级用户都会使用这种基于存储的数据复制技术来解决各种应用难题或提供增值的存储服务。这种基于存储的数据复制技术对于新疆油田数据中心同样重要,而对于现有的不同品牌的HDS9585和EMC CX700,它们互相之间无法实现基于磁盘卷的数据复制,无法直接在存储间进行在线的数据转移,数据复制必须通过主机来实现,造成效率低、结构复杂。
问题2.容灾问题。
这个问题同时出现在HDS9585和EMC CX700上。如果没有虚拟存储的统一管理,将来实现异地容灾的时候,HDS9585和EMC CX700要通过各自的容灾机制分别建设,但是这是不可能的,不仅因为多套不统一的容灾系统建设复杂,无法实现一致的容灾系统接口,管理、维护难度极高,而且从理论和实践上,HDS9585和EMC CX700属于中端模块化产品,性能和功能等方面是根本无法支撑30-1000KM的异地容灾!
问题3.没有存储虚拟化带来的其它问题
- 形成多个独立管理界面,无法形成统一管理架构,管理成本高
- 形成多个”SAN孤岛”
- 存储资源池无法数据共享
- 数据无法自动迁移
- 无法形成基于虚拟化引擎的、自动化的分级存储机制
- 多个存储系统分散部署造成应用系统软件的管理、设计复杂
- 快照、复制等功能分散实现,管理难度上升
- 没有虚拟存储方案意味着丧失开放性,用户无法选择其它更好的开放产品
可以看出,与众多的存储整合项目一样,本项目的存储整合涉及了存储系统设计的可靠性、可管理性、扩展性、性能、数据容灾复制等若干关键性环节。但是应该注意到,与前期系统建设不同的是,目前阶段的建设已经跃升到一个新的层面,现阶段需要的不仅仅是一个局限于设备参数的简单方案,而是一个从实际业务应用角度出发的,真正能够解决存储设备管理维护难度问题、设备可靠性问题、数据量膨胀问题、设备综合利用等等问题的存储一体化解决方案,以及一个着眼现状、兼顾未来发展,融存储系统的整合、管理、容灾安全保护为一身的长远系统规划,以改善前期系统在建设、运行的过程中逐渐体现出来的若干问题。
项目主体需求体现在以下几个方面:
在存储管理方面,如何对数量庞大、日趋复杂的存储系统设备进行集中统一管理,如何利旧?
在 “分阶段规划、逐步实施”的整体建设指导原则下,数据中心的存储系统在各个建设阶段必然会引入不同型号、不同品牌、种类繁多的基本存储设备。不同的设备在各个时期的重要性不同,随着存储技术的演化发展,旧设备的存储能力会逐渐降低。系统建设面临的问题是:随着新系统、新设备的不断引入,从成本控制的角度看,淘汰旧设备显然是系统建设的下策。但是,在日益复杂的存储环境中,旧设备的再度利用又会面临管理界面复杂,管理成本上升的难题。依据现代存储”数据生命周期管理”的理论,不同业务系统的数据在不同时间阶段的重要性会发生很大的变化。因此,利用智能存储的技术手段,将重要性降低的数据自动的重新部署到关键性降低的旧设备上,并通过一个统一的管理界面进行各种旧设备的资源集中整合和统一规划分配,是解决上述问题最为合理的途径。
在性能方面,如何在存储层面保证各省关键业务的响应时间?
随着应用业务系统的逐步集中,业务重要性的不断提升,关键业务对存储系统的响应时间也提出了严格的要求。BSS业务选择的高端智能存储设备,由于采用了先进的技术架构,从IOPS、吞吐量等性能指标来看完全可以满足关键业务高峰流量的处理需求。但是,应该注意到,各个不同的业务系统的建设目标是为了满足同需求,因此存储数据的访问需求是复杂多变的。当各业务并行上线之后,各种数据业务必将互相竞争存储资源。显然,当非关键业务的访问需求临时增大时,会增加对存储系统内部Cache、CPU、及总线等基本资源的占用,并直接影响到基于同一存储系统的重要关键业务的I/O响应时间。因此,在处理能力方面,智能存储系统不仅需要满足业务系统的基本处理需求,还需要进一步面对业务系统中发生的各种动态访问需求,保证最关键的业务系统保持拥有最稳定的存储服务质量(QoS),并获得最佳的I/O响应时间。
在安全性方面,如何将存储系统的可靠性提升到一个新的层面?
存储系统是数据中心业务的生命线。随着数据的全面集中,将形成海量级的数据存储系统。庞大的存储系统非常重要,对数据信息的可靠性、存储设备的连续运转能力提出了近乎苛刻的要求,底层存储设备的任何缺陷都会成为数据丢失、业务中断的重大隐患。经过长时间的运行观察,可以看出:以往使用的存储设备在增加设备可靠性、减少日常管理维护难度等方面还存在较多需要改善的环节,因此迫切需要采用新的技术手段来加固数据中心业务的数据基础,实现存储系统可靠性的大幅度跃升。
如何规划未来的容灾体系架构,最大程度的减少灾难引起的数据损失?
随着数据的全面集中,存储系统的正常安全运转,直接关系到信息系统的可靠性、安全性。应该看到,系统建设的长远目标必然是全面防范各种区域性电力中断、地震、地域性疾病而建立的远距离异地容灾系统,而异地容灾系统建设的技术复杂程度远远超过同城容灾系统,其中,如何最大程度的减少异地数据的丢失、如何保证远程通信线路的传输速度和通信质量、如何减少灾备系统对于生产系统性能的冲击,如何减少灾备系统的建设成本并充分利用其资源缓解生产系统的压力,是异地灾备系统需要解决的重大关键问题。
存储系统整合后的状况
图示:HDS存储虚拟存储技术在新疆油田数据中心的应用架构
本项目实施后,在不影响原有系统的基本条件下,实现对现有SAN存储环境的整合,具体来说,就是于现有的存储系统HDS9585和EMC CX700,实现利旧并使用其存储空间。
这个项目的实施解决了存储整合前的一系列问题,达到了预期的设计目标,也使新疆油田数据中心成为中国石油内部异构存储数据整合最成功和IT架构最先进的单位之一,也为未来在与乌鲁木齐数据中心之间的异地容灾建设打下了很好的基础,为企业的可持续发展提供了数据基础架构级别的保障。
HDS虚拟存储方案的优势
针对前面所述存储系统的典型问题,HDS提供了基于高端磁盘阵列系统HDS NSC55的整体虚拟化存储整合解决方案。HDS NSC55作为核心搭建的存储系统架构由三个层面组成:
应用主机层–集中了所有的业务系统主机。
核心存储和虚拟化引擎层–由HDS NSC55搭建。
异构存储池–由系统中的若干利旧设备,如HDS、EMC等厂商的各档存储设备组成。
上述的三层架构实现的存储优化拓展功能包括:
1.核心引擎–满足高性能及高可靠性需求。在上述三层架构中,HDS NSC55智能控制器系统和磁盘子系统由HDS公司进行统一设计,传承了延续数代的高可靠性技术和高性能技术,因此完全能够担负起整个存储系统的核心指挥职能。HDS NSC55是全球最开放的、可连结多种主机平台的高端存储系统,具有全球最好的可靠性、可用性、高带宽和高性能系统表现,提供100%的数据可用性,完全可以支持业务高吞吐和不停顿的运作,是业界性能最高、扩充能力最强、功能最多和最坚固的数据集中和计算以及容灾平台。HDS NSC55是成熟、可靠的第三代产品,全球已有数千成功案例,其最关键的核心技术,如”Cache镜像”、”三层交换体系”、”Cache LUN”等,已经有超过6年的历史,在安全性方面,目前全球的使用情况是”零宕机”、”零数据丢失”。
2.存储分区–增强数据可靠性及访问性能。目前核心关键数据保存在HDS NSC55的内置磁盘上。为了进一步保证各省关键业务的存储响应时间,HDS NSC55可以端口、Cache以及磁盘为单位,划分独立的存储分区,形成数个存储子系统与各业务相对应,在每个子系统内部存储资源的访问可以被相应的应用业务所独享,保证关键业务系统具有稳定的I/O服务质量。
3.存储整合–通过存储虚拟化技术实现利旧整合。在HDS NSC55自带虚拟化引擎的驱动下,异构存储池被映射成HDS NSC55的内部存储资源。应用主机层不必关心异构存储池的设备组成,只需使用面向HDS NSC55的统一接口就能够透明的访问异构存储池资源。HDS9585、CX700等旧的存储设备被虚拟化管理以后,主机仅需要连接HDS NSC55即可同时访问新、旧存储,在HDS NSC55提供的统一连接通道上,由HDLM软件实现统一的负载均衡及故障通道的自动切换,规避了在同一主机上多家负载均衡软件并存带来的不确定因素。
4.分级存储–通过存储虚拟化技术实现数据自动分级转移部署。非关键的业务数据、以及随着时间发展重要性渐渐降低的历史数据被HDS NSC55虚拟化引擎逐步迁移到异构存储池中,关键业务数据、最新业务数据在HDS NSC55的自带内置硬盘空间上进行保留。生产系统上用于统计查询的原始数据可通过HDS NSC55的快照技术直接复制到异构存储池中,同时,测试数据也可通过HDS NSC55快照技术直接复制到异构存储池中。上述流程对主机完全透明,无需增加主机应用的复杂性。
5.应急系统联机恢复–通过存储虚拟化技术实现在线应急恢复。利用HDS NSC55虚拟化引擎在线不停机进行数据迁移的功能,虚拟化之后的CX700作为应急系统启用后,可在主机业务运行的情况下,在线转移回到HDS NSC55主存储系统,无需调度生产业务系统的停机,整个流程对主机完全透明。
6.异构系统灾备–通过存储虚拟化技术实现异构数据统一复制。系统的二期建设必然面临灾备系统的实施。HDS NSC55虚拟化引擎的异构容灾技术,支持异构存储池中的任意存储设备进行远程互备,大大简化了容灾系统的部署和管理。数据复制的方式是实时复制,能够灵活的利用通信线路的带宽,最大程度的减少数据损失,缩短异地数据库系统和应用系统的启动时间。上述第三代数据复制技术基于USP强大的处理能力,可用来复制HDS9585、CX700等中低端存储设备的数据,弥补了中低端存储设备性能、功能较差,无法支撑长距离异地复制的缺陷。
可以看出,本项目HDS采用HDS NSC55进行虚拟化解决方案的部署,摆脱了 “存储盒子(BOX)”级别的简单方案,使其作为一个先进的、功能全面的存储平台,完善业务系统的存储架构,从而全面解决了数据中心在存储管理方面面临的诸多”难点”问题。