数据中心所面对的灾难挑战
这些年数据中心的工作人员也没有闲着,桑迪让数据中心人员不得不一边住在机房与设备共存亡一边祈祷发电机能挺到电力恢复。Fisher Plaza数据中心、莫斯科的ISP服务器机房、美国威斯康辛数据中心、加尔各答的一家银行的工作人员忙着充当消防员。土耳其伊斯坦布尔Vodafone数据中心的同志好像是划船离开的办公室。
信息化所带来的数据集中将风险也集中,一个数据中心故障所能造成的影响也许就是全球性的。要确保数据中心安全需要考虑的方面实在是太多了,防火、防水、防停电、防震、防盗、还得防恐怖袭击。这个时候也许没有什么比拥有一个完善的容灾系统更让人心动的了。容灾系统实现了数据或应用在另一个地理位置的重现,当灾难发生前或发生后用户可以通过容灾系统保证应用系统在可接受的时间和可接受的数据丢失量之内在另一数据中心重现启动,将灾难对业务的影响降到最低。在现阶段各个行业都非常关注容灾系统的建设,各个行业纷纷出台了针对各行业自身的容灾要求,用户遵循行业要求和自身需求建设容灾系统。
容灾建设方法
容灾系统的建设是一个系统工程,需遵循有效的方法,将各方面因素考虑完整,按严谨的流程完成每一步的建设,才能真正实现灾难恢复的目标。不论是实现哪一级别的容灾建设,都需要包含技术、流程、人员三要素和需求分析、策略制定、方案实施、运维管理四个步骤。
在技术层面,数据复制技术是容灾技术的基础,可靠的复制技术才能保证产生正确的数据副本;高效的复制技术可以减少数据丢失量,获得更好的RPO。管理系统也是技术的另一个层面,管理系统将技术、流程、人员有机的组合在一起,使之能工作的更加高效。下面我们就华为HVS高端存储在容灾技术方面做一个简单的介绍。
OceanStor 18000高端存储数据复制技术介绍
华为高端存储OceanStor 18000作为面向用户核心业务的存储系统,承载着客户最关键数据,数据安全不容有闪失。OceanStor 18000高端存储自身具有智能矩阵式系统架构和 Raid2.0技术提高了系统自身的数据安全性,系统可靠性达到了99.999%的高标准。对于站点级事故来讲OceanStor 18000高端存储拥有完善的远程数据保护功能 和容灾解决方案,确保用户数据和应用在灾备中心重现,将整个数据可靠性提高到了99.9999%的更高水平。
数据和应用在灾备中心重现的基础是数据能从生产中心顺利的复制到灾备中心,OceanStor 18000 HyperReplication系列远程复制功能负责数据在生产中心和灾备中心的传输。Hyper Replication分为同步(HyperReplication/S)和异步(HyperReplication/A)两种模式,在同步模式下主机写 I/O进行双写后再返回到主机,生产中心与灾备中心数据0丢失(RPO=0)。在异步模式下,主机写I/O到达生产站点后并不立即传输到灾备站点,而是在 设定的传输点再进行传输,OceanStor 18000高端存储针对异步传输模式进行了优化,通过缓存时间戳专业技术将将整个系统的最小RPO降低到5s,使用户在进行远程异地 传输时数据丢失量更小,业务损失更少。
OceanStor 18000高端存储还是业界首款支持与中低端存储进行远程复制的高端存储,客户可以在灾备站点使用中低端存储作为灾备存储,降低整个容灾系统建设的成本。
OceanStor 18000高端存储数据一致性技术介绍
在异步远程复制技术中数据一致性是数据丢失量之外另一个重要指标,数据一致性是指关联数据之间的逻辑关系的正确性和完整性。当某种异常情况发生时, 数据并没有按照应用程序规定的逻辑关系完整的写入磁盘,应用程序读入的数据无法按照原有的逻辑进行解析,导致应用程序无法启动。数据一致性是容灾系统业务 恢复的关键。
数据一致性问题往往会导致应用程序无法启动。引起数据一致性问题的一个主要原因是位于数据I/O路径上的缓存机制。这样当系统发生故障时,如仍有 “滞留”在缓存中的I/O未被处理完,导致部分数据尚未写入磁盘,就会造成数据的不一致。HVS高端存储利用快照技术完美的解决了数据一致性问题,在异步 传输前通过快照为数据盘创建一个特定时间点的映像,通过这个特定时间点的快照映像,保证数据的一致性。
引起数据不一致性的另外一个主要原因是“卷组一致性问题”。某些应用的数据存放在多个磁盘卷上,这些相关联的磁盘卷是一个整体,必须保持一致性,以便共同为上层应用提供一份可用的数据,这就是卷组一致性。HVS高端存储设置CG(Consistency Group)概念,将相关联的磁盘卷添加到一个CG中,在对这些磁盘卷进行操作(比如备份、快照、复制)时,把它们做为一个整体操作。避免因为对各个磁盘卷的操作在时间上的不同步导致整体数据不一致。
OceanStor 18000高端存储容灾管理系统介绍
从业务特性上来讲,容灾系统真正发挥作用的时间并不多,也许几年才会用上一次,甚至几年也没用上一次,可以算得上是小概率事件了,但为了让容灾系统在小概率事件中能真正发挥作用,一个自动化、可靠、高效的容灾管理是非常必要的。容灾管理可以分为两个层面,第一个层面是日常的基础管理,这部分管理工作主要是技术管理,解决数据完整性、配置一致性,计划的正确性的问题。第二个层面是针对容灾演练和容灾切换的管理,解决故障或灾难发生时的整体规划和配合的问题。华为Ultra系列容灾管理软件将容灾相关的管理工作集中化、图形化、流程化,帮助客户更好地建设、维护、使用容灾系统。华为UltraAPM容灾管理平台解决方案摒弃以存储为视角的容灾管理方式,改为以客户应用为视角,以应用为容灾的核心元素,符合用户习惯。UltraAPM适用于两中心、两地三中心、多分支机构、共享式等多种灾备场景。
华为UltraVR虚拟化容灾解决方案结合OceanStor 18000高端存储提供的增值功能,为企业提供虚拟化环境下的容灾解决方案。UltraVR是一款与虚拟化架构高度集成的容灾管理软件,对虚拟化环境中虚拟机进行容灾设置与管理。配合华为存储设备的增值功能提供:虚拟机本地恢复、容灾切换、容灾回切、一键恢复、容灾演练等功能,在不改变虚拟化基础架构的情况下满足用户各种容灾需求。
OceanStor 18000高端存储容灾总结
作为一款高端存储,安全可信是首要的,OceanStor 18000高端存储通过容灾将系统可靠性提升到6个9的高水平,解决客户对数据安全的后顾之忧。同时OceanStor 18000高端存储在数据复制技术方面的优化和专业的容灾管理软件提高了OceanStor 18000高端存储的容灾效率,实现数据容灾弹性高效。