本文所要阐述的是企业中所面临的切实存在的Copy数据的问题以及如何管理Copy数据。Copy数据的使用在企业中频繁且常见,在业务系统做备份的时候需要将数据copy出来单独存放;当审计部门需要用到业务数据做统计的时候需要copy数据来进行;当研发做业务系统升级开发的时候需要用到copy数据部署开发环境;当测试部门需要针对新开发系统做系统的测试时需要用到copy数据等等。如此频繁的使用copy数据,却也实实在在的面临着一些问题:(1)每一份copy数据都需要物理存储空间进行存储,增加大量的存储成本;(2)Copy出去的数据无法得到有效的管理,增加数据被窃取和泄露的风险;(3)copy数据的获取、处理、装载需要耗费大量的人力和时间成本。
Copy数据的问题,在各企业中都会面临,或许是copy数据的数据量不大,也或许是copy数据的问题没有被领导所重视,更或者是大公司正被copy数据的问题所困扰而无人提及,总之被提上解决日程的很少。随着数据量的急剧增长、大数据时代的来临,copy数据问题已经到了必须要解决的时候,而且刻不容缓。
Copy数据要得到有效的管理和控制,那么就需要一套管理Copy数据的管理系统-CDM(Copy Data Management)。
CDM(Copy Data Management)是指这类技术,它从生产环境通过快照技术获取有应用一致性保证的数据,在非生产存储上生成“黄金副本”(golden image),这个“黄金副本 ”数据格式是原始的磁盘格式,可再虚拟化成多个副本直接挂载给服务器,分别用于备份恢复、容灾或者开发测试。
Near CDM(近CDM、类CDM)
1、Copy数据管理的问题被存储厂商所关注,也宣传他们的存储是可以做CDM的,其实就是利用存储内部提供的快照和克隆功能,但这种底层的设备管理功能是缺乏丰富的数据服务能力的,比如实现应用数据一致性的备份、基于策略的自动化数据提供、为开发测试人员快速提供数据环境等,这些功能需求绝非简单的快照和克隆功能所能提供的。另外,基于存储自身的快照和克隆技术受限于同构存储,不能够支持第三方的存储设备。综合以上两点的缺陷,基于存储系统所做的CDM方案,是不能够很好的解决Copy数据的问题的,但可以归类于基于存储的Near CDM。
2、同样,一些备份软件厂商也宣称他们的备份系统是可以实现CDM功能,诚然,集中备份容灾是备份软件的主要使用场景,同样也是CDM的主要使用场景,相比存储的快照克隆功能,备份软件有丰富的多的数据服务功能。备份软件一般有三种实现方式:基于块级的备份、基于文件级的备份、基于应用级的备份,有些用户为了加强对数据的保护,使用了传统定时备份和CDP备份两种方式,每种备份方式采用完全不同的技术实现,它们所生成的副本一般也不能够相互做重删和压缩来减少存储的消耗。另外,传统备份软件所备份的数据副本一般都是专有的备份格式,并不能够被业务服务器直接使用。综合以上亮点的缺陷,备份软件厂商所做的CDM方案,也是不能够较好的解决Copy数据的问题,备份软件的产品重心毕竟还是在数据的备份与恢复。所以备份软件所实现的CDM方式也应该归类于Near CDM。
True CDM给用户带来的收益:
u简化数据使用流程,提高用户使用业务数据的时效性,提高数据使用效率,达到简而易用的效果;
u使用业务数据时节约copy数据的存储空间,降低企业存储基础设施的采购成本;
u满足用户对数据使用的一切诉求,并且copy数据的使用达到安全、可控的效果。
上讯敏捷数据管理平台(Agile-DMP)作为国产的True CDM产品,包含三大模块:管理模块、服务模块、审计模块,六大功能:数据采集、数据存储、数据分发、数据脱敏、数据运维、数据审计。从数据的采集到管理到运维审计,涵盖数据采集使用的整个流程,在解决用户所面临问题的同时,真正做到了数据使用的可管、可控的效果。
本文作者: 上讯信息DS产品部 朱绍臣