医疗行业数据中心的敏捷数据安全保护
Eisoo 发表于:14年03月31日 10:35 [综述] 存储在线
在十八届三中全会公布的《中共中央关于全面深化改革若干重大问题的决定》中,中国政府公布了医疗改革新的重大举措,例如“允许医师多点执业”、“社会资金可直接投向资源稀缺及满足多元需求服务领域,多种形式参与公立医院改制重组”,这些非常关键的改革措施将会极大地推动医疗行业结构的变化,促进民营和外资医院的发展,分流大型公立医院的压力,缓解看病难看病贵等社会问题。在“决定”中,“充分利用信息化手段,促进优质医疗资源纵向流动”、“加强区域公共卫生服务资源整合”等举措将有效地配合多点执业政策的执行,从而保证医疗服务质量,提高医疗服务水平。
现在要求医生不能进行多点执业,那之前说白了就是要求医生不能走穴。之前的政策要求医生焊在一个地方,如此一来,改革的愿景“小病进社区,大病进医院”很难实现。
上述看似平淡的“决定”,其实是暗潮涌动,将会引发波澜壮阔的变革。多点执业在带动医疗工作流程变化的同时,也给医疗信息化带来了挑战和机会。最突出的是,多点执业带来了患者病历信息在不同医疗机构之间交换和共享的需求。我们认为流动的电子病历工作站,开放的个人病历平台将会是大势所趋,这种模式对区域医疗信息化带来了巨大的挑战。我们可以简单总结一下——不重视区域医疗的地方不得不加强重视了,电子病历数据集成和与共享将是非常迫切的,区域医疗系统将不是摆设。
尽管政策可能会准备缓解三甲医院的就诊压力,但是大数据分析中心的需求的迫切性并没有降低。除了加强社区电子病历平台的同时,社区和大型三级医院之间的通讯及数据整合需求日益迫切。可以设想一下,一个在四川打工的工人到了上海后工作并就医后,那么在四川的某个社区的形成的电子病历需要能够在上海的三甲医院调出来,并由上海的医生继续为其诊断治疗。看似这种类似简单的需求,究竟对我们的IT系统架构会带来什么挑战呢?为了应对政策的不断变化,我们能够做什么呢?
医疗政策的变化呼唤敏捷的IT架构
对于医疗信息系统来说,由于体制问题和政策的变化,我们国内的医疗行业应对变化的压力要高于国际的平均水平。从软件架构层面医疗软件的需求改变对于医院来说是应接不暇的。相当长一段时间内中国的医疗行业信息化水平是低于企业信息化应用水平。当美国零售巨头沃尔玛在60年代已经开始率先将条形码识别器投入到零售和物流,并且探索使用数据仓库的时候,我们国内医疗行业2008年才开始别人60年代类似应用。普遍落后的信息化水平突然赶上了云计算发展的大时代,给医疗行业数据中心带来了新的机会。
“敏捷“这个词搞软件开发的人听起来非常熟悉。在软件工程领域,是一种从1990年代开始逐渐引起广泛关注的应对快速变化的需求的一种软件开发方法。所以研发的朋友看起来非常亲切。在”敏捷软件开发方法“中提到一些让我们当年比较有新鲜感的论点。比如“人和交互重于过程和工具。可以工作的软件重于求全责备的文档。客户协作重于合同谈判。随时应对变化重于循规蹈矩”。 我非常喜欢这条原则——“随时应对变化重于循规蹈矩”“。对于医疗行业信息化来说就是面临这样的问题。接下来看看我们该从哪几个地方考虑敏捷。
医疗行业敏捷的IT架构具备的特征
简单以三甲医院举例,早上9,10点钟是挂号和记账的高峰时段,CPU占用率往往高达80%,周一、周二相对来说又比周末更高,在下午的时候服务器的CPU往往比较富余,可能最多10%不到,并且由于业务系统众多,服务器的数量急剧增加,在某些大型医院可以看到10多个小业务系统构成的双机,算起来就有20多台服务器。这种对于计算资源就有明显峰值要求并且计算资源不均衡的计算环境,虚拟化应用对医院来说非常有意义。计算资源的按需分配和动态划分已经被很多医院所接受,这仅仅是一个时间问题,很多信息中心主任已经接受了服务器虚拟化,只是需要花点时间去积累使用经验而已。从周边业务逐步扩展到核心业务系统,这就是中国医疗机构普遍上虚拟化的势态。我们可以理解是用服务器虚拟化结构来作为”敏捷“的基础。
医疗机构IT架构还有一个特征就是“大数据“,对于大数据来说,统一的高性能存储不断应用在医疗机构中。尽管有不差钱的高端存储投入,但是数据恢复和保护仍旧面临挑战。大数据的一个特征就是大,(简单估算一下,按照2008年居民每两周患病率高达18.9%,住院率为6.8%,人均住院天数为18天,医院平均门诊费用是128.7元,药费比重50.8%,检查治疗费占28%,住院平均费用4874元,药费比重42.3%。从医疗费用构成可以推算出门诊病人平均3人做一次检查,1.5人做一次化验,一次门诊产生的数据量约为10K文本数据、5M影像资料,一次住院产生2MB文本数据、30M影像资料。 因此对一个面向3000万人口的区域数据中心,1年的数据增长量约为文本数据17TB、影像数据70TB。(最低保守估计)) ,但是随着高精度影像设备的使用,5M的影像资料是极为保守的算法。对于医生多点执业政策而言,我们不要奢望全国的医疗大数据中心了,一个12306都搞的慢如蜗牛,可以想象如果是用于医疗基本上这个系统基本上是12306复杂100倍。前面不是举例说明了一个个人电子病历信息共享的问题吗,如要实现远距离跨区共享,唯一的现实方式是后端存储数据要复制过来,那意味着四川的工人到上海工作后,那么他在四川病历资料是导入到了上海的电子病历库,而不是通过网络去四川调取。这种情形无形中也增加了存储压力。所以对于数据中心而言挑战是空前的,如何应对这样的挑战是医疗机构需要面对的问题。
打开敏捷的“心结“
医疗机构为了应对政策变得“敏捷“,那如何考虑”敏捷“数据中心的数据安全问题呢? 需要值得注意的是,医院现在正在走向敏捷,但不是全敏捷。离所谓的 SCCD(软件定义数据中心)还有很多路。按照医疗行业在“IT即服务的成熟度”的级别,医疗行业数据中心,目前还处在前两个发展阶段。很具体的例子就是,很多大型医院既有小型机,又有虚拟化,而且虚拟化应用程度层次不齐。对于增长中的医疗信息中心,阻碍信息中心主任大踏步向前迈进的绊脚石就是“数据安全“问题。时常听到有的主任说”我先把LIS,PACS虚拟化起来,如果出了问题,还不至于让我很痛苦“。他们担心的的就是出问题,对于系统来说保证数据不丢失,保持业务连续性就是他们要解决的头等问题。针对虚拟化保护方案就相当于我们小时候学步用的“学步车”,至少不会让自己一个倒栽葱。在保护方案的庇护下,信息中心主任的胆子才能放开,才能去更多地创新。动态划分虚拟机资源,发布一个新的服务器,很多人都已经回来,但是如何保护虚拟机的数据,大部分人还比较茫然。传统的基于一窝端的备份方式显得比较粗笨,基于SRM集群故障转移模式的虚拟机容灾保护,RTO也不能得到及时保障。爱数的Anybackup5.0虚拟化 “无代理”、 “细粒度恢复““及时挂载”、 “虚拟机自动发现”,这些特性可以简化虚拟化备份管理复杂性,运维为零。我们再也不需要在虚拟机上面按照累赘的代理程序进一步消耗宝贵的计算资源,按照细粒度恢复方式,我们可以有选择地恢复我们需要恢复的文件。对于解决医疗机构RTO的问题,“虚拟机及时挂载“技术将会按照NFS协议将虚拟机的备份快照瞬间挂载给虚拟机启动。几分钟内就可以将业务启动起来。而”虚拟机自动发现”是为了始终要抓住虚拟机的尾巴,有了虚拟机,服务器就像流水一样流动着,我们需要随时跟着他进行保护,无论他是镜像还是切换到了另外地方,这种和物理形态脱离的状态,需要一个这样的 “夹子”夹住虚拟机。
有了这几样法宝,我们在IT架构规划的时候可以尽情的“敏捷”,对于坚持使用小型机作为主力业务的医疗机构,我们只要把存储虚拟化镜像保护和CDP保护做好即可。但是除了小型机之外的世界,将是变化无常的世界。这块爱数的AB5.0已经准备好了。
大型三甲医院很少为IT预算发愁,因为现在的相比较前两年IT投入比例已经比较充足。一个百万人口地区也是投入几千万来做区域医疗信息化,但是往往医疗数据的膨胀会让庞大预算瞬间产生压力感。按照医生多点执业的发展模式,这种病历数据的重复将是空前的,,那么数据的冗余会很快吞噬有限的存储。一个残酷的事实是基于磁盘的存储技术从90年代以来并没有产生质的飞越,而医疗行业的数据增长量大有超过目前存储介质发展的势头。
如果在一个区域范围内没有一个全局重删的概念,加上备份副本,那么IT对于存储投入也将不堪重负。这里面的副本不仅仅是数据库的副本,还有针对虚拟机的备份副本,非结构化的备份副本。爱数的AB5.0的全局重删技术基于本地“指纹库”的扫描能够极大提高重删的效率,并且可以实现95%的重删比。这块技术对于PACS影像资料的备份具有非常的意义。我们知道在区域医疗信息化中,PACS影像数据将占有了大约80%的存储空间,随着时间延长,这种比例还会增高。基于传统的重删技术,重删效果很差,这些影像已经经过压缩,压缩技术也是爱莫能助。唯一能够让存储空间松口气的就只有全局重删了。因为体积大,PACS系统采用VTL慢吞吞的备份或者重不备份的历史将会被改变。种种的努力都在“全局重删”技术下尘埃落定。为了减小备份时间窗口,信息中心的技术人员这十多年来,从未停止过探索,这个技术也是消除他们这方面“心结”的有力武器。
医疗机构还有一个心结就是对于电子病历数据的保护。我们知道某些结构化电子病历是以XML文件作为病历模板结构存储的,在通信协议上面适合按照HL7模式进行异构系统数据交换存储。基于对象模式的XML文档,具有丰富的标记扩展性。但是随着时间积累大型医院或者区域医疗健康档案的这种XML文件将会积累千万或者上亿。我们大家都有过拷贝小文件的经验,效率很低。如果要进行数据恢复,将是很难让人忍受。爱数的AB5.0中的基于应用一致性保证的快照恢复挂载将会把EMR的RTO降到数分钟的水平。“拷贝”的概念就从我们脑海中抹去,我们只需要通过“挂载”就能实现整体的瞬间恢复。
综上所述,医疗行业的虚拟化应用、PACS系统大数据量、XML文件的低效率等等都是信息中心技术人员和主任的心结。我们的医疗行业按照政策的要求,我们需要越来越“敏捷”,我们需要“敏捷”的硬件架构、“敏捷”的软件、“敏捷”的管理。但是“敏捷”是一个永无止境的话题,应对变化将是永恒的存在,为此,我们要做的就是要在安全的情况下进行”敏捷“创新。在保证数据安全的环境下进行”敏捷”创新,是医疗机构信息中心的使命,而我们的使命为“敏捷”保驾护航。