数据存储产业服务平台

医院电子病历:医院存储之忧与解决之道

电子病历是个人终生的医疗和健康记录,要求医院建立与之相应的电子病历系统并且能够随时随地访问该系统。这意味着:假设某个人10年前得过肝炎,在医院看过病,那么今天他再来医院看肝病的时候,医生就可以立即调阅病人在10年前的病历记录,而不用等待半个小时或一个小时,甚至更长的时间。

医院存储之忧与解决之道

存储之忧 一:容量

电子病历包含的数据类型非常丰富,既有结构化的文本、自由文本,还有波形、图像、视频等。随着技术的进步,现在医院需要记录的信息比过去要多得多,诸如超声、手术等动态过程,由此带来的数据增量巨大。

以北京某大型三甲医院为例,每年静态医学影像的增量大约为10TB?20 TB,有放射类的需要20TB,如果把一些动态的影像都算上,每年的数据增量在数十TB。如果按保留10年计算,那就需要几百TB。可以想像,医院对存储容量的需求是多么巨大!

解决方案:可以从底层的存储物理层扩大磁盘,同时从应用层想办法,比如可以进行有损压缩。例如,三年以上的影像数据,对于诊断已基本没有价值,只是具有作为医生临床诊断比对的参考价值,或者是供教学使用。医院可以对这类影像进行最高20倍的压缩。

存储之忧 二:数据生命周期管理

到目前为止,医院数据的生命周期管理问题在实际应用中还没有很好地解决,尽管前些年很多IT厂商就在讲数据的生命周期管理。

首先,数据库中的数据怎么办?很多数据存放在数据库,比如医嘱、化验结果等,医院每年OLTP数据库的记录数就达数千万行。对数据库管理构成的最大挑战不是容量,而是大数据量后的性能。这也是具有中国特色的一个问题,国外很少提及,因为中国的医院规模太大,病人太多。对于电子病历而言,其数据长期存放于数据库,肯定不行;而是要将数据取出来,电子病历的数据如何归档?这一问题在存储管理层无法解决,只能从应用层解决。

其次,文件型数据如何迁移?影像就是典型的文件型数据。一般而言,近3个月之内的数据使用较频繁,3个月以前的数据就使用得比较少了。我们经常要把一些不常用的数据从昂贵的阵列里迁移到廉价的阵列里,从而提高存储投资的应用成效。而要将大量的原始数据向压缩数据迁移,其实现方式仍未可知。

即使数据迁移之后,又如何让访问透明化?让用户感觉不到存储介质和路径的变化?这些问题目前还没有很好地解决。这既有存储厂商的技术问题,也有应用系统厂商的问题,需要IT业界从不同层面加以解决。

解决方案:应用层要特别针对医疗业务系统设计历史数据管理功能,解决数据库数据的卸出和文件型数据的迁移,也可以通过存储管理系统软件实现文件型数据的透明迁移。

存储之忧 三:性能

首先是文件系统的性能。比如PACS系统,大量的数据不断进入系统中,接入设备增多就造成系统的响应速度越来越慢。“慢”的根源在哪里呢?并不一定在于服务器,而可能在于存储。大容量数据的并发与实时读写会导致磁盘阵列出现瓶颈。

磁盘阵列瓶颈怎么解决?一般可以用多重阵列并行分担,把数据分到不同的阵列。这就对应用层的存储配置能力提出了很高的要求,应用系统需支持同时把数据写到不同的阵列上。

其次是数据库的性能问题,数据库真正的瓶颈往往是在磁盘,数据库对磁盘容量的要求相对较小,但对速度的要求较高。对于这一问题,我们是否可以依托于固态盘这一新兴的存储介质来解决?但固态盘在寿命上是否有问题?这些问题都有待进一步验证观察。

解决方案:可从存储物理层和应用层这两个层面来解决。

存储之忧 四:备份与恢复(可靠性)

以往,在服务器比较少的时候,备份和恢复是比较容易的,而且还能做到实时备份,能把服务器当时产生的变化实时地记录下来。现在的问题是,临床信息系统越来越细分、越来越专业,服务器数量越来越多。医院的机房里一般有几十个系统、七八十台服务器,这么多的服务器还能不能都各自建立一个备份系统?这件事情非常难。

在备份方面,医院还面临着如下挑战:怎么做备份?一旦出了问题能否恢复到任何一个时间点?如何对备份进行管理?几十台服务器总不能逐一去备份,能不能做集中备份?备份的介质又怎么管理?这些都是令我们苦恼的问题。

我们不希望把所有鸡蛋放在一个篮子里,数据到底是统一存储,还是分散存储?存储的容量越来越大,一旦出了问题,数据恢复的时间如何保证?我们知道,一个几十TB的磁盘崩溃了,不是短时间内能恢复的。还有备份方案的选择,是用磁盘备份还是磁带?过去我们用磁带库模拟磁盘,现在用磁盘阵列模拟磁带。我个人以为磁带仍然还是很有用、很可靠的。

解决方案:从存储管理层寻求解决路径。

存储之忧 五:能耗

磁盘阵列的散热已成为机房管理的重点。磁盘阵列越来越多,一个阵列一个柜子,夏天一到,机房热得不行,对空调系统构成巨大压力。如何减少能耗?磁盘在不用的时候能否休眠,一旦有数据访问请求的时候再启动?但磁盘响应的速度稍微慢一点。还有一种办法是增大单盘容量,减少磁盘数量。

解决方案:着重优化存储物理层。

存储之忧 六:长期持久性

第一,随着存储容量的线性增长,采用什么样的存储技术来支撑线性增长?

第二,磁盘阵列要不断更新,由此带来了数据移动的问题。以PACS系统为例,以前是1TB一个卷,现在是10TB一个卷,要把原来存放在不同卷上的数据合并到一个卷上,原来的数据位置就要移动,移动后应用系统就访问不到了。

第三,随着电子病历的不断发展,数据的格式也在改变,怎么样保证存储系统的兼容性?这不是一个物理的问题,是应用层面的问题。

解决方案:存储物理层:扩展技术;应用层:数据管理。

未经允许不得转载:存储在线-存储专业媒体 » 医院电子病历:医院存储之忧与解决之道