医疗行业大数据发展背景
在过去的30年间,我国的医疗行业经历了医改、新医改,医疗信息化也经历了从数字化、四梁八柱、35212等不同的发展阶段,信息技术的发展使数字化医疗日趋成熟。云计算、大数据等新兴技术的推动又给医疗信息化及新医改带来了新的契机,本文将从大数据的角度进行分析,探讨医疗信息化的发展方向。
如何把医疗大数据转换为经济价值,“关键是怎么能够提取出与诊疗有关的数据。”医疗行业的大数据集量大且繁杂,其中蕴含的信息价值也多样且丰富,如果能够对其进行有效的存储、处理、查询和分析,那么就可对于小到辅助某个临床医生做出更为科学和准确的诊断和用药决策,或帮助某个医院根据患者潜在需求开发全新个性化服务及自动服务,大到帮助相关研究机构突破医疗方法和药物革新,或支持地区甚至全国医疗行业主管部门优化医疗资源及服务配置,提供前所未有的强力支持。
然而,如何将海量、复杂的数据的存储、处理和保护成本降至最低,同时还能对此进行实时或准实时的处理、查询需求响应以及智能、深入的分析,曙光推出针对医疗行业大数据设计和优化的智能管理、分析、查询及存储平台,来替代传统关系型数据库平台,顺利帮助用户跨迈大数据应用这道门槛。
医疗行业数据分析
根据医疗数据的所属部门,通常将其分为医疗管理机构及医疗服务机构,不同机构的应用系统各不相同,其数据类型及数据量也大相径庭。分析如下:
数据来源:数据通常来源于诸如公共卫生系统(妇幼、防疫、血站等)、院内系统、及对两种系统融合的区域卫生平台。
数据规模:由于公卫系统相对独立,其数据量相对较小,通常情况下,单一公卫系统中一年的数据规模约为10T;院内系统的应用类型繁多,诸如CISC、PACS等均会产生大量的数据,普通三甲
医院的数据规模约为几十T;区域平台是基于EMR(个人健康档案)及EHR(个人电子病历)建立的,其数据量比上述两种系统的总和还要庞大,通常的市级区域卫生平台的一年的数据规模约为上百T。
数据类型:根据日趋完善的国家标准,各系统产生的数据格式也日趋标准,但由于医疗的业务系统诸多,数据类型也呈现多样化趋势。不仅仅具有病人主索引系统中的结构化数据,PACS系统中还存在Dicom、JPG的文件,手术系统中还会有视频文件,用于病历中的XML文件也是医疗应用中重要的数据类型之一。
医疗大数据方案设计
对医疗数据的采集、存储、分析、展示是曙光医疗大数据方案的核心立足点。下图是曙光医疗大数据的设计模型:
该模型由大数据支撑平台及大数据应用平台构成。大数据支撑平台是医疗大数据应用的基础环境,利用大数据管理的手段对不同的基础硬件、基础软件、开发平台从架构上进行规划,从而满足医疗行业大数据应用平台的需求。大数据应用平台则通过建立一套信息化、标准化、智能化的决策支持应用系统,可方便医疗管理机构及医疗服务机构进行卫生管理和决策指导。曙光的医疗大数据系统主要为医疗卫生规划指导、监督管理、资源协调、疾病防控等方面提供服务。
大数据支撑平台
大数据支撑平台包括基础设施层、数据存储层、数据处理层、应用层以及管理层。
基础设施层由曙光专为大数据定制的服务器及网络构成的集群组成,是构建大数据应用的硬件平台。
数据源所涉及的对象包括医疗机构、社康、门诊,以及区公卫机构,医疗机构的HIS、LIS、PACS、CIS;社康HIS、CIS、CHSS以及公卫疾控系统、传染病上传系统等数据构成总体架构最基本数据源,数据源通过医疗机构、社康、公卫等的前置机进行采集,再通过前置机内置路由网关传输到数据平台,数据源层完成了各个分散系统的数据采集及传输。
数据存储层则基于曙光并行数据库系统以及曙光Hadoop发行版及标准数据库实现。用来存储从每个医疗数据源收集来的海量结构化和非结构化数据,
数据处理层对数据进行处理,其处理内容包含:数据清洗、数据校验、数据转换。处理对象包含标准数据及非标准数据,处理的数据结构包括非结构化数据、半结构化数据及结构化数据(如非结构化数据的简单分析–过滤和统计、基于计算模型进行结构化数据和非结构化数据的统一关联和统计处理、复杂的分析和挖掘以及复杂问题的近似模糊求解等操作)。被处理的数据最终转化成符合医疗卫生信息化标准的卫生综合数据,标准数经过ETL后存入医疗中心数据仓库,为大数据应用做数据准备。
数据应用层为大数据应用平台提供类型丰富的访问接口,包括Search API、Pig、Hive QL以及曙光专为用户设计的SJDBC(类JDBC)和UDF(用户自定义函数)接口,方便用户的使用。
曙光大数据支撑平台针对医疗行业大数据应用特点,采用多项曙光创新的结构化与非结构化数据一体化处理、并行处理、SQL/MapReduce统一执行引擎、分布式容错及自动故障处理、复杂数据类型关联分析、多IP通路负载均衡、处理任务断点执行、动态扩展等技术,从服务器、网络、操作系统到软件层逐层优化,保证系统具有高性能、高可靠、易扩展、易使用等特点,同时曙光为大数据支撑平台设计了图形化的统一管理系统,简化用户的管理和维护工作。
数据应用平台
曙光医疗大数据应用平台将医疗卫生数据中心仓库的数据经过ETL后,集中到数据集市,数据集市中的数据经过OLAP和数据挖掘分析引擎处理后,应用于大数据的报表展现、卫生数据统计、决策分析、数据挖掘、疾病预警、预测等。通过应用系统,提供给使用者直观展示。
其应用方向可包括医疗收入、患者负担、工作负荷、工作效率、疾病监控等多个主题。各主题分析都基于大数据技术构建,通过采集不同医疗机构业务系统数据,对各项医疗业务进行汇总统计、构成分析、对比分析、因素分析、增量函数分析等,并通过各种图表形象、直观的表达出来,能够有效的反映医疗管理机构或服务机构的整体运营、管理等情况。同时有利于管理层正确分析并做出有效决策,强化医卫管理,优化资源配置、控制不合理因素。
方案收益
该方案旨在建设一套信息共享化、决策智能化、管理科学化的医疗大数据应用系统。通过该系统,可以对治疗安全质量、医疗收入、患者负担、工作负荷、工作效率、疾病监控、在线监管等多个角度进行探索。其有效地将医疗质量安全目标分解到具体监控指标,通过管控指标的设置与分发,事中进行环节质控与监测,事后进行对标总结与PDCA持续优化改进,使医疗管理从被动型、粗放型的管理,转向前瞻性、主动性和精细化的管理。利用曙光的医疗大数据平台可以:
辅助科学决策:充分利用区域平台采集的大量医疗和卫生数据,采用先进的BI信息分析、挖掘、视图展示等技术,进行数据多维分析和挖掘,趋势、预测分析和规划,为各级政府部门的科学决策提供及时、准确、全面的信息支撑,同时提高对深化医疗卫生体制改革中各项任务实施情况的动态监测和宏观的调控能力;
实时、动态监管:改变以往人工统计报表和人工填报评估系统来监管和考核的方式,帮助政府卫生主管部门更科学地、更有效地实施规划、执行、监管等管理职能,对医疗机构进行实时和动态的监管;
医疗信息服务:为医疗科研和其他机构提供医疗卫生方面的数据分析、挖掘和信息共享服务。
优秀的报表:报表数据统计查询及时、快速,具备丰富的可视化表现形式(表,Dashborad , 仪表盘,驾驶舱,地图GIS),多维分析,可以跨系统异构;
高效可靠的性能:处理大批量数据不延迟,数据库查询快,对业务系统无影响,不会影响其他系统的使用或者瘫痪;支持多维数据结构,具有大量数据进行分布式处理功能,同时系统能自动升级,异构跨平台。