admin 管理员组

文章数量: 1086019


2024年5月1日发(作者:汇编语言指令验证)

重庆大学研究生文献综述

对医疗大数据的认识

姓 名:

学 号:

指导教师:

专 业:

重庆大学光电工程学院

二O一六年十一月

1 医疗大数据产生的背景

在任何一个初具规模的医院,每天接待上万的患者前来就诊,患者的基本信息、影像信息

与其他特殊诊疗信息汇集在一起是一个庞大的数据。据统计,上海市区域医疗信息平台(上海

市“医联工程”及县区卫生数据中心)已经积累了覆盖3900万人群、1400TB数据量的电子

诊疗与健康档案等医疗卫生数据(涵盖了全市38家三级医院3900万就诊人群的医疗信息,

包括患者基本信息、就诊信息、健康档案、检验及影像检查报告、医学影像图像文件、住院相

关病历、医保结算等医疗卫生数据,涉及就诊记录2.1亿条,处方记录9.1亿条)。

日积月累,这个数据量将会持续快速增长,为医院的数据存储、集成、调用等应用带来巨

大压力。除了数据规模巨大之外,医疗行业的数据类型和结构极其复杂,如PACS影像、B超、

病例分析等业务产生的非结构化数据,这些数据存储复杂,并且对传统的处理方法和技术带来

巨大挑战

【1】

。医疗大数据得到人们的关注,并渴望有一种新的技术可以从这些看似杂乱无章的

数据中得到价值。目前,为了提高人们的健康水平以及医疗水平,医疗行业在大数据环境下的

各个领域异常活跃

[2]

2 医疗大数据的相关概念

2.1 医疗大数据的定义

医疗数据是医生对患者诊疗和治疗过程中产生的数据,包括患者基本数据、入出转数据、

电子病历、诊疗数据、医学影像数据、医学管理、经济数据等,以患者为中心,成为医疗信息

的主要来源。

随着医疗卫生信息化建设进程的不断加快,医疗数据的类型和规模正以前所未有的速度快

1

速的增长,以至于无法利用目前主流软件工具,在合理的时间内达到撷取、管理并整合成为能

够帮助医院进行更积极目的经营决策的有用信息。规模巨大的临床实验数据、疾病诊断数据以

及居民行为健康数据等汇聚在一起形成了医疗大数据。

2.2 医疗大数据的主要来源

2.2.1 制药企业、生命科学

药物研发所产生的数据是相当密集的,对于中小型的企业也在百亿字节(TB)以上的。在

生命科学领域,随着计算能力和基因测序能力逐步增加,美国哈弗医学院个人基因组项目负责

人詹姆·鲍比就认为,到2015年,将会有5000万人拥有个人基因图谱,而一个基因组序列文

件大小约为750MB

[3]

2.2.2 临床医疗、实验室数据

临床和实验室数据整合在一起,使得医疗机构面临的数据增长非常快,一张普通CT图像

含有大约150MB的数据,一个标准的病理图则接近5GB。如果将这些数据量乘以人口数量和

平均寿命,仅一个社区医院积累的数据量就可达数万亿字节甚至数千万亿字节(PB)之多。

2.2.3 费用、医疗保险、利用率

患者在就医过程中产生的费用信息、报销信息、新农合基金使用情况等。

2.2.4 健康管理、社交网络

2

随着移动设备和移动互联网的飞速发展,便携化的生理设备正在普及,如果个人健康信息

都能连入互联网,那么由此产生的数据量将不可估量。

2.3 医疗数据的基本类型

2.3.1 医院信息系统(HIS)数据

HIS是医院的核心系统,是对医院及其所属各部门的人流、物流、财流进行综合管理的系

统,围绕着医疗活动的各个阶段产生相关数据,包括各门诊数据及病房数据两大主流数据流。

2.3.2 检验信息系统(LIS)数据

LIS是HIS的一个重要组成部分,其主要功能是将实验仪器传出的检验数据经分析后,生

成检验报告,通过网络存储在数据库中,使医生能够方便、及时的看到患者的检验结果。

2.3.3 医学影像存档和传输系统(PACS)数据

PACS数据主要是将数字化医院影像科室日常核磁、CT、超声、各种X线机、各种红外仪

等设备产生的图像存储起来。

2.3.4 电子病历(EMR)数据

EMR不同于以医疗机构为中心的门诊或者住院病历,是真正以患者为中心的诊断和其他检

验数据的“数据池”,它将患者诊断过程中生成的影像和信号,如X线检查、CT扫描等纳入电

子病历中,并以统一的形式组织起来。

3

2.4 医疗大数据的特性

2.4.1 数据规模大(volume)

例如一个CT图像含有大约150MB的数据,而一个基因组序列文件大小约为750MB,一

个标准的病理图则大得多,接近5GB。

2.4.2 数据结构多样(variety)

相对于其他行业,医学中的数据类型更加多种多样,如电子病案中关于人口学特征的数据

为纯文本型;检验科中有关患者生理、生化指标为数字型;影像科中如B超、CT、MR、X线

片等为图像资料。

医疗数据通常会包含各种结构化表、非(半)结构化文本文档(XML和叙述文本)、医疗

影像等多种多样的数据存储形式。

2.4.3 数据增长快速(velocity)

一方面,医疗信息服务中包含大量在线或实时数据分析处理,例如,临床决策支持中的诊

断和用药建议、流行病分析报表生成、健康指标预警等;另一方面,得益于信息技术的发展,

越来越多的医疗信息被数字化,因此在很长一段时间里,医疗卫生领域数据的增长速度将依然

会很快。

2.4.4 数据价值巨大(value)

4

毋庸置疑,数据是石油,是资产,是资源,医疗大数据不仅与每个人的个人生活息息相关,

对这些数据的有效利用更关系到国家乃至全球的疾病防控、新药品研发和顽疾攻克的能力。

2.4.5 多态性

医疗大数据包括纯数据(如体检、化验结果)、信号(如脑电信号、心电信号等)、图像(如

B超、X线等)、文字(如主诉、现/往病史、过敏史、检测报告等),以及用以科普、咨询的动

画、语音盒视频信息等多种形态的数据,是区别于其他领域数据的最显著特征。

2.4.6 不完整性

医疗数据的搜集和处理过程经常相互脱节,这使得医疗数据库不可能对任何疾病信息都能

全面反映。大量数据来源于人工记录,导致数据记录的偏差和残缺,许多数据的表达、记录本

身也具有不确定性,病例和病案尤为突出,这些都造成了医疗大数据的不完整性

2.4.7 时间性

患者的就诊、疾病的发生过程在时间上有一个进度,医学检测的波形、图像都是时间函数,

这些都具有一定的时序性。

2.4.8 冗余性

医学数据量大,每天都会产生大量信息,其中可能会包含重复、无关紧要甚至是互相矛盾

的记录。

5

3 医疗大数据的主要应用

根据全球管理咨询公司麦肯锡的一份最新报告显示,医疗保健领域如果能够充分有效地利

用大数据资源,医疗机构和消费者便可节省高达4500亿美元的费用

[4]

3.1 服务居民

居民健康指导服务系统,提供精准医疗、个性化健康保健指导,使居民能在医院、社区及

线上的服务保持持续性。例如,提供心血管、癌症、高血压、糖尿病等慢病干预、管理、健康

预警及健康宣教(保健方案订阅、推送)。

医疗机构物联网的建设,包括移动医疗、临床监控、远程患者监控等(例如,充血性心脏

的标志之一是由于保水而增加体重,通过远程监控体重发现相关疾病,提醒医生及时采取治疗

措施,防止急性状况发生),减少患者住院时间,减少急诊量,提高家庭护理比例和门诊医生

预约量。

3.2 服务医生

临床决策支持,如用药分析、药品不良反应、疾病并发症、治疗疗效相关性分析、抗生素

应用分析;或是制定个性化治疗方案。

3.3 服务科研

包括疾病诊断与预测、提高临床试验设计的统计工具和算法、临床实验数据的分析与处理

等方面,如针对重大疾病识别疾病易感染基因、极端表型人群;提供最佳治疗路径。

6

3.4 服务管理机构

规范性用药评价、管理绩效分析;流行病、急病等预防干预及措施评价;公众健康监测,

付款(或定价)、临床路径的优化等。

3.5 公众健康服务

包括危及健康因素的监控与预警、网络平台、社区服务等方面。

4 国内外医疗大数据技术应用现状

4.1 国外医疗大数据技术应用现状

美国远程医疗(telemedicine)公司研制成功了一款功能强大的医疗设备“智能心脏”

(smartheart),把手机变成了一款功能齐全的医疗工具,用来监测用户可能存在的心脏病问

题。智能心脏与智能手机相连,在安装运行了相应的程序后,手机拥有“医疗级”的心脏监测

功能,并能够在30s内在手机屏幕上显示用户的心电图。医生可随时对患者的心脏进行监测和

分析,提前做好预防措施。智能心脏解决了心脏病预防方面最关键的问题—时间。这在心脏病

预防领域是一项重大的突破性技术。目前,“智能心脏”设备已经开始在网上销售。

意大利电信近期推出了Nuvola It Home Docto 系统,可让在都灵Molinette 医院的慢

性病患者通过手机在家中监测自己的生理参数,相关数据将自动的通过手机发送到医疗平台,

也可以通过ADSL、WiFi 和卫星网络得到应用。医生通过网页接入这个平台,及时获取数据并

调整治疗方案。

7

4.2 国内医疗大数据技术应用现状

IBM在上海的部分医院推出了BYOD系统,即员工自费终端,用来提高医生和护士在

医院的移动性。通过和开发商合作,推出移动护理应用,将医生和护士的各种移动终端连在同

一网络下,便于医生和护士了解患者在医院的位置和健康状况,也提高了医生和护士的移动性。

在上海,医联工程横向覆盖全市三级医院,纵向连通各区属医疗机构,已覆盖3900万患

者,建成国内最大的患者诊疗档案库,拥有8.2亿条医嘱、1.8亿个病案、8100万份检验检查

报告和107太字节医学影像数据;医联工程在服务医改、支撑资源整合、分布式影像网络会诊、

三级医院诊疗信息社区调阅等方面,大幅度提升了区域卫生服务水平。

医联工程建成以来,对于患者,就医更方便,“一院办卡,跨院就医”“就医一站式付费”,

共发放1300余万张医联卡,每月提供70万专家预约号源,人均节约就诊时间60min、排队

时间45min;对于医生,服务看诊、提高医疗质量,支持每日5000人次实时诊疗档案调阅、

1.25万人次重复医疗智能提醒,节约大量医疗费用;对于管理者,实现精细化管理,建成集医

疗管理、绩效考核和统计分析为一体的整合平台,为医院管理提供决策支持。

5 医疗大数据安全

5.1 人的安全

医疗大数据安全中“人”的安全,涉及的是数据隐私保护问题。在医疗过程中,患者的个

人隐私主要有:在体检、诊断、治疗、疾病控制、医学研究过程中涉及的个人肌体特征、健康

状况、人际接触、遗传基因、病史病历等

[5]

。这些内容还能被分为显性与隐性,显性一般是医

嘱、诊断书、X线片、检查结果、报告单、病历、病案、住院患者床头卡等数据;隐性则是指

8

蕴藏在这些数据历的信息,如患者血液组织所蕴含着的基因信息,患者罹患疾病所反应出的生

活方式或者折射出的家族遗传历史等。

5.2 数据安全

一是易成为网络攻击的显著目标,在网络空间中,医疗大数据的关注高,其中含有的敏感

数据会吸引潜在的攻击者;二是对现有存储或者安全防范措施提出挑战,特别是数据大集中后

复杂多样的数据存放在一起,常规的安全扫描手段无法满足安全要求。这些问题将表现在数据

资源共享、数据资产界定和盘活,以及数据真实性判断等各个方面。

6 医疗大数据的未来展望

6.1 社会化医学

曾任美国克利夫兰医学中心(Cleveland Clinic)心血管科主任的美国心脏病学家埃里克·托

普(Eric Topol),新近出版了一本名为《颠覆医疗》

[6]

的书,在此书中他认为:互联网的沉浸

式和参与式文化培育了消费者,“每10个美国人中就有超过8位在网络上查询与健康相关的问

题”,甚至有的“患者会自带着一系列摘自网络的医学问题”去访问医生,对自身病情、疾病

和药物的知悉程度较过去高出很多,与此同时,医生的权威性大幅度降低。由此可见,这就是

未来的趋势—社会化医学。

6.2 个性化医学

个性化医疗,是指以个人基因组数据位基础,结合蛋白质组和代谢组等相关内环境数据,

考察遗传变异、对特定疾病的易感性和对特殊药物的反应的关系,为患者量身设计出最佳治疗

9

方案,以期达到治疗效果最大化和副作用最小化的定制医疗模式。实施个性化医疗,首先针对

特定疾病亚群进行分类,然后根据这些亚群的特异性发病机制进行药物开发,最终对这些亚群

患者进行针对性治疗。这些涉及医学、生物、环境、社会和心理等诸多因素,传统的数据分析

技术会遭遇瓶颈,很难以开展针对性研究,故而引发了大数据技术的介入。在现有研究中,通

过对医疗大数据的分析和利用,可以完善个性化医疗。较著名的是德国默克公司正与

Regenstrief研究院一起实施的个性化医疗项目。考察遗传变异、对特定疾病的易感染性和对

特殊药物的反应三者之间的关系,然后在药物研发和用药过程中考虑个人的遗传变异因素。针

对不同的患者采取不同的治疗方案,或者根据患者的实际情况调整药物剂量,可以减少副作用。

7 总结

根据国际数据公司(International Data Corporation, IDC)的预测,中国的大数据市

场在2012~2016年将增长5倍,其中最多份额将集中在政府、银行、医疗卫生、电信等四大

行业

【7】

。医疗行业的数据已进入大数据时代,使用大数据库作为工具,将会辅助产生更有效、

更加经济的医疗政策,更好的产品和服务

[8]

医疗大数据为我国带来了机遇的同时也带来了挑战,

虽然只是刚刚起步,但是前景还是值得期待的。

10

参考文献

[1](于广军 杨佳泓主编 医疗大数据 上海科学技术出版社P14)

[2](Kayyali B,Knott D, Van Kuilen S. The big-data revolution in US health care:

Accelerating value and innovation[J]. Mc Kinsey & Company,2013)

[3](David Marco,John Wiley. Building and managing the meta data repository: a

full lifecycle guide[M]. New York: John Wiley & Sons Inc,2000)

[4](Kayyali B,Knott D, Van Kuilen S. The big-data revolution in US health care:

Accelerating value and innovation[J]. Mc Kinsey & Company,2013)

[5](汤啸天.个人健康医疗信息和隐私权保护[J].同济大学学报:社会科学版,2006,17(3):

117-123)

[6](/h/2562/)

[7](Inmon W. Building the data warehouse[M]. 3rd ed. New York: John Wiley &

Sons Inc,2002)

[8](郭晓科主编 《大数据》 清华大学出版社 p22)

11


本文标签: 数据 医疗 患者 信息 医院