上QQ阅读APP看书,第一时间看更新
2 大数据与重症医学
大数据(big data)是信息化发展到一定阶段的产物,它将大量变量间的关系数据化;人们可以利用一些全新的工具来获取、分析这些数据,从而优化管理、改善结果 [1]。目前,大数据已经应用到社会的各个方面。2011年5月麦肯锡全球研究所发表专门研究报告,首次提出了“大数据时代”这一全新概念。2012年2月,纽约时报发表《大数据时代( The Age of Big Data)》一文,宣告大数据时代的到来。
一、什么是大数据
对于大数据,研究机构Gartner给出了这样的定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据与过去传统意义上“数据”的区别在于过去我们说的“数据”很大程度上是指“数字”,是可以进行编码的简单文本,这些数据分析起来相对简单,过去传统的数据解决方案(如数据库或商业智能技术)就能轻松应对。而今天我们所说的“大数据”则不单纯指“数字”,还包括文本、图片、音频及视频等多种格式。专业的概括就是,数据是结构化的,而大数据则包括了结构化数据、半结构化数据和非结构化数据。以前保存的数据类型主要是结构化数据。然而,并非所有的数据都是可以结构化的,据统计,可结构化数据——即可以存储在数据库等传统系统(主要是指关系型数据库产品)中的数据占数据总量的20%左右;其他80%的数据不能或是不便于存储于传统的系统中,因为其结构形式是非结构化的或者是半结构化的。
大数据的来源:①传感器数据,分布在不同地理位置上的传感器对所处环境进行感知,不断生成数据。②网站点击流数据,用户在网上的每个点击及其时间都被记录下来,利用这些数据,服务提供商可以对用户存储模式进行仔细的分析,从而提供更加具有针对性的服务。③移动设备数据,包括移动电话、PDA和导航设备等,我们可以获得设备和人员的位置、移动、用户行为等信息。④射频ID(RFID)数据,RFID可以嵌入到产品中,实现物体的跟踪。
大数据具有以下特点(4个“V”):volume(数据体量大)、variety(数据类型繁多)、velocity(处理速度快)、value(价值密度低) [2]。大数据具有3个特征:①全样而非抽样,在过去,由于缺乏获取全体样本的手段,人们发明了“随机调研数据”的方法。有了云计算和数据库以后,获取足够大的样本数据乃至全体数据,就变得非常容易。②效率而非精确,这其实是建立在第1点的基础上。过去使用抽样的方法,需要在具体运算上非常精确,因为“失之毫厘,谬以千里”。但全样本时,有多少偏差就是多少偏差而不会被放大。诺维格认为,大数据基础上的简单算法比小数据基础上的复杂算法更加有效。数据分析目的并非是数据分析,而有其他用途,故而时效性也非常重要。精确的计算是以时间消耗为代价的,但在小数据时代,追求精确是为了避免放大的偏差而不得已为之。但在样本=总体的大数据时代,“快速获得一个大概的轮廓和发展脉络,就要比严格的精确性要重要得多”。③相关而非因果,相关性表明变量A和变量B有关,或者说A变量的变化和B变量的变化之间存在一定的正比(或反比)关系。但相关性并不一定是因果关系(A未必是B的因)。
二、大数据与重症医学
大数据的核心是预测,大数据能够提高公共卫生工作人员对传染病疫情的追踪和响应能力、对疾病早期预警信号的发现能力,以及对诊断性检测方法与治疗方法的研发能力。大数据可以使我们深入了解疾病的病因和结局,为精准医学寻找更好的药物靶点,并且提高疾病的早期预测和预防能力,从而促进健康。
大数据对重症医学有着非常重要的意义。近10多年来,我国重症医学的发展迅猛,成绩斐然,但是仍然存在很多问题,需要进一步研究解决。例如,在临床工作中有时很难提前预测哪些重症患者会发生感染性休克、急性呼吸窘迫综合征,甚至死亡。这主要是因为ICU医师做出的判断,很多时候是基于目前研究基础形成的指南和本人的临床经验。但是我们经常忽略了ICU处置环境的复杂性以及各种变量的易变性。例如在评估患者的心肺功能、感染、急性肺损伤等疾病状态的基础上,除外药物或一些支持设备的影响,不同患者对于上述应激会做出不同的反应。再比如平均气道压是我们在ICU经常监测的参数,它由多种因素决定,包括气道阻力、肺和胸廓的顺应性、潮气量、呼气末正压、吸入气流方式、自主呼吸努力,以及人工气道的特征等。如果在ICU中我们不能很好地考虑多种因素的关联性及复杂性,我们将无法正确判断一个数值代表的最大意义,更谈不上利用数据去指导医师做出判断。有了大数据,根据数据库里复杂的信息和患者目前的实际监测指标,例如血压、心率、CVP、心输出量、尿量等参数可以判断患者输液后的反应如何,是否需要液体复苏治疗。最重要的是,在相应模型建立后,我们可以根据这些数据信息预测哪些患者会发展至重症或者出现多器官功能衰竭,借此提前采取干预措施 [3],甚至我们可以预测ICU患者的死亡率 [4]。大数据还可以全面分析患者的特征和疗效数据,比较各种措施的有效性。将医师的处方与医学指导比较,提醒医师防止出现潜在的错误(如药物不良反应),还可以提高医疗数据透明性,帮助患者选择高性价比的治疗方案。
除了临床工作外,大数据对重症医学的科研也影响巨大,这主要体现在以下几个方面:①由于各种条件限制,既往有很多关于重症医学的研究样本量较少,即便是多中心协作,也难以代表全部个体。因此根据这种研究总结出来的结论就不具有普遍性。大数据恰恰相反,其本质就是让所有的数据说话。换言之,大数据不再依赖既往的抽样研究,而是归纳所有的数据。这是一种思维变革,在信息技术不发达的时代是难以想象的。②降低研究成本。很多时候,我们的研究都是各自为政。为了研究自己的课题,收集各自的资料,这导致资料本身具有局限性,还造成大量人力及物力的浪费。如果事先把每一个个体临床事件收集和整理,组成一个数据库,借此资源共享,可以最大限度地避免重复浪费。
三、大数据在重症医学中的应用现状
在世界上有些国家,大数据已经被应用到了重症医学领域并取得了一定效果。有的国家已经建立了一些商业性或者非营利性的ICU数据库。这些数据库建立的目的首先是评估和比较ICU患者病情严重程度、预后和治疗花费。例如在澳大利亚和新西兰建立的非营利性的数据库已经包含了超过900 000人次的ICU住院患者的信息 [5]。另外,商业性的Philips eICU,可以提供远程重症医疗支持,从180多家参与的ICU中,收集存档了超过1 500 000例ICU入住患者的信息,而且以每年400 000例的速度增加。在过去的10年里,由Beth Israel Deaconess Medical Center和Philips Healthcare的实验室在美国生物影像和生物信息协会的资助下,联合建立了重症医学多参数智能监测数据库(MIMIC),目前记录了超过40 000例ICU住院患者的信息,这些信息都可以免费在线查阅 [6]。MIMIC也是目前唯一能精确到每一分钟患者生理指标和实时治疗等情况的数据库。
除了数据库的建立,对于数据库的应用也开展了很多研究,并指导临床应用。Gregory Boverman等 [7]利用MIMIC-Ⅱ中的数据,建立了一套模型。该模型包含了年龄、分钟通气量、呼吸频率等参数,以预测机械通气超过48小时的ICU患者在机械通气第二个12小时内的死亡率。国内Zhang Z等利用MIMIC-Ⅱ中的数据,发表了数篇关于尿量及钙离子与危重症患者预后的文章 [8,9]。Laura C McPhee [10]等通过Philips eICU平台收集了741 036名患者资料,研究结果显示单剂量依托咪酯不增加ICU中脓毒症患者的死亡率。
在建立数据库和利用相关数据进行研究时,还要考虑到保护患者的个人隐私。Janko等 [11]就完善数据库建立,加强制度管理,兼顾数据保存和个人隐私方面做了详细的说明。
相比较而言,我国重症医学领域对于大数据相关技术的应用还较少,还处于起步阶段。但实际上我们每天做的日常医疗工作都与大数据有关。比如国内医院普遍应用的电子病历系统(electronic medical record,EMR),包含了每一个住院患者的化验、治疗等信息,这些信息可以随时调取。EMR是我们进一步归纳、整理、利用这些数据的基础,其应用前景广阔。以EMR为平台的研究正在开展,例如浙江金华市中心医院已经开始建立类似的数据归纳,尽管例数还较少 [12]。
四、展 望
现代信息技术的发展促进了大数据概念的形成,云计算、互联网、物联网、移动终端等使大数据理论逐渐变成现实。在重症医学领域,大数据可以充分利用所有患者信息的价值,带来一场重症医学的革命性变革。当然,大数据时代带给我们的既有机遇,也有困难和挑战。但是,临床数据信息化和平台化必定是未来重症医学的发展趋势,大数据时代下的重症医学必将迎来更辉煌的明天!
(王春亭 王鹏 刘春利)
参考文献
1.Moore KD,Eyestone K,Coddington DC. The big deal about big data. Healthc Financ Manage,2013,67(8):60-6,68.
2.McAfee A,Brynjolfsson E. Big data:the management revolution. Harv Bus Rev,2012,90(10):60-68.
3.Bates DW,Saria S,Ohno-Machado L,et al. Big data in health care:Using analytics to identify and manage highrisk and high-cost patients. Health Aff(Millwood),2014,33(7):1123-1131.
4.Yun Chen,Hui Yang. Heterogeneous postsurgical data analytics for predictive modeling of mortality risks in intensive care units. Conf Proc IEEE Eng Med Biol Soc,2014,4310-4314.
5.Stowa PJ,Hart GK,Higlett T,et al. ANZICS Database Management Committee. Development and implementation of a high-quality clinical database:the Australian and New Zealand Intensive Care Society Adult Patient Database. J Crit Care,2006,21:133-141.
6.Saeed M,Villarroel M,Reisner AT,et al. Multiparameter Intelligent Monitoring in Intensive Care Ⅱ:a publicaccess intensive care unit database. Crit Care Med,2011,39:952-960.
7.Boverman G,Genc S. Prediction of mortality from respiratory distress among long-term mechanically ventilated patients. Conf Proc IEEE Eng Med Biol Soc,2014,4:3464-3467.
8.Zhang Z,Xu X,Ni H,et al. Urine output on ICU entry is associated with hospital mortality in unselected critically ill patients. J Nephrol,2014,27(1):65-71.
9.Zhang Z,Xu X,Ni H,et al. Predictive value of ionized calcium in critically ill patients:an analysis of a large clinical database MIMIC Ⅱ. PLoS One,2014,9(4):e95204.
10.McPhee LC,Badawi O,Fraser GL,et al. Single-dose etomidate is not associated with increased mortality in ICU patients with sepsis:analysis of a large electronic ICU database. Crit Care Med,2013,41(3):774-783.
11.Ahlbrandt J,Brammen D,Majeed RW,et al. Balancing the need for big data and patient data privacy--an IT infrastructure for a decentralized emergency care research database. Stud Health Technol Inform,2014,205:750-754.
12.Zhang Z. Big data and clinical research:focusing on the area of critical care medicine in mainland China. Quant Imaging Med Surg,2014,4(5):426-429.