第三节资料的利用_现场流行病学-QQ阅读男生都市网

上QQ阅读APP看书，第一时间看更新

第三节　资料的利用

上述监测系统的建立、管理和评价均是为了将监测系统收集的数据转变为可靠的、可视化的实际应用资料。这一过程的实现需要一系列严谨的科学分析方法。唯有如此，才能确保最后的分析结果能够客观地指导政府机构及相关部门及时制订相关的策略和措施，防制疾病/事件的发生或减少因疾病/事件带来的损失。

一、监测资料的分析

任何资料的分析都需要基于一套详细、可行的分析方案。公共卫生监测资料的分析也不例外，制订分析策略与方案是资料分析的前提。当然，基本的分析思路往往在监测系统建立初始已基本明确，后续的分析方案主要是将之前的分析思路具体化。

（一）公共卫生监测资料分析计划的制订

良好的分析方案是保证可靠的分析结果的前提，也是分析结果应用于实际的保证。一般来说，公共卫生监测资料的分析计划主要包括以下几方面。

1.明确数据来源、数据内容和数据类型

分析者应对拟分析的数据进行详尽了解，包括数据来源、数据收集途径、数据变量数、变量类型、可供分析变量情况等信息，建立分析所需的数据库。

2.确定分析目的

简要交代该监测资料分析的目的，即为什么分析。

3.选定分析方法

根据分析目的，在数据库中提炼分析指标，明确分析的结局变量和分析所用的统计方法，即分析什么和用什么分析。

4.预期分析结果

预期可能得到的分析结果，设计填写结果所需的表格。

5.撰写分析提纲

将上述四方面内容转化为具体的文稿，制订可行的时间进度安排，并对分析方案的可行性和创新性进行评价。

（二）公共卫生监测资料分析方法

公共卫生监测资料经收集、整理后，其分析方式一般包括对数据资料的描述性分析及对未来发展趋势的预测预警分析。前者通过现有的监测资料描述疾病/事件在不同时间、空间、人群的分布，揭示疾病/事件随着时间推移在不同人群或地区的发生规律。后者通过对现有疾病/事件资料的分析评估，预测该类疾病/事件未来的流行水平和发展趋势。尽管分析目的不同，但两者所用的指标较为一致，主要包括发病率、死亡率、病死率等疾病频率指标。

1.描述分析

现状描述疾病事件在不同时间、不同地区和不同人群的存在状态及分布特点是描述性分析的重要内容，为形成病因假设、探索影响因素提供基础数据和线索。

（1）疾病在不同时间的分布：

流行病学中，疾病的时间分布可以从短期波动、周期性、季节性和长期变异等4个方面进行描述。公共卫生监测作为流行病学的重要内容，其资料的时间分布描述也可从这些方面入手。描述的形式多种多样，但一般而言，仍以作图法最为直观、形象。

首先，通过已收集的监测资料计算疾病/事件在某时间范围内的发生频率。该时间段可以是年、月、日，甚至是时，具体时间跨度的选择可视资料收集量和收集时间而定。随后，将计算所得的数据转变为形象化的图表，如直方图、线图、半对数线图等。分析者可从图表中观察疾病/事件随时间的分布规律和变化趋势，以便及时总结和反馈。以上是公共卫生监测资料时间分布描述最为基础的过程。除此以外，时间描述中也会运用一些较为复杂的统计方法，如圆分布资料分析方法、Cox-Staurt趋势检验等。

图7-1是北京市1951—2011年连续60年的麻疹监测数据的时间分布描述。利用每年的发病率和发病数资料，并结合直条图与折线图，分析者形象地向公众展示了60年间北京麻疹的发病趋势。周期性方面，在1951—1965年，北京每2～3年出现麻疹发病率的小高峰。长期趋势方面，北京总体的发病率呈下降趋势，但自2005年起，麻疹疫情又出现回升。尽管该图没有表现麻疹冬春季高发的季节性特点，但不难想象，只要逐年绘制出麻疹发病率的线图就可以获知此信息。

图7-1　北京市1951—2011年麻疹发病数与发病率

（2）疾病在不同空间的分布：

公共卫生监测资料的空间分布描述过程基本与时间描述类似。首先仍是发生频率的计算，但空间分布描述计算的频率为分地区的频率，如不同国家、不同地区、城乡之间的发生频率。其次，作图将数据形象化，但空间描述的图一般以地图为雏形、以重点标注不同区域为主要表现形式，即常见的点图和片图等。GIS等较为复杂的技术也常应用其中。通过一系列计算和图形的观察，分析者可获取疾病/事件的相对高发区域和相对低发区域等信息，为随后探索高发、低发的影响因素奠定基础。

基于相同的公共卫生监测系统，同一监测疾病/事件在我国不同地区的分布存在明显差异。据中国2013年法定报告传染病发病数据分析，海南、广东和广西等地的肠道传染病发病率高于其他地区，新疆、宁夏、青海、贵州和西藏等地的呼吸道传染病发病率高于其他地区，而动物源性传染病发病率以内蒙古、新疆、山西、黑龙江和宁夏等地较高。图7-2为2013年中国经血与性传播传染病发病率的地区分布，发病率较高的地区包括新疆、青海、广东和福建。

图7-2　中国2013年经血与性传播传染病地区分布

（3）疾病在不同人群的分布：

疾病的人群分布特征包括性别、年龄、职业、种族、民族、婚姻状况、行为生活方式、宗教信仰和户籍情况等。利用公共卫生监测资料，分析疾病/事件在人群中的分布特征，有利于发现高危人群和易感人群，为提出针对性的防治措施提供依据。

相较时间、空间的描述方法，公共卫生监测资料的人群分布描述方法也大致相同。根据不同的人群特征计算相应的发生频率指标后，分析者可绘制图表并观察其中的分布规律。值得一提的是，年龄分布的分析方法包括横断面分析和出生队列分析。但是，常规的公共卫生监测资料收集时间有限，出生队列分析往往无法进行，因此年龄分布仍以横断面分析为主。

例如，结核病监测资料的横断面分析结果显示（图7-3），2005—2012年安徽省结核病患者男女性别比为2.75∶1，且主要为15岁以上人群，约占总患者的99.47%。随着年龄段增加，患病率也呈现增长，以65～74岁人群患病率最高。人群的职业分布方面，以农民、工人和学生居多，分别占了76.22%、5.13%和3.60%。

图7-3　安徽2005—2012年结核病患者分布

多数情况下，仅对时间、空间和人群某一因素的描述往往只能发现疾病/事件单方面的变化规律，在实际应用中，常需要将其中的两者，甚至三者综合考虑。如图7-4所示，2010—2012年全球各国的霍乱发病数存在明显的差异，不仅同一年份不同国家的发病情况不同，而且同一国家不同年份的发病趋势也不尽相同。

图7-4　全球2010—2012年霍乱发病数

A.2010年；B.2011年；C.2012年

2.预测与预警

疾病事件的预测与预警均是基于现有监测资料对未来疾病/事件的发生情况与发展趋势做出判断与描述。尽管两者在概念上有相似之处，但在实际应用中却存在差异。预警一般针对的是特定的疾病/事件，要求及时性越早越好，即预警信号一旦发出，意味着该疾病/事件可能发生或正在发生，且需要立即采取防制措施。由于对及时性的要求，预警方法要求简单、快速，其结果通常是定性的，主要起警示作用。预测不同于预警，是通过复杂的预测模型对疾病/事件未来的发生水平与发生趋势进行定量的分析，指导防治规划的制订。根据预测的时间长度，可将其分为短期预测（1～2年）、中期预测（3～4年）和长期预测（5～10年）。

（1）疾病的预警：

疾病的预警可分为单纯病例预警和数学模型预警。前者指某些罕见或具有重要公共卫生意义的疾病在某地出现后，当地有关卫生部门即可提出预警。例如，我国传染病防治法规定的甲类或按甲类管理的传染病出现，即可预警。后者指基于现有的监测资料（疾病/事件的历史发病资料和疾病影响因素资料），利用数学模型计算预警线，如基于时间维度的预警模型（控制图法、移动百分位数法、移动平均控制图法、指数加权移动平均法、累积和控制图等）、基于时间和空间维度的预警模型（如前瞻性时空重排扫描统计量、时空扫描统计量等）。

根据广西、湖南、辽宁、福建和上海的366个县级市1998—2003年的7种传染病月报数据，有研究者采用控制图法建立预警模型，即选择既往5年（1998—2002年）某疾病固定观察月及其前后1个月的发病率数据（共15个）作为基线数据，计算指定的百分位数（P ₅₀、P ₆₀、P ₆₅、P ₇₀等）并将其作为候选的预警界值。根据这些预警界值，对2003年该传染病疫情进行分县、分月预警。同时，采用专家咨询法确定的流行参照标准及2003年的历史数据判断该县该月该病是否流行，从而计算各候选预警界值的特异度、灵敏度和阳性预测值等指标，绘制ROC曲线，比较各候选界值的预警功效，从中选择最为合适的预警界值。结果显示，出血热、痢疾、甲型肝炎、乙脑和疟疾合适的预警界值为P ₈₀，麻疹、肺结核合适的界值为P ₉₀。

（2）疾病的预测：

疾病的预测方法主要依靠数学模型的计算。根据利用的现有资料不同，选取的预测模型也存在差异。若基于疾病/事件的历史发病水平资料进行预测分析，则可采用时间序列分析法；若基于疾病/事件的影响因素资料进行预测分析，则可采用聚类分析、回归分析、判别分析、决策树分析、神经网络技术等多元分析方法。

基于2008年4月—2012年12月杭州市上城区的手足口病监测资料，分析者采用时间序列分析方法，构建了ARIMA模型，并以此模型计算2013年的月发病率。经比较，2013年手足口病月发病实际值与预测值的平均误差为26.86%，且实际值均在95%置信区间内，模型拟合效果较理想。之后，采用该模型预测2014年的月发病率和年发病率，其中年发病率为74.50/10万。

此外，利用已收集的高血压危险因素的资料，分析者可选用神经网络技术构建高血压患病预测模型。如对河南某农村社区年龄35～78岁的8914名常住人口进行问卷调查和体格检查，收集高血压危险因素的有关资料。按3∶1将该人群分为训练集和检验集，分别用于筛选变量、建立模型和评价模型。基于训练集的数据，模型初步建立，其输入变量包括文化程度、饮酒、蔬菜水果摄入、饮食咸淡、体力活动、静息活动时间、脉压、体重指数和家族史等9个因素。基于检验集的数据，模型预测效果理想，灵敏度和特异度均较高。

二、监测资料的用途

公共卫生监测资料的利用是公共卫生监测目的的具体体现，是在详细收集、科学分析监测信息的基础上，建立信息反馈渠道，将定量或定性的研究转变为实际可操作的决策和措施。

公共卫生监测资料的基本用途包括：定量评估疾病/事件等健康问题的重要性，确定当前主要的公共卫生问题，并对其分布、发展趋势进行描述和预测；描述疾病自然史、确定危险因素、高危人群以及制订公共卫生计划；评价预防控制措施的实施效果，如根据人群免疫水平监测可评价疫苗接种效果；尽早发现疾病/事件的流行和暴发，以便及时采取防控措施；估计公共卫生服务的需求，合理配置卫生资源等。

目前我国大部分公共卫生监测系统主要都针对特定的疾病/事件，各系统间相互独立、信息难以共享，因此，可供分析的信息来源和信息资源相对较局限；此外，被动监测依然是监测的主要形式，难免存在不少的漏报现象，重大疾病的报告往往有延迟；尽管我国死亡监测系统已初步建立，但死亡登记仍然不全，基本健康统计资料甚为缺乏；监测人员分析数据能力不足，将信息转化为决策行为周期较长。

本周热推：

抗击新型冠状病毒肺炎医务人员临床防护培训手册公众卫生应急技能手册医院感染护理工作指南血吸虫病护理健康教育手册流感居家防护手册