骨科循证医学
上QQ阅读APP看书,第一时间看更新

第2章 循证医学的证据

循证医学中的“证”就是对临床研究的文献,应用临床流行病学的原则和方法,经过认真的分析和评价,获得新近的最真实可靠且有重要临床应用价值的研究成果。临床研究证据主要包括病因、诊断、预防、治疗、康复和预后等方面的研究。证据是循证医学的核心,临床医师要想从海量的医学信息中快速准确地获取循证医学的证据,必须依赖相应的技术、方法和手段。对循证医学证据的分类分级以及对循证医学证据资源的认识是获取证据的基础。

(一)证据的分类

临床研究证据种类繁多,根据研究和应用的不同特点和需求划分。

1. 按研究问题的不同分类 分为病因临床研究证据、诊断临床研究证据、预防临床研究证据、治疗临床研究证据和预后临床研究证据。

2. 按照研究方法分类 分为原始研究证据和二次研究证据。

(1)原始研究证据:是直接在受试者中进行单个有关病因、诊断、预防、治疗和预后等试验研究所获得的第一手数据,经过统计学处理、分析、总结后得出的结论。

原始研究的设计方法分为:观察性研究(未向受试者施加干预措施)和试验性研究(给予受试者一定的干预措施)。观察性研究主要采用的设计类型包括:队列研究、病例对照研究、横断面调查、描述性研究、病例系列和个案报道。试验性研究主要采用的设计类型包括:随机对照试验、交叉试验、自身前后对照研究和非随机同期对照研究。

根据研究工作开始执行的时候相对于原始资料来源所处的时间及特色,原始研究又可以分为前瞻性研究和回顾性研究。

前瞻性研究就是把研究对象选定,研究方式预定好,相关的影响因素纳入统计范围,在这些条件下,根据这些因素去做持续的追踪研究,分析判断,最后在原定计划的时间内做出评估,把符合原来设计方法的所有例子都要列入统计(这个阶段,不只是选择有效的来统计),全部结果都要呈现出来。最终,选择的结果经过计算,得出纳入统计范围的影响波动的有效因素并构成重点目标,继而对这些因素进行深入研究,这就是前瞻性研究。

回顾性研究的对象是根据其在过去某时点的特征或暴露情况而入选并分组的,然后从已有的记录中追溯从那时开始到其后某一时点或直到研究当时为止这一期间内,每一样本的情况。这种工作,性质上相当于从过去某时点开始的前瞻性研究的随访,但实际做的是在现在调查过去的既成事实,这时暴露与疾病或死亡均已成事实,而前瞻性研究的随访则是查寻在过程中新出现的样本结果。这是一种由“果”至“因”的研究方法。

(2)二次研究证据:是指全面地收集某一问题的全部原始证据,进行评价、整合处理、分析最终结果后所得出的结论。是对多个原始研究证据再加工后得到的更高层次的证据。

二次研究证据主要包括:系统评价(systematic review,SR)、临床实践指南(clinical practice guideines,CPG)、临床决策分析(clinical decision analysis)、临床证据手册(handbook of clinical evidence)、卫生技术评估(health technology assessment,HTA)和实践参数(practice parameter)。

(二)循证医学证据的级别

自循证医学问世以来,其证据质量先后经历了“老五级”、“新五级”、“新九级”和GRADE标准四个阶段。前三者关注设计质量,对过程质量监控和转化的需求重视不够;而GRADE关注转化质量,从证据分级出发,整合了分类、分级和转化标准,它代表了当前对研究证据进行分类分级的国际最高水平及意义。目前,包括世界卫生组织和Cochrane协作网等在内的28个国际组织、协会已采纳GRADE标准。为了便于掌握证据级别,以下简要介绍这4个不同分级。

1. 老五级 研究证据依据质量和可靠程度大体可分为以下五级:

一级:按照特定病种的特定疗法收集所有质量可靠的随机对照试验后所作的系统评价或荟萃分析。

二级:单个样本量足够的随机对照试验结果。

三级:设有对照组但未用随机分组的研究。

四级:无对照的系列病例观察。

五级:专家意见、描述性研究、病例报告。

一级证据的系统评价或荟萃分析,被誉为“金标准”,其次是设计完善、执行可靠、数据完整、临床与统计学分析合理的随机对照试验。证据可靠性逐级降低,在没有金标准的情况下,可依照上述标准分类使用其他级别的证据作为参考。

2. 新五级 如图1-2-1所示。

图1-2-1 新五级证据分级

3. 新九级 2001年,美国纽约州立大学医学中心推出证据金字塔,首次将动物研究和体外研究纳入证据分级系统,拓展了证据范畴,加之简洁明了,形象直观,得到了非常广泛的传播。如图1-2-2所示。

图1-2-2 证据金字塔

4. GRADE标准 2004年正式推出GRADE标准及推荐级别,见表1-2-1。该标准的特点是:第一,明确定义了证据质量和推荐强度,证据质量指在多大程度上能够确信疗效评估的正确性;推荐强度指在多大程度上能够确信遵守推荐意见利大于弊。第二,统一使用“级别”(grade)代替“证据水平”(levels of evidence)。第三,突破了过去主要从研究设计角度考虑证据质量的局限性,综合考虑研究设计、研究质量、研究结果的一致性和证据的直接性。第四,从使用者而非研究者角度制定标准,拓宽了应用范围,并随时更新。第五,推荐意见将根据当前可得证据的3种结论(肯定、否定、不确定),简化为强弱两级,既充分体现了循证医学立足于用,后效评价的思想,又为未来的发展和向其他领域拓展留下了空间和接口。

表1-2-1 GRADE标准及推荐级别