上QQ阅读APP看书,第一时间看更新
第二节 医学论文中常用的统计方法
一、χ2检验
X 2检验的用途广泛,医学论文中最常见的用途是两个或多个率(构成比)间的比较。
(一)两样本率比较的χ2检验 1.χ2检验的步骤
(1)建立假设,确定显著性水平。
H 0: π 1= π 2(例如,两种疗法的心血管病总体病死率相同);
H 1: π 1≠ π 2(例如,两种疗法的心血管病总体病死率有差别);
α=0.05。
(2)求检验统计量 X 2值和自由度(v)。
四格表资料 X 2检验的校正公式为
(3)查相应界值表,确定 P值,下结论。
2.四格表资料χ2检验的校正问题
对于四格表资料, χ 2检验存在校正问题,校正与否有时会导致两种相互矛盾的结果,实际应用时,当 χ 2检验所得 P值在检验水准(一般取0.05)上下波动时,即 χ 2值在3.84上下波动时,未校正 χ 2检验与校正 χ 2检验的结果常相互矛盾,这时,应改用四格表精确概率法(请参阅有关教科书)进行分析,一般的统计软件都能完成精确概率法的计算,输出 P值。另外,当样本例数较少时,也宜用精确概率法进行组间比较。
值得说明的是,无论哪种假设检验,当所得 P值在检验水准上下波动时,下结论一定要慎重,应结合专业知识分析结论是否符合实际或通过进一步的观察再作结论。
例1 63例冠心病人,随机分两组,治疗组32例,对照组31例。两组均常规用药,治疗组加用氨-氖激光血管内照射(ILIB)治疗,静息心电图疗效分析结果见表5-5。
表5-5 两组静息心电图疗效分析
注:两组 X 2=4.02, P<0.05 [数据来自人民军医,2000,43(2):87]
例1作者用未校正 χ 2检验比较两组的有效率,结果为 χ 2=4.02, P=0.045(<0.05),因此认为两组的疗效差异显著,ILIB组疗效优于对照组。
经笔者计算,本例校正 χ 2=2.99, P=0.084(>0.05),四格表精确概率法 P=0.0577(>0.05),都与未校正 χ 2检验的结论相反。
实际应用时,当 χ 2检验所得 P值在检验水准(本例为0.05)上下波动时,未校正 χ 2检验与校正 χ 2检验的结果常相互矛盾,这时,应改用四格表精确概率法进行分析。本例精确概率法分析结果为 P>0.05,因此,尚不能认为ILIB组疗效优于对照组。
(二)行×列表资料的χ2检验
行×列表也称列联表,简称R×C表,R为行数,C为列数。前述四格表,即2×2表,是最简单的一种R×C表。R×C表有多种资料形式,如多个样本率的比较,两组构成比的比较,多组构成比的比较等。
R×C表 χ 2检验的通用公式见公式5-8,它同样适用于四格表资料,对于四格表资料,公式(5-8)与公式(5-6)等价。
式中, A为某格子的实际频数; n R为某格子所对应的行合计; n C为某格子所对应的列合计。
1.多个样本率的比较
例2 将接受了切除术的761例皮肤黑色素瘤患者随机分为4组,第Ⅰ组185例,术后不接受任何治疗;第Ⅱ组192例,术后接受化疗;第Ⅲ组203例,术后接受免疫治疗;第Ⅳ组181例,术后同时接受化疗和免疫治疗。随访术后三年生存率,结果见表5-6,试比较四种不同疗法的三年生存率有无差异。
表5-6 黑色素瘤患者随访术后三年生存情况
(1)建立检验假设,确定显著性水准。
H 0:四种疗法三年总体生存率相等( π 1= π 2= π 3= π 4)
H 1:四种疗法三年总体生存率不全相等
α=0.05。
(2)求检验统计量和自由度。将表5-6的数据代入公式(5-8)
(3)查相应界值表,确定 P值,下结论。查 χ 2界值表(见有关统计学书籍)v=3一行,得0.5> P>0.25,以 α=0.05水准不拒绝 H 0,尚不能下四种疗法的三年生存率有差别的结论。
2.两组构成比的比较
例3 为研究两种口服洁肠剂的不良反应,将192例接受洁肠处理的患者随机分为两组,一组94例口服硫酸镁;另一组98例口服甘露醇。服后的反应见表5-7,试比较之。
表5-7 两种洁肠剂的服后反应
(1)建立检验假设,确定显著性水准。
H 0:两处理组的总体构成相同;
H 1:两处理组的总体构成不同;
α=0.05。
(2)求检验统计量和自由度。将表5-7数据代入公式(5-8)有
(3)查相应界值表,确定 P值,下结论。查 χ 2界值表v=4一行,因 χ 2=80.69> χ 2(0.005,4)=14.86,所以, P<0.005,以 α=0.05水准拒绝 H 0,接受 H 1,即两种洁肠剂的服后反应构成不同,甘露醇的不良反应率高。
3.多组构成比的比较
例4 对1135例绝经后出血的妇女进行临床与病理分析,结果见表5-8,试分析病变类型是否与年龄有关。
表5-8 不同年龄妇女绝经后出血的病变类型
(1)建立检验假设,确定显著性水准。
H 0:各年龄组病变类型的总体构成相同(年龄与病变类型无关);
H 1:各年龄组病变类型的总体构成不全相同(年龄与病变类型有关);
α=0.05。
(2)求检验统计量和自由度。将表5-8数据代入公式5-8,有
(3)查相应界值表,确定 P值,下结论。查 χ 2界值表v=6一行,因 χ 2=58.91> χ 2(0.005,6)=14.86,所以, P<0.005,以 α=0.05水准拒绝 H 0,接受 H 1,即不同年龄组妇女绝经后出血的病变类型构成不同,随年龄的增大,恶性病变的比例呈增大趋势。
二、t检验
由于抽样误差,从某一总体中随机抽得的样本,所得的样本均数与该总体均数往往不同;从同一总体随机抽得两个样本,这两个样本均数也会因存在抽样误差而不相等。实际中,当遇见一个样本均数与某一总体均数有差别,或两个样本均数有差别时,常需判断这种差别的意义,是所在的总体不同?还是所在的总体相同,差别只是由于抽样误差造成? t检验是解决这一问题的方法之一。
t检验,亦称Student t检验,可用于样本均数与已知某总体均数 μ的比较、两个样本均数的比较以及配对设计资料均数的比较。
(一)样本均数和总体均数比较的t检验
样本均数与已知总体均数比较的目的,是推断样本所代表的未知总体均数 μ与已知总体均数 μ 0有无差别。已知总体均数 μ 0一般为理论值、标准值或经过大量观察所得的稳定值等。
(二)配对设计的t检验
配对设计即将受试对象按某些重要特征相近配成对子,每对中的两个实验单位随机分配到两种处理组。医学研究中配对设计主要有两种情况:一是配成对子的同对实验单位分别给予两种不同的处理(如把同窝、同性别和体重相近的动物配成一对;把同性别、同病情和年龄相近的病人配成一对等);二是同一受试对象同时分别接受两种不同处理得到的两个观察结果(如实验动物两个部位的创面愈合时间等)。
配对设计组间可比性较好,因此比非配对设计更能准确地反映两种不同处理是否存在差别。进行假设检验时,可计算出各对差值 d的均数 ,当两种处理效果相同时,差值 d的总体均数 μ d理论上应该为0,故可将配对设计资料的假设检验视为样本均数 与总体均数 μ d=0的比较。
(三)完全随机设计资料两样本均数比较的t检验
两组完全随机设计是将受试对象完全随机地分配到两个组中,然后分别接受不同的处理。
医学研究中,经常遇到两组均数比较的问题。如两种降压药降压效果的比较、两种疗法对某生理指标的影响等都可通过比较两组均数差别的意义来解决。
由于存在抽样误差,即使两组总体均数相同,从该总体中随机抽得的样本均数往往也不相同。因此,当两个样本均数不相同时,不能断然地做出两个总体均数不同的结论,而应对其做差别的统计学检验。可用两样本均数比较的 t检验。
(四)t检验的应用条件
t检验的应用条件是:
1.样本为来自正态分布总体的随机样本。
2.两样本均数比较时,要求两总体方差相等(方差齐性),即
在进行 t检验之前应先对数据进行正态性检验和方差齐性检验。一般的统计分析软件都具有正态性检验的功能,但当已知数据来自正态总体时,可不必进行正态检验。如已知人体的身高、体重等资料为正态分布。
两组资料的方差齐性检验可用 F检验。
(五)医学论文中t检验的应用问题
医学论文中 t检验的应用率很高,但误用情况也较多,主要有以下两方面的误用。
1.忽略了t检验的两个应用条件
t检验要求资料服从正态分布且组间方差齐,但在许多医学论文中,作者忽略了这两个条件而直接应用 t检验,存在经 F检验方差不齐,但作者仍用 t检验进行分析的情况,这样的分析结果是不可信的。
当资料不满足 t检验的两个应用条件时,应采用两样本比较的秩和检验(请参阅有关教科书)进行组间比较。秩和检验是用秩次代替原始数据进行统计分析的假设检验方法,它对资料的分布形式没有要求,但因其没有充分利用资料提供的信息,检验效率较低。若资料满足t检验的应用条件,还应采用 t检验进行比较。
2.误用t检验进行多组均数两两比较
医学实际中常会遇到多组均数比较的情况,作者重复应用 t检验做两两比较,这是不妥当的,因为这样加大了犯Ⅰ类错误(实际无差别而统计结果判为有差别的错误称Ⅰ类错误)的概率 α,可能把本无差别的两个总体均数判为有差别。多组均数的比较应采用方差分析或秩和检验(请参阅有关教科书)。