预测模型实战:基于R、SPSS和Stata
上QQ阅读APP看书,第一时间看更新

1.1.2 风险因素验证模型

验证风险模型建模常采用“抽丝剥茧策略”或“层层加码策略”。其建模首先进行该因素XY的单因素回归,其次逐渐往模型中添加不同的控制因素,以期发现在控制了若干可能的混杂因素之后,最后证明该因素X是否是Y的风险因素,并确定其风险大小。

如图1-4所示,该作者为了验证serum sphingomyelin与CHD发病的关系,先构建了Model1,单独研究serum sphingomyelin与CHD发病关系得到HR(常称为crude HR或unadjusted HR),结果发现serum sphingomyelin每改变1个单位,CHD发生风险增加44%(P<0.001);然后在Model1的基础上构建Model2,在serum sphingomyelin基础上,模型增加了性别、糖尿病发病年龄、糖尿病病程与吸烟,结果发现serum sphingomyelin依旧与CHD发病有关,HR=1.24(P=0.038);然后继续在Model2基础上增加变量构建Model3,如此反复直至Model8,最终在Model8中发现,serum sphingomyelin与CHD发病风险并无关系,虽然HR=1.16,但P=0.18已经无统计学意义,所以最终证明serum sphingomyelin可以“无罪释放”。

图1-4 serum sphingomyelin与CHD发病风险验证

通过这种在要验证的核心X基础上“逐层加码”,对XY之间的关系进行“抽丝剥茧”,最终对X是否是导致Y发生的风险因素进行验证,从某种程度上,松哥认为比风险因素发现模型要更具价值,因为这类模型可以对某X进行“最终审判”;图1-5也展示了这种验证风险模型的构建策略。

图1-5 验证性风险因素建模展示