第三节 研究方法
本项研究属于实证性研究,其目标是为了检验我们的理论假设,评估环境补碘对环境、人口健康和社会经济的影响。研究方法的准确使用与创新是解决问题的根本保证。为了准确、有效地揭示环境补碘与环境、人口健康、社会经济发展之间的关系,本书将主要应用下列研究方法。
一、定性研究方法
(1)文献检索研究法。我们的任何一项科学研究都离不开前人的工作。通过大量的文献检索和研究,可以全面了解本书所研究问题的理论基础、研究现状、有待解决的问题,找准我们的切入点,为我们的研究方向奠定基础。
(2)比较法。比较法是本书的主要方法之一。书中许多问题都是通过比较环境补碘地区与非补碘地区各项有关指标的差异,通过比较环境补碘前后的变化,判断环境补碘的作用大小和方向。书中采用了绝对指标的比较和相对变化率指标的比较,以观察影响程度和幅度,静态和动态的变化大小。
二、统计方法
统计方法是定量检验理论假设的手段。本书将用方差分析方法(analysis of variance)分析环境补碘对出生率的影响,用逻辑斯蒂回归方法(logistic regression)研究环境补碘对婴儿、新生儿死亡风险的影响,最后将用结构方程模型(structur-al equation model)进行环境补碘对人口健康状况与社会经济发展影响的综合分析。本节简要概述这三种方法。
1.方差分析
方差分析是对多个群体均值是否相等这一假设进行检验。一般分为单因素方差分析、双因素方差分析和多元方差分析。因为文中没有用到多元方差分析,在此不作介绍。
方差分析的基本原理是通过方差比较检验各个群体的均值μ1,μ2,……,μr是否相等。均值存在差异的原因来自两个方面,一方面是由因素中的不同群体造成的,另一方面是由样本的随机误差产生的。因此,这两方面的差异可以用两个方差计量,即群体之间方差和群体内部方差。如果在群体之间的方差中,仅有随机因素的差异,而没有系统性差异,它与群体内部方差应近似,其方差比值会接近于1;反之,如果不同群体对结果产生影响,在群体之间的方差中就会包括了随机性差异,也包括了系统性差异,此时,方差就会大于群体内方差,两个方差的比值会大于1。当比值达到某个临界点,就可以判断不同群体之间存在着显著性差异。方差分析就是通过不同方差的比较,做出接受原假设或拒绝原假设的判断(贾俊平等编著,2000)。
单因素方差分析的基本步骤为:
(1)建立假设:原假设为H0:μ1=μ2=……=μr;备择假设为H1:μ1,μ2,……,μr不全相等。
(2)计算群体均值:令为第j个群体的样本均值,则
xij为第j个群体下的第i个观察值;nj为第j个群体的观察值个数。总均值的一般表达式为
(3)计算离差平方和:离差平方和有总离差平方和、误差项离差平方和及群体项离差平方和。
①总离差平方和(sum of square for total,简称SST)反映离差平方和的总体情况,公式为
②误差项离差平方和(sum of square for error,简称SSE)反映随机因素带来的影响,公式为
③群体间项离差平方和(sum of square for factor A,简称SSA)表现的是组间差异,包括随机因素和系统因素的影响,公式为
它们之间的关系为SST=SSE+SSA
(4)计算平均平方
对于SSA,平均平方(mean square)MSA为
其中,r-1为SSA的自由度,r为群体个数。
对于SSE,平均平方MSE为
其中,n-r为SSE的自由度,n为观察值个数。
(5)统计决策
MSA与MSE的比值服从F分布
如果F>Fα,那么拒绝原假设,接受备择假设。
双因素方差分析与单因素方差分析类似,在不考虑因素A和因素B的交互作用情况下,只需要对总离差平方和SST进行分解,结果为三部分,即反映因素A组间差异的方差SSA,反映因素B组间差异的方差SSB和随机误差SSE的离散状况。假定条件是,每一个观察值xij是由因素A的r个群体和因素B的k个群体组成的r×k个总体中抽取样本容量为1的独立随机样本。这r×k个总体的每一个总体均服从正态分布,且有相同的方差。计算公式为:
对于因素A, SSA自由度为r-1,均方差为
对于因素B, SSB的自由度为k-1,均方差为
对于随机误差项而言,均方差为
通常统计应用软件会给出以下形式的双因素方差分析表(表3-1),FA和FB分别为因素A和因素B的F统计量。
表3-1 双因素方差分析表
2.逻辑斯蒂回归
通常在做多变量分析的时候,首先选择的是多元线性回归方法。然而,用最小二乘法(OLS)估计方程时,存在三个问题(Aldrich和Nelson,1984;Hanushek和Jackson,1977;Maddala,1983):(1)在用线性方程的时候,一般假设误差项与自变量之间相互独立,即自变量的变化与误差项无关。有时此假设将导致因变量的解释概率超出[0,1]的范围,因为线性方程右边,,不是严格限定在[0,1]范围内。(2)在自变量取任意值时,假设误差项之间相互独立。但当因变量为二分变量时,如果用最小二乘法,会引起此条件的不稳定,其原因请参阅Hanushek和Jockson(1977)或Mck-elvey和Zavoina(1975)。(3)误差项不能保持稳定。因为误差项的方差是π(1-π),E(Y)=π是作为逻辑斯蒂回归方程的因变量的,π随各自变量的值的变化而变化,因而误差项方差也相应发生变化。
当因变量为二分变量时,我们常使用逻辑斯蒂回归方程。为了便于理解标准回归系数和确定系数(R2),假设有一套数据xik和Yi(i=1,……,n),Yi为二分因变量(Yi=1,0),xik是第i个记录的第k个协变量的值。对于第i个记录,我们定义一个连续潜在变量表示Yi=1时的发生倾向。如果,则Yi=1;反之,Yi=0。用线性函数表示为
因此,当Yi=1时,的发生概率π可以表示为
公式最后部分遵循误差项对称分布的假设。实际上这是我们在选择分析方法时对误差项(ε)所作的假定。例如,如果假设ε服从正态分布,可以用Probit分析方法(Aldrich和Nelson,1984;Maddala,1983),此时最后部分为ε,小于线性预测因子为时的概率。到目前为止,还没有精确的代数表达式来估测这种概率。如果假设误差项服从逻辑斯蒂曲线分布,特别是在逻辑斯蒂曲线和正态分布的图形很相似的条件下,用Probit和逻辑斯蒂回归方法结果会非常一致。因此,逻辑斯蒂曲线分布无论从数学表达还是解释性都具有优势。当Yi=1时,概率表达式为
其中,π永远落在区间[0,1]之间。至此,我们不必再构建一个潜在变量,而直接用逻辑斯蒂方程来估测发生概率。为了将方程表示为线性关系,对上述方程取logit变换,则逻辑斯蒂回归方程的最终表达式为
其中,π/(1-π)被称为概率发生比(odds)。
通常,我们不考虑模型中自变量之间的交互作用。因为在第5章的模型中,我们将在环境补碘对婴儿、新生儿死亡影响的模型中考虑变量之间的交互作用,所以有必要简单地对逻辑斯蒂回归方程交互作用项的解释作简明介绍,详细内容请参见DeMaris(1991),Hosmer和Lemeshow(1989)。如果我们想知道变量X1和X2之间交互作用对对数发生比(log odds)的影响,假设X1和X2只是彼此之间发生交互作用,不与其他变量发生交互作用,且X1为目标变量[2],X2为调整变量[3],那么逻辑斯蒂方程可以表示为
其中,W1,W2,……,WK为模型中其他自变量。X1影响对数发生比的斜率为(β1+β3X2),X1的风险比因与X2的交互作用变为exp(β1+β3X2)。其解释意义为,在控制其他自变量的情况下,相对于参照组X1每变动一个单位的风险比。
3.结构方程模型
结构方程模型最早由K.Joreskog与其合作者于60年代末提出并逐步改进完善,其相应的分析软件(LISREL)也越来越被研究学者所采用。结构方程模型实际上是一种建模、估计和检验因果关系的过程。因模型可用以估计无法观测的参数结构,同时检验因果关系模型中的各个假设,被越来越多的学者所关注。尤其是在社会科学研究领域,存在大量的不可直接观测的变量,而这些变量可以通过一系列量测指标来研究,这正是结构方程模型的优点。在近年的社会科学文献中,结构方程模型几乎是主导方法,且应用越来越广泛(Kelloway,1996;Stone-Romero, Weaver和Glenar,1995)。Cliff(1983)称此方法为统计学的一次革命,因为自方差分析方法提出以来,还没有哪一种方法被如此广泛地应用于社会科学研究。但是,结构方程模型结构复杂,计算量大,直到20世纪90年代初因计算机的发展在国内外才得到较为广泛的应用(郭志刚主编,1999:339)。
结构方程模型之所以如此流行,至少有三方面的原因(Kelloway,1998)。(1)许多社会科学学者习惯用一些指标反映他们就某一问题设计的结构关系。这些指标对结构关系的解释程度如何是很难判断的。实证性因子分析方法(com-firmatory factor analysis)比传统的探索性因子分析方法(ex-ploratory factor analysis)要简单、明了得多。结构方程模型进一步从总体上对模型中的因子和参数通过实证性因子分析方法验证理论假设,并给出明确的结构关系测度判断。(2)除了指标测度问题以外,社会学者还对关系测度感兴趣。随着对某一社会现象的了解,其结构关系也越来越复杂,结构方程模型可以很好地检验这种复杂的模型。在检验某些因果关系和某些中间变量的作用时,多元回归是无法做到的。(3)结构方程模型可以同时用联立方程处理测量和预测问题。特别是对社会科学中不可直接测量变量的影响,结构方程模型可以同时做出估计,并检验结构关系。这非常有利于研究者对某一问题的准确理解。
结构方程模型在以下几方面与以往的多元分析方法(multivariate analysis)不同:(1)它是一种实证性(confirmato-ry)分析方法,而不是探索性(exploratory)分析方法,即事先已经通过理论和文献研究假定各变量之间的关系,结构方程可以定量地验证和修正理论假设。(2)在构建模型,估计模型的参数,以及检验模型对数据的拟合程度方面没有过多的限制,允许测量误差存在,残差项可以相关。而传统的多元统计方法不能估计和纠正测量误差。(3)结构方程模型不仅能够分析观测变量(observed variables),而且能够处理不可观测变量(unobserved或latent variables)。多元统计方法只能分析观测变量。(4)结构方程模型可以在估计变量之间的直接效应的同时,估计变量之间的间接效应,这是多元统计方法无法做到的。
在环境补碘综合效应模型中,考察的变量中不少是不可观测潜在变量,研究的是各个不可观测潜在变量之间的因果关系。例如,“人口健康”和“农村经济”等潜在变量,它们不能够被直接测量,往往需要其他标识标量来测度,因而存在测量误差问题。并且在考察环境补碘对人口健康的直接影响的同时,还要分析环境补碘经农村经济变量对人口健康的间接效应。所以,通常的多元统计分析方法不能够满足我们综合分析的需要,而结构方程模型却能够很好地满足理论模型的条件。
(1)结构方程模型的基本思路
结构方程模型(structural equation modeling,简称SEM)是一种对某类现象的结构关系理论作实证性多元分析的统计方法。结构方程的重要特征之一就是反映多个变量之间的“因果”(causal)关系。从字面上理解,至少包含两方面的内容:(1)研究的“因果”关系可以用一系列的结构方程(structural equations)或回归方程(regression equations)表示;(2)各种结构关系可以用通径图表示其理论概念。因此,结构方程可以从整体上通过联立方程系统检验理论模型。
结构方程模型通径图和分析方法
结构方程模型一般由三部分组成:两个量测模型(meas-urement model)和一个结构模型(structural model)。量测模型分析可量测变量与不可量测变量之间的关系,也就是说,它通过量表的得分将标识变量(indicator variables)与不可观测的潜在变量(unobserved latent variables)联系起来。结构方程模型分析不可测量潜在变量之间的关系,即分析哪一个潜在变量直接或间接影响另一个潜在变量的变化。通常将潜在变量区分为内生潜在变量(endogenous latent variable)和外生潜在变量(exogenous latent variable)。
在结构模型中,ξ变量代表外生潜在变量,反映因果关系中的“起因”,相当于自变量(independent variable),它引起其他潜在变量的变化,其自身的变化不能被模型解释,被认为是因模型之外的因素的影响。η变量代表内生潜在变量,反映因果关系中的“效应”,相对于因变量(dependent variable),它的变化受模型中的外生潜在变量直接或间接影响,可以完全由模型中的外生变量或其他变量解释,因为所有影响它的潜在变量都包含在模型之中。β表示内生变量之间的效应;γ表示外生变量对内生变量的效应。外生变量之间的相关用φ表示。一个内生响应变量与一组外生变量及内生解释变量之间的关系可以用一个结构方程表示,方程的误差项计作ζ。ζ之间的关系则用ψ表示。
另两个量测模型表示各标识变量与内生或外生潜在变量之间的回归,其系数用λ表示。外生变量和内生变量的测量误差分别记作δ和ε。
根据这一模型,ξ1和η2是分别通过3个标识标量来度量的,ξ2、η1和η3分别用一个标识标量度量。图3-2直观地反映了各变量之间的关系。
图3-2 结构方程通径示意图
结构方程模型分析方法的基础是实证性因子分析(con-firmatory factor analysis)和通径分析(path analysis)。Wright(1921,1934)提出通径分析方法后,因计算量大、过于复杂而没有得到很好应用。直到Duncan(1966)将此方法成功地应用到社会学研究中,才得到了广泛的应用,尤其在行为科学中。虽然传统的通径分析方法比传统的单变量(univariate)或多元回归方法(multivariate regression)有很突出的优点,即可以估计变量之间的直接或间接影响。但是其主要的局限性是,事先假定的模型只有在观测变量没有误差或可忽略误差的情况下检验,这与实际不符。将分析潜在变量的实证性因子分析引入模型,放宽了这种假设条件,即可在观测变量与潜在变量(或结构变量)之间进行直接或间接结构影响的估计,并且允许存在测量误差。传统通径分析方法另一个缺点是,用于参数估计的常规最小二乘法(ordinary least square)有一些严格的假设,如观测变量没有误差,且误差之间相互独立等。结构方程模型采用最大似然估计(maxmarm likeli-hood)和广义最小二乘法(generalized least square),放宽了假设条件,但要求服从多元正态分布(multivariate normal distri-bution)。
通常结构方程模型由八个包含不同0或非0元素模式的基本矩阵决定,也就是说结构方程模型主要估计这八个参数。(1)Beta(Β),潜在内生变量之间的结构系数矩阵;(2)Gamma(Γ),连接潜在外生变量到潜在内生变量的结构系数矩阵;(3)Phi(Φ),潜在外生变量之间的方差/协方差矩阵;(4)Psi(Ψ),潜在内生变量误差项的方差/协方差矩阵;(5)LambdaΧ(Λx),连接标识变量与潜在外生变量之间的结构系数矩阵;(6)Teta Delta(Θδ),与外生变量相联系的标识变量的测量误差的方差/协方差矩阵;(7)Lambda Y(Λy),连接标识变量与潜在内生变量之间的结构系数矩阵;(8)Theta Epsilon(Θε),与内生潜在变量相联系的标识变量的测量误差的方差/协方差矩阵。
结构方程模型中潜在变量之间直接、间接和总的结构影响可以通过结构系数矩阵Beta和Gamma的乘积得到。
最大似然估计和广义最小二乘法基于多元正态分布的假设,两者都是使某一拟合函数中推导出(implied)的方差/协方差矩阵与样本中观测变量的方差/协方差矩阵的差异最小。
结构方程模型的结构方程式和测量方程式
在结构方程模型中,通常将表达潜在变量η和ξ的关系的方程式称为结构方程式,描述观测变量X、Y分别与潜在变量ξ、η的度量关系的方程式称为测量方程式。根据图3-2的研究模型,其结构方程式为:
测量方程式为:
以上方程式可以用向量与矩阵来表达,即结构方程模型的三个基本方程式为:
其中,
η是潜在内生变量列向量;
ξ是潜在外生变量列向量;
Β是内生潜在变量之间的结构系数矩阵;
Γ是潜在外生变量与潜在内生变量之间的结构系数矩阵;
ζ是潜在内生变量误差项的列向量;
Χ是作为观测变量均值偏差的观测变量列向量;
Λx是潜在外生变量与观测变量之间结构系数矩阵;
δ是观测变量误差项的列向量;
Y是作为观测变量均值偏差的观测变量列向量;
ΛY是潜在内生变量和观测变量之间结构系数矩阵;
ε是观测变量误差项列向量。
通常将公式(1)称为结构模型(structural model),(2)和(3)式称为测量模型(measurement model)。
结构方程模型中标识变量的方差—协方差结构
根据结构方程模型的三个基本方程式,求得向量Z=(Y′,X′)′的方差—协方差矩阵为
其中,A=(I-B)-1,Φ、Ψ、Θε和Θδ分别是ξ、ζ、ε和δ的协方差矩阵。因此,最后检验模型对数据拟合的好坏也就归结到比较和S的差异是否足够小(S表示由原始观测数据给出的Z的样本协方差矩阵,而则表示模型成立时Z的理论协方差矩阵)。
结构方程模型的基本常规和约定
基本符号
通径图是结构方程模型的基本手段,可以将设定的模型简明、清晰地表示出来。一般在作通径图时,遵循以下几条常规:
对数据的要求
结构方程模型通常要求“大”样本数据,因为模型估计和模型检验都是基于“大”样本假设。许多学者对“大”样本的定义存在不同的看法(Anderson和Gerbing,1984;Bentler和Chou,1987;Marsh, Balla和MacDonald,1988)。
一般最低限要求至少200个观测样本。Marsh等(1988)认为虽然参数估计在样本少于200情况下不准确,但是仍然建议在作潜在变量模型时要求至少100个观测样本。Booms-ma(1983)建议对于较为复杂的模型样本规模应在200左右。Bentler和Chou(1987)建议样本规模与估计参数之比应在5:1与10:1之间。Bentler(1993)进一步认为样本规模与估计参数之比应至少为5:1,如果要得到统计显著的检验最好为10:1或50:1。
过度识别的结构方程模型较为理想。即模型中的自由参数数目少于观测变量中方差和协方差的总数,也就是数据点。如果p是观测变量y的数目,q是观测变量x的数目,那么数据点总数等于(p+q)(p+q+1)/2。解决数据点数目和参数数目之间关系的方法一般为(1)对潜在变量加上更多的标识变量,以增加数据点;(2)通过固定或限制一些参数,自由参数的数目相应减少;(3)在模型建立之初就尽可能减少自由参数,只保留那些绝对必要的参数,使模型简化(郭志刚,1999)。
影响因素的分解
因素分解是通径分析方法和结构方程模型的主要优势。一般将模型中变量之间的关系分解为因果(causal effects)关系和非因果关系(noncausal relationships)。同样在这两个影响因素之内又可以进一步分解。对于因果关系,可以分解为一个变量对另一个变量的直接影响(direct effects)和两个变量之间通过第三个变量发生关系的间接影响(indirect effects)。对于非因果关系,可以分解为两种,一种是两个变量之间的关系因第三个变量而发生,称为伪效应(noncausal due to antecedents);另一种是模型中不止一个自变量且相互之间相关联,因而原因和结果很难从理论上界定,称为未分解效应(unanalyzed prior associations)。从下面的图3-2中可以看得更加清晰(Maruyama,1998)。
图3-2 结构方程模型中影响因素分解示意图
在结构方程模型中,我们只研究因果关系,非因果关系因其复杂而不易界定,不在研究之内。因而两变量之间的总影响等于直接影响总和加上所有的间接影响。用结构方程模型中的结构系数矩阵表示,见表3-2(Mueller,1996)。
表3-2 结构方程模型中直接、间接和总影响分解
(2)结构方程模型的基本步骤
结构方程模型的基本步骤包括五个方面(郭志刚主编,1999:340-355和Bollen,1993):模型设定(model specifica-tion)、模型识别(identification)、模型估计(estimation)、模型检验(testing fit)和模型修正(respecification)。
模型设定 根据理论及文献研究,通过通径图设定初始的理论模型。
模型识别 即在初始设定的理论模型的基础上,估计每一个自由参数能否由观测数据求得唯一解。如果一个自由参数不能由方差/协方差的代数函数表达,那么此参数就不能识别。反之,则称此参数能够识别。如果模型中所有参数都是识别参数,则此模型为识别模型。如果参数可以由一个以上的不同函数来表达,则称此模型为过度识别模型(over-identi-fied model)。如果模型中的参数恰好被一种函数表达,则称为恰好识别模型(just-identified model)。如果模型中至少有一个不能识别的参数,则称此模型为不能识别模型(unidenti-fied model)。结构方程模型一般都是过度识别模型。
模型估计 结构方程模型的基本假设条件是,观测变量的方差/协方差矩阵是一套参数的函数。固定参数和自由参数的估计被代入结构方程,然后推导出一个方差/协方差矩阵,并使此矩阵中每一个元素都尽可能地接近于样本中观测变量的方差/协方差矩阵中的相应元素。结构方程模型估计一般采用最大似然法和广义最小二乘法使两个方差/协方差矩阵差异最小化。
模型检验 模型总体拟合程度指标有许多测量标准。在结构方程模型中,需要综合考虑各测量指标来判断模型的好坏。结构方程模型中常用的指标有:拟合优度的卡方检验(χ2goodness-of-fit test)、拟合优度指数(goodness-of-fit index,简称GFI)、调整拟合优度指数(adjusted goodness-of-fit index,简称AGFI)、比较拟合指数(comparative fit index,简称CFI)、规范拟合指数(normed fit index,简称NFI),修正的拟合指数(the incremental index of fit,简称IFI)、不规范拟合指数(nonnormal fit index,简称NFI)、近似误差的均方根(root mean square error of approximation,简称RMSEA)等等,每种指数的基本特征详见有关文献(郭志刚主编,1999:349-354)。
模型修正 对模型修正是为了改进初始模型的适合程度。模型修正经常采用修改测量模型,增减结构参数,改变变量之间的相关关系等方法。在现有的应用软件(如LIS-REL, AMOS, EQS等)中基本都给出修正指数(MIs)帮助研究者有针对性地修正模型。通过修正指数,可以知道将某一参数作为自由参数估计(实际上是建立新的变量关系),模型检验的卡方值能够降低多少,即模型能够得到多大改善。但是,不能只考虑提高模型的拟合程度,而要根据变量之间的关系是否有意义、能合理解释来决定。
随着计算机科学的飞速发展,针对结构方程模型的应用软件越来越多。例如,LISREL(Joreskog和Sorbom,1993)、EQS(Bentler,1989)、AMOS(Arbuckle,1997)、LISCOMP(Muthen,1988)、CALIS(SAS Institute,1992)、RAMONA(Browne, Mels和Coward,1994)和SEPATH(Steiger,1994)等,其中以LISREL最流行,使用最广;其次是AMOS和EQS。