第三节 模型、数据和测量
一 正式化模型
本研究的分析将分为横截面个人层面模型(模型1)、横截面集合层面模型(模型2)以及时间序列集合层面模型(模型3)三部分。公式(2-1)是横截面个人层面模型:
其中Hit代表个体i在时间t的幸福感,自变量包括个体i在时间t的家庭收入HINCit以及其他个人特征Xitk。公式(2-2)表示横截面集合层面模型:
其中Hjt代表地区j在时间t的集合幸福感,自变量包括地区j在时间t的人均地区生产总值。已有研究对公式(2-1)和公式(2-2)中收入或人均地区生产总值对幸福感的影响基本没有争论:无论是β1还是β2都显著为正。主要争论发生在长期集合层面的分析结果上。
公式(2-3)展示的是两个时间段幸福感的变化与同时期经济发展水平变化的关系。我们假定未观测到的误差不随时间变化,因此εjt-εj(t-m)=0。有些研究发现国家GDP的年均增长值与同期幸福感年均变化值之间的关系β3并不显著(Easterlin et al.,2010;Easterlin,2015);另一些研究却发现,在特定时期内,GDP的变化与幸福感的变化之间有显著的正向相关关系(Stevenson and Wolfers,2008;Sacks et al.,2013;Veenhoven and Vergunst,2014)。
如何理解上述不同的研究发现?伊斯特林等(Easterlin et al.,2010)提出区分“长期效应”和“短期效应”的重要性:当t-m足够长,例如长于10年,β3不显著,而当t-m小于10年,所体现的是“短期效应”,β3更有可能显著为正。
本章所使用的数据正好为10年(2003~2013年)[3],而且10年间经济呈现持续增长趋势,根据伊斯特林的判断,更有可能展示的是“短期效应”,因此实际上对证实“幸福感悖论”是不利的。因而,笔者在此将这种基于短期数据的验证当成一种“稳健性测验”(robustness check):如果使用短期数据却发现不显著,则暗示如果使用更长期的数据更有可能仍然不显著,因而为“幸福感悖论”提供更加强有力的支持。与模型1和模型2不同,模型3检验的是差异对于差异的影响,直接回答了在集合层面上“所有人的收入上升是否会提高所有人的幸福感”(Easterlin,1995)。
已有的研究多使用跨国数据,j指一个国家。然而国与国之间不仅经济发展水平不同,甚至连同样的主观幸福感都会有测量上的系统差异,例如欧美人更加乐观,东亚人相对悲观,即使在同样的客观条件下,后者也会比前者报告更低的满意度(Diener and Lucas,2003)。在这种设计中,所观察到的经济发展状况受到文化、制度等宏观结构因素的干扰,会出现偏误。而在本章,我们只关注中国一个国家,将省份作为观察单位,一方面可以捕捉到中国经济发展的地区性差异(Kanbur and Zhang,1999),另一方面也可以避免由不同国家的文化制度差异造成的偏误影响。因而,在下文中,j指一个省份。[4]
二 数据和测量
在数据的选择上,世界价值观调查(WVS)是迄今包含幸福感测量最长期的全国数据,1990~2012年共涵盖22年,因而在各跨国幸福感研究中被广为使用。但WVS无法直接检验“幸福感悖论”,因为:第一,样本量小,整体样本量从1000到2300不等,每个省份的样本量有限 (甚至小于30),使以省份为单位的分析更容易受极端个体值的影响而产生偏误;第二,1995年数据的省份信息缺失,无法与省份经济发展水平相串联,因而不能用来分析;第三,各年份之间的抽样框不一致,特别是1990年,不但局限于11个省份地区,而且只抽取了城市样本。[5]根据已有研究,中国的幸福感在过去20多年中呈现U形趋势,以2001~2005这个时期为拐点(Easterlin et al.,2012),如果2001年之前(只有1990年)的数据实际并不可比,那我们对于长期“财富-幸福感”关系的判断就变得不准确。
就笔者所知,除了WVS之外,包含幸福感测量且时间跨度最长的全国代表性数据只有中国综合社会调查(CGSS)。[6]从2003年至今,CGSS每隔一年或两年收集数据,总样本量从600左右到超过10000不等,每一次调查都涵盖绝大多数省份。集合2003年、2005年、2006年、2008年、2010年、2011年、2012年、2013年的数据,形成的数据库横跨10年,适合检验“幸福感悖论”。美中不足的是作为首年的CGSS 2003只涵盖了城市样本,降低了其与后面年份的可比性。然而如前所述,检验“幸福感悖论”倚重长期数据,跨度越长越好,否则发现的可能只是短期效应。所以,本章的分析策略是先考察2003~2013年的关系,然后剔除CGSS 2003,观察核心结论是否依然稳健。
除了时间跨度外,第二个需要考虑的问题是集合层面的分析单位。CGSS采用的是多阶分层PPS随机抽样,初级抽样单位是县、县级市和区,在每个初级抽样单位之下再随机抽取若干街道作为二级抽样单位(Bian and Li,2012)。因而,若能以区县作为分析单位就可以具备较好的代表性。遗憾的是,除了CGSS 2005外,其余年份的数据均未提供真实的区县编码,因而无法串联区县级经济发展数据。[7]我们采用次优的方法,以省份作为分析单位。下文的集合层面分析将涉及两个核心变量——人均地区生产总值和平均幸福感水平,前者因为来自统计年鉴,受抽样影响较小;而平均幸福感水平则由各省中个人的幸福感得分汇总而来,有可能会受影响。因此,在生成省级幸福感时,我们对每个省份都进行了加权,权重基于相应年份各省份在性别和教育两个维度的边际分布计算而成,数据来源于2004年、2006~2007年、2009年、2011~2014年的《中国统计年鉴》。
此外,在进行个人层面分析时,笔者对每一年的数据都进行了相应加权。对于在分析所涉及变量上有任何一个缺失的个案进行了整条删除,最后共得到65270个个案用于分析。使用样本提供的个体加权计算显示,样本被访者的平均年龄是46岁,男性占48%,城市居民占62%。
幸福感测量一直是该领域的核心问题。虽然捕捉人们的幸福感不容易,但单维度自评幸福感(或生活满意度)却被证明有较高的效度。有关自评幸福感效度的证据主要来自三方面。[8]首先,不同环境中对同一批被访者使用同样的幸福感测量所得结果之间具有一致性(Lucas and Donnellan,2007)。卢卡斯和多尼兰(Lucas and Donnellan,2012)使用多变量潜在状态-特质模型(multivariate latent state-trait model),通过分析四波德国社会综合调查,证实了单维度生活满意度测量有较高的效度。其次,单维度的生活满意度与其他客观福利测量指标之间有较强的相关关系,例如与当地生活质量指标有较强相关关系(Oswald and Wu,2010),与社会经济地位、健康状况以及情绪有较强相关关系(Cheung and Lucas,2014)。最后,单维度的生活满意度与身体和脑功能的相应生理反应(Ryff,Singer and Love,2004),例如左脑前额叶激活水平相关(Urry et al.,2004)。基于上述证据,本章选择使用单维度的自评幸福感作为因变量。
CGSS所有年份都包括自评幸福感的测量。“Happiness”在中文中有两种不同的翻译:“幸福”包含更多的主观评判成分,而“快乐”更多侧重于正向的情感。CGSS中所有其他年份的问题都使用“幸福”,如“总的来说,您认为您的生活是:从1非常不幸福到5非常幸福”,只有2008年使用了“快乐”,如“整体来说,您觉得您快不快乐?从1很快乐到5很不快乐”。笔者的数据分析显示,这种用词上的变动对基本的结果没有产生显著影响。
在个人层面,与已有研究一样(Gunatilaka and Knight,2010),本章采用人均家庭收入作为财富的测量,为了排除通胀的影响,笔者使用相应年份的居民消费价格指数(Consumer Price Index,CPI)对所有的收入进行了调整(以2002年为基准年份)。
在集合层面,本章使用各省份的人均地区生产总值(per capita Gross Regional Product,pcGRP)来测量经济发展水平。数据来自1999~2014年的《中国统计年鉴》。同样,为了排除通胀的影响,笔者使用相应年份的CPI对所有的pcGRP进行了调整(以1998年为基准年份)。此外,为了避免单独年份的经济增长短期变化对估计造成的不稳定影响,笔者使用了移动平均数(moving average)的方法,计算每个调查年份前四年及调查年份当年共五年的平均pcGRP,得到的指标取对数后进入以下分析。
在分析个人幸福感时,本章的模型包含了大多数幸福感研究涉及的基本控制变量:受教育年限、婚姻状况(已婚与否)、当前未就业[9]、是否为流动人口(居住地为城市,户口为农业)、年龄、年龄平方以及性别。另外,对于中国居民幸福感的研究也发现了党员身份(Appleton and Song,2008)及居住地点(城市还是农村)对个人主观幸福感有显著影响(张军华,2010;Brockmann et al.,2009;Brown and Tierney,2009;Gunatilaka and Knight,2010)。因此,我们也在分析中纳入这两个变量。
表2-1是各调查年份变量分布情况。首先,我们观察到幸福感呈现上升趋势,2003~2011年,中国居民的平均幸福感水平上升了将近20%,虽然2012年和2013年后经历了小幅下降,整体上仍然呈现上升趋势。然而,要把这种上升趋势概化到更长的时期可能要特别小心。事实上,如果将观察周期向前移动10年,则会显示非线性的特征。
图2-1同时描绘了时间跨度更长的WVS和较短时间的CGSS中中国居民主观幸福感的趋势分布,说明了这种长期和短期的差异。中国居民的幸福感经历了先降后升的过程,拐点位于2001~2005年,而CGSS包含的调查时间正好是这个U形趋势的上升阶段。因而,基于CGSS 2003~2013的分析如果证实经济增长对幸福感提升有显著影响,则有可能是因为数据所涉及的时期正好经历了经济高速发展,而我们所展现的只是短期影响,因而不能作为对“幸福感悖论”的证伪依据。而如果我们发现即使是2003~2013年,如此高速的经济增长也并没有提高平均幸福感,则可以作为证实“幸福感悖论”的有力证据。相应地,各省份的人均地区生产总值也呈现逐年上升的趋势,最后两年的差距不大,可能是各省份之间的不平等程度在同一时期也有所提高的缘故。
表2-1 单变量描述统计(CGSS2003~2013)
续表
图2-1 中国居民主观幸福感的变化趋势
资料来源:世界价值观调查(WVS)1990年、1995年、2001年、2007年和2012年数据,生活满意度选项从1(“非常不满意”)到10(“非常满意”);中国综合社会调查(CGSS)2003年、2005~2006年、2008年、2010~2013年数据,整体幸福感选项从1(“非常不幸福”)到5(“非常幸福”)。
图2-2分别描绘了平均幸福感水平和中国人均GDP在2003~2013年相当一致的上升趋势,暗示如果我们将中国看成一个同质性的整体,就可能会得出经济发展有利于幸福感上升的结论。事实上,刘军强等(2012)基于CGSS 2003~2010数据的分析正是这样认为的。此外,我们还观察到人均家庭收入在考察期间也有实质性的提高。以上趋势仅仅是单变量的描绘,无法显示经济发展水平与幸福感之间的关系。接下来,我们将根据前文所述的三个模型对“幸福感悖论”进行正式的检验。
图2-2 中国人均GDP与幸福感的变化趋势
注:图中左轴人均GDP数值以美元为单位。
资料来源:世界银行数据库,中国综合社会调查 (CGSS)2003年、2005~2006年、2008年和2010~2013年数据。