2.2 度量消费不平等的常用方法
研究消费不平等的一个重要内容就是测度消费不平等程度。我们可以从不同的方面度量消费不平等,比如消费品的数量、消费支出水平等。由于消费支出水平能够综合地体现消费品数量、质量等方面的信息,因此,本书以消费支出水平为依据度量消费不平等,消费不平等可分为组间不平等和组内不平等。组间不平等包括区域间和群体间的消费不平等,如发达地区与落后地区之间的消费不平等,城镇居民与农村居民之间的消费不平等。组内不平等包括区域内部和群体内部的消费不平等,如东部地区内部的消费不平等,农民群体内部的消费不平等。有多种方法可以描绘或测度消费不平等,比如,消费水平最高的卢森堡是欧盟平均水平的136%,消费水平最低的保加利亚是欧盟平均水平的49%,就是一种利用地区差进行描绘的方法。但这种描述只能反映消费不平等的部分信息,并不能从整体上准确把握消费不平等。这里介绍几种常用的不平等测度方法及其应用情况,其中一些方法是对测度经济不平等或收入不平等的借鉴。为更直观地感受消费不平等的度量方法,文中将收入不平等度量方法借鉴到消费不平等的度量上,并以度量消费不平等展开论述。
2.2.1 基尼系数
基尼系数由Gini(1912)提出,是度量不平等最常用的指标,在实证研究和政策分析等领域得到广泛应用。基尼系数有多种计算方法注1,比如几何方法、基尼的平均差方法、协方差方法、矩阵方法等,各种计算方法之间具有统一性(徐宽,2003)。计算基尼系数有时以离散分布为基础,有时以连续分布为基础,虽然其数学表达不一样,但其内涵是统一的(Dorfman,1979)。基尼系数常用于测度经济不平等或者收入不平等,同样可以用来测度消费不平等。
注1基尼系数最常用的计算方法为,其中,n为样本量,为消费的均值,| ci-cj|为一对样本消费之差的绝对值。本书的所有分析均以测度消费不平等为例。
洛伦茨曲线在计算和理解基尼系数时具有重要意义(见图2-1)。洛伦茨曲线为按照消费由小到大依次排序后揭示人口百分比与消费百分比关系的曲线。图2-1中,45度线为完美品质线,即消费完全平等分布时的洛伦茨曲线。正常情况下洛伦茨曲线为图中的弧线。基尼系数G为A区域的面积占A区域与B区域面积之和的比重,即G=A/(A+B)。基尼系数的取值范围为[0, 1],基尼系数为0时表示完全平等分配,基尼系数为1时表示完全不平等分配,基尼系数越大不平等程度越高。因为A+B=1/2,因此,G=2A=1-2B。在消费是离散分布的条件下, ,其中,F为消费分布的累积密度函数,消费Ci≤Ci+1。当消费是连续分布时,,因此,,其中,p为消费最少的居民的消费占总消费的百分比。
图2-1 洛伦茨曲线
总体消费的不平等可以分解为不同群体的消费不平等。Sundrum(1990)提出了一种在分解基础上测度一国或地区基尼系数的方法。假设把总体居民的消费不平等分解为城镇居民内部、农村居民内部、城镇和农村之间的消费不平等,则基尼系数的计算公式可以表达为,其中G1和G2分别为城镇居民内部和农村居民内部的基尼系数,P1和P2分别为城镇居民和农村居民人口份额,和分别为城镇、农村和全体居民的平均消费水平。城镇居民内部的基尼系数,G2具有类似的算法。在应用方面,Garner(1993)、Idrees和Ahmad(2010)、解垩(2008)等利用基尼系数度量了消费不平等。
2.2.2 阿特金森指数
阿特金森指数由Atkinson(1970)提出。基尼系数从统计意义上测度了不平等,但没有探讨其社会福利含义。Dalton(1920)提出了转移支付原理,即如果在经济地位不发生变化的前提下富人向穷人转移财富,那么整个社会的不平等程度就会降低。Atkinson(1970)认为,如果不确定社会福利函数,就不能对收入分布进行优劣排序。Atkinson(1970)、Sen(1973)、Blackorby和Donaldson(1978)进行了将基尼系数与社会福利函数结合度量不平等的研究。应用到消费上,二者之间的联系需要一个平均分配的同等消费ξ,此时,阿特金森指数。平均分配的同等消费ξ具有这样的含义:当社会中的每个人都消费ξ时所得到的社会福利函数值,与实际不平均分配时所产生的社会福利函数值相等。假设整体社会福利函数为齐次函数W(c),则 ,此时,对较高消费者赋予较小权重,对较低消费者赋予较大权重。阿特金森指数的取值范围为[0, 1],当时取值为0,表示社会完全平等消费。阿特金森指数越小,消费分配越平等。解垩(2008)利用阿特金森指数测度了城乡居民健康消费的不平等,认为农村居民的健康消费不平等高于城镇居民。Barrett等(2000)利用阿特金森指数测度了澳大利亚的消费差距。
2.2.3 泰尔指数
泰尔指数由Theil(1967)提出,常用于测度区域经济差异,是度量不平等的一种相对指标。消费的泰尔指数是通过测度各组消费权重与人口权重关系来衡量消费不平等的指标。泰尔指数是广义熵指数(Litchfield,1999)的一种特殊形式,广义熵指数,其中,α为不同个体占总体份额的权重,最常用的取值为α=0和α=1。当α趋于0时,,当α趋于1时,, GE(1)即泰尔指数。泰尔指数越小表明消费越平等,泰尔指数越大表明消费越不平等。泰尔指数有两个主要的优点:第一,泰尔指数可以根据对基本空间单元的选择,测度不同尺度下的消费差异;第二,泰尔指数能够灵活地区分组间差异和组内差异。例如,度量居民消费城乡省际差异,可以将居民消费分解为城乡差异和城乡内部的省际差异,即,其中,Ci为消费份额,Pi为人口份额,Tin、Tbi和Twibn分别为居民消费城乡省际差异、居民消费城乡差异和居民消费城乡内部省际差异。韩立岩和杜春越(2012)利用泰尔指数测度了中国区域经济差异,高帆(2014)利用泰尔指数测度了中国居民消费城乡差异。与基尼系数相比,基尼系数对中间收入阶层的消费(或收入)变动较为敏感,泰尔指数对两端收入阶层的消费(或收入)变动较为敏感(王少平等,2007)。
2.2.4 变异系数
研究变量离散程度最常用的指标是方差、标准差或对数方差、对数标准差。比如,Jappelli和Pistaferri(2010)、Deaton和Paxson(1994)、Cai等(2010)用对数方差测度了消费不平等,其公式为,其中,ci和分别为消费的对数值和对数均值。与基尼系数、阿特金森指数、泰尔指数等相对指标不同,方差与标准差是绝对指标。研究对象的数值越大,其方差和标准差也越大,这就限制了其数值的可比性。比如,美国的消费水平高于中国,如果用标准差测度二者的不平等程度,将得出前者不平等程度高于后者的结论,而事实不一定如此。变异系数为标准差与均值之比,避免了离散程度受研究对象绝对水平影响的不可比性问题,其公式为,其取值范围为。陈培阳和朱喜钢(2012)用变异系数测度了中国区域经济差异。谢里等(2012)在考虑人口数量因素的基础上,提出了加权变异系数。测度消费不平等的加权变异系数公式为,其中Pi为人口份额,对消费不平等的测度更加准确。
2.2.5 分位数之比
分位数之比是度量不平等程度的一种简单方法。最常用的是90%与50%分位数之比,90%与10%分位数之比,50%与10%分位数之比,分别表示高消费阶层与中等消费阶层的消费差距,高消费阶层与低消费阶层的消费差距,中等消费阶层与低消费阶层的消费差距。这种度量方法选取了部分样本点的信息,反映不同消费阶层的相对差距,是对消费不平等的一种粗略测度,并不能反映全体样本的不平等程度。邹红等(2013)使用90%与50%分位数之比和50%与10%分位数之比度量了中国居民耐用品消费的不平等,杨继东(2013)使用最高收入户与最低收入户之比和中等收入户与最低收入户之比度量了中国居民消费不平等。
2.2.6 不平等度量方法评价
除上述度量不平等的方法外,还有其他方法可以测度不平等,比如Zenga (2007)指数、Kakwani(1980)指数、拓展基尼系数(戴平生等,2012)等。杨华磊和周晓波(2012)利用经济数据体现系统内部运行机制的唯象法则,通过构造收入和消费的密度函数,描绘了中国城乡和区域的不平等。不同度量不平等的方法包含了样本信息的不同方面,各有优缺点,一些学者(Barrett et al. , 2000;曲兆鹏等,2008;邹红等,2013;李涛等,2013)采用了不同的方法测度消费不平等。基尼系数具有横向可比性的优点。对于同一样本,分组的层级不同,计算的基尼系数将不同(李实等,2015)。泰尔指数能够计算不同尺度下的不平等,且易于分解。基尼系数对中间数值的变动比较敏感,泰尔指数对两端数值的变化比较敏感(王少平等,2007)。方差或对数方差描绘了样本的分布情况,缺陷在于这是一种绝对指数,缺乏可比性,变异系数是一种改进。地区差和分位数比便于计算,但都只反映了样本的部分信息,难以把握整体不平等及样本分布。阿特金森指数能够体现社会福利含义,但现实中很难确定社会福利函数和平均分配的同等消费。考虑到不同的方法各有优缺点,测度消费不平等应努力从多角度考察,或根据研究目的选择测度方法。