二 研究数据和方法
本文使用的研究数据来自中国社会科学院民族学与人类学研究所2007年委托国家统计局宁夏调查总队所做的宁夏经济社会调查。其中的城镇调查样本是从宁夏调查总队的大样本框中抽取了800户家庭共2445个个人样本,来自宁夏行政区划全部的五个市:银川市、石嘴山市、吴忠市、固原市、中卫市。为了提高回族样本的代表性,数据搜集时增加了回族相对集中的南部三个市(吴忠市、固原市、中卫市)的样本比重。从表1可看出,调查数据中回族的样本比例为29.33%,比第五次人口普查中宁夏城镇回族人口比例20.76%[15]高出了8.57个百分点。根据第五次全国人口普查统计,回族总人数为9816805人,是继壮族、满族之后的我国第三大少数民族,其中19%的回族人口居住在宁夏回族自治区。
表1 调查样本分布情况
本文将采用学界通用的对于性别收入差异的研究方法。即先构建就业和收入函数,以了解年龄、教育水平、所在城市就业状况等对不同民族和性别的具体影响;并在此基础上对收入函数进行Oaxaca分解以了解劳动力市场中的性别收入歧视。本文不仅关注宁夏城市劳动力市场中就业和工资的性别差异,同时也关注回族和汉族内部的就业和工资性别差异。
就业函数以mlogit模型分析相对于汉族男性,回族男性、汉族女性、回族女性在非就业者、国有企业就业者、机关事业单位就业者和在其他非国有企业就业者之间,年龄、教育年限、家庭中是否有14岁以下儿童及城市就业率所产生的不同影响。因问卷中涉及的就业和收入问题有限,收入函数中的被解释变量是工资收入的对数,解释变量主要为年龄、年龄的平方、教育年限、就业部门、职业种类、所在行业及不同城市变量。
对性别收入差异的分解大多用到Oaxaca分解方法。即将未经调整男女职工收入对数的差异定义为G。那么,G可分解为两部分:一部分是“可解释的”,即由二者之间特征差异或由二者之间解释变量均值差异引起的;另一部分为“不可解释的”,表示相同的特征却带来了不同的结果,也就是通常所说的“收入歧视”。用公式可表示为:
Lnwm-Lnwf=(xm-xf)Bm+(Bm-Bf)xf
或
Lnwm-Lnwf=(xm-xf)Bf+(Bm-Bf)xm
Df=exp\[xf(Bm-Bf)\]-1
Dm=exp\[xm(Bm-Bf)\]-1
在上述公式中,m表示男性职工,f表示女性职工,横杠表示均值,x表示特征向量,B表示系数估计值向量。Df(或Dm)表示未被解释的二者收入对数的差异,也就是通常所指的歧视指数。
虽然Oaxaca分解方法应用很广泛但它的弱点是无法估计出因男性和女性工资收入分配的不同而对性别工资差距的影响。尤其是针对我国劳动力市场存在地区分割现象的情况,而且相对于男性,女性受教育程度较低,从事非技术性工作和在非正规部门就业的比例高于男性,此缺点使得计算结果有可能高估劳动力市场的收入歧视。为此,通常要用到Quantile 回归基础上对性别工资收入差距的分解方法。但由于本文使用数据中回族女性就业总样本量为119,汉族女性就业总样本量为465,所以无法利用Quantile的分析方法。