新生代农民工人力资本问题研究
上QQ阅读APP看书,第一时间看更新

三 数据来源

(一)本书的数据来源

综合起来看,国内可供研究新生代农民工这一群体的调查数据主要可分为三类,各类调查各有侧重点,其数据的基本情况详见表1-1。

表1-1 主要的全国性新生代农民工调查一览表

续表

续表

本书数据也主要来源于这三类。综合使用这三类数据来源的原因是期望更为客观系统地刻画出我国新生代农民工人力资本的真实状况。由表1-1可知,这三类调查数据各有利弊:

第一,国家统计局的数据对外提供了新生代农民工的宏观总量和个别的结构性数据,可以为其他农民工抽样调查提供较为可靠的抽样依据,但这类数据难以拿到微观个体数据,无法根据新生代农民工的研究目的自行进行细致分析。因此,本书选择利用了国家统计局的宏观数据,以展示新生代农民工的规模及个别结构指标随时间的变化,并利用国家统计局数据提供的新生代农民工关键性的结构指标(如行业结构、受教育程度等)指导本书课题组的新生代农民工抽样调查。

第二,原国家卫计委流动人口调查样本量大,覆盖了新生代农民工和老一代农民工样本,可以很好地进行特征对比与建模。因此,本研究在分析新生代农民工职业技能和健康状况的影响因素章节,主要利用的是这类数据,以寻求人群特征及影响因素的对比分析。本书依据原国家卫计委2013年流动人口动态监测数据中的A卷、C卷数据及2014年流动人口动态监测数据的A卷、C卷数据,抽取了其中新生代农民工的数据构成研究单元,更加全方位、立体式地反映新生代农民工人力资本状况及其影响因素。

第三,以上两类数据并未完全按照人力资本四个维度来设计,故本研究自行组织一项新生代农民工人力资本的专项调查,此项研究的针对性更强。不过,我们这项调查由于能力、精力等方面的限制而并未涵盖老一代农民工样本。本书新生代农民工专项调查的具体情况如下:在2016年1月7日至1月20日期间随机共发放1050份问卷,最终回收925份有效调查问卷(在最后的样本分层结构上参考了2013年国家统计局农民工调查显示的受教育程度、行业分布等结构性数据)。这次调查总样本覆盖来自全国26个省、直辖市的新生代农民工,其中,京内共发放和回收186份有效问卷,主要由课题组完成调查;京外共发放和回收739份有效问卷,主要由招募的六名京外调查员协助完成(每位京外调查员将各自负责的调查问卷通过网络邮件word的形式发送给课题组,最后由课题组对问卷进行整理)。本次问卷调查内容则涵盖新生代农民工人力资本的四大方面,即教育程度、职业技能、健康状况和迁移流动,以求深入了解我国新生代农民工人力资本状况。因此,本课题调查具有一定的创新性。

(二)本课题组的调查问卷及样本说明

由于在国家统计局近些年全国农民工抽样调查监测报告中,仅有2013年年度报告中的个别指标呈现了新生代农民工的结构状况(其2016年数据仅显示其规模占比),故2016年本课题调查在随机抽样的基础上参考了国家统计局2013年的结构性数据,但由于在调查年份上有三年的差距,所以本书的样本结构只能大体上与国家统计局调查结果结构相似,而某些亚人群的比例与之有略微偏差,也许这正是时间发展的一种表现。据国家统计局2013年全国农民工抽样调查监测报告数据显示:在新生代农民工中,初中以下、初中、高中及中专、大专及以上文化程度的比例分别为6.1%、60.6%、20.5%和12.8%,本课题调查样本结构基本与此接近;在行业构成上,国家统计局数据显示,从事制造业,建筑业,批发零售业,居民服务业、修理和其他服务行业的比例分别为39.0%、14.5%、10.1%和10.0%,本课题调查样本结构也基本与此接近。

表1-2 2013和2016年国家统计局农民工抽样调查监测报告中的行业指标

根据舒尔茨给出的定义,本书对人力资本的测量包括四个方面:(1)教育程度。本研究调查问卷主要测量了受教育程度、对农村教育的满意程度、没有继续上学的原因等内容。(2)职业技能。本研究调查问卷重点测量了职业技术证书的具备情况、参加职业培训的次数、参加培训的意愿以及培训主办方、出资方等若干信息。(3)健康状况。本研究调查问卷主要测量了体检频率、参加社会保障的情况以及心理健康情况等。(4)迁移流动。本研究调查问卷重点测量了工作过的城市数量、迁移流动的原因等信息。由于新生代农民工个人和家庭都会对人力资本投资决策产生重要影响,所以本课题调查问卷还测量了家庭规模、兄弟姐妹数、家庭耕地情况以及个人基本人口学属性特征等指标。具体情况请参见表1-3及附件中的问卷完整版。

表1-3 本书课题组调查问卷的主要测量指标(2016)

续表

本研究在全国28个省(市)128个市(被访者工作的城市)随机抽样采集了925个新生代农民工样本,其中,739份京外问卷、186份京内问卷。以下系列图示显示了此次抽样的主要样本分布情况。

图1-2 性别构成:频数与所占比例(单位:人,%)
数据来源:2016年1月本课题抽样调查数据。
注:“90后”是指1990—1999年出生的新生代农民工,“80后”是指1980—1989年出生的新生代农民工。

图1-3 年龄构成:频数与所占比例(单位:人,%)

图1-4 文化程度构成:频数与所占比例(单位:人,%)
数据来源:2016年1月本课题抽样调查数据。

图1-5 婚姻状况构成:频数与所占比例(单位:人,%)

图1-6 是否从事过农业生产的频数及占比(单位:人,%)
数据来源:2016年1月本课题抽样调查数据。

图1-7 出生地所在地区的频数及占比(单位:人,%)

图1-8 家庭成员数构成(包括被访者本人)频数与所占比例(单位:人,%)

图1-9 参加社会保险的频数与所占比例(单位:人次,%)
数据来源:2016年1月本课题抽样调查数据。
注:图1-9是多选题,故人数为累计个案数。

图1-10 行业分布:频数及所占比例(单位:人,%)
数据来源:2016年1月本课题抽样调查数据。