第二节 调查及数据
以往关于教育的研究大多以理论论述为主。但通过这种研究方法所获得的结论有时并不可靠,至少不准确,说服力也较差。我们相信,基于实际调查所建立起的关于教育与劳动市场表现之间的关系更为可靠。本节介绍所做调查以及所获得的数据。
一 调查
2016年问卷调查涉及五类群体:大专及以上学历城镇居民、高中、中专及以下学历城镇居民、农民、农民工和企业界人士。对应的五份问卷见附录1-1至附录1-5。
2016年初,在河南本地完成了问卷调查的基础上,我们派出了6个调查队,分别赴19个省份进行问卷调查,包括:北京、湖北、湖南、广东、山西、陕西、甘肃、青海、四川、重庆、贵州、上海、浙江、江苏、河北、黑龙江、吉林、天津、山东。调查所获得的样本涵盖了中国内地所有31个省份。
本次调查主要采取随机访问路人的方式。这种方式可获得较好的随机性,也是非官方机构比较具有操作性的方式。调查具体实施的模式有两种:一是在受访者同意接受问卷调查后,调查者和受访者各持一份问卷,调查同学逐一宣读问题,根据受访者的回答进行填写。这种方式调查的质量较高,但效率较低,对农民的调查都采取这种方式。二是在受访者同意接受问卷调查后,调查同学给受访者发放问卷由其自行填写。这种方式效率较高,但会出现受访者不认真填写问卷的情况,城镇居民大多采取这种方式。调查时,如发现受访者填写问卷不认真,则该问卷作废。
针对城镇居民、农民工和农民的调查,我们主要选择一些人流量大或者人员聚集的场所,比如火车站和人力资源市场。针对企业界人士的调查,我们主要选择在大型招聘会和人才市场。
调查获得针对高中及以下学历城镇居民的有效问卷为3688份,专科及以上学历城镇居民7493份,农民工2924份,农民1521份,企业界人士2027份,合计有效问卷17653份。此外,还进行了就业质量影响因素的问卷调查,共获得有效问卷325份,详见第九章第一节。
这是一次高难度但又高质量的调查。调查之所以能够达到高质量的一个基本原因是,同学们是在为自己的研究做调查。他们清楚地认识到,如果调查不认真,所获得的数据不真实,他们的研究就可能毫无成果。后面的统计分析显示,几乎所有计量分析的结果都得到合理的解释,这只有在真实调查数据的基础上才能够得到。
当然,这次调查也有一些不尽如人意之处。与城镇居民和农民工问卷数量相比,农民的问卷数量相对较少。主要原因是我们这次调查重点是城镇居民。
调查获得的数据向国内外学者开放。凡有兴趣的学者可直接联系本书作者之一樊明(邮箱:fanming4262@163.com)。如果有更多的学者基于我们调查所获得的数据做出出色的研究,我们会由衷感到高兴,并会觉得我们过去所付出的所有艰辛更加值得。6
二 对数据信度的检验
信度是问卷测量结果一致性和稳定性的检验指标。一致性是指一张问卷中不同问题的指向集中程度和不同问卷反映同一现象的相似程度。稳定性是指在不同时间地点用相同的问卷对相同的研究群体检测所得结果的相似程度。所测量的信度越高,则代表问卷一致性越高,稳定性越强。
我们首先通过Bartlett球度检验和KMO检验法,检验问卷数据是否能够进行因子分析。再用Cronbach's α系数法对五份问卷进行内部一致性信度检验和因子分析。Cronbach's α系数法是指问卷所有可能项目划分方法的所到折半信度系数的平均值,是最常用的信度测量方法。其公式为:
其中K为量表题项数,为总样本的方差,为目前观测样本的方差。
表1-3显示了数据分析的结果。五份问卷KMO统计量均在0.7以上,且五份问卷均在0.001的水平上具有统计学意义,说明问卷均具有良好的结构效度,各变量间偏相关性较强,因子分析时效果较好。Cronbach's α系数均在0.65以上,内部一致性较高,说明问卷所有题目指向较为集中,问卷信度较高且具有良好的内容效度。因此由我们问卷得出来的数据具有较高的可信性。
表1-3 问卷因子分析