第三节 数据来源
本书数据来源于以下两个方面:
第一,宏观数据来源。宏观数据又包括两类:第一类是川渝地区农户收支数据,包括农户家庭人均纯收入、农业收入、非农收入和消费支出等,以及与收支相关的物价指数等数据。第二类是川渝地区农村金融发展指标数据,主要包括农村金融发展规模、农村金融发展效率、农村金融发展结构和农村金融覆盖密度等农村金融发展指标变量。这四个指标变量无法从统计资料直接获得,都是通过构建计算公式,通过其他数据间接获得。与这四个指标相关的直接数据主要包括:农村存款余额、农村贷款余额、乡镇企业贷款余额、国内生产总值、金融机构数量等。上述相关数据均根据历年《四川统计年鉴》《重庆统计年鉴》《四川农村年鉴》《中国农村年鉴》《中国统计年鉴》《金融统计年鉴》以及调研样本地区未公开出版的统计资料(地方统计部门资料)等综合整理而得。
第二,微观数据来源。农户的微观数据主要来源于两次调研数据,两次调研的时间跨度为10年。第一次调研时间为2011年笔者读博士期间(由于获得的数据资料为2010年度数据,后文简称为2010年调研数据),第二次调研时间为2021年暑假期间(由于获得的数据资料为2020年度数据,后文简称为2020年调研数据)。调研对象主要为川渝地区具有代表性的四个区县,分别为重庆市万州区、重庆市云阳县、四川省仪陇县和四川省南充市嘉陵区。四个区县有经济发展较好的万州区,也有经济相对较差的仪陇县,既有山区代表万州区和云阳县,也有平原丘陵地貌特征的南充市嘉陵区和四川省仪陇县,调研范围广、代表意义强。调研涉及上述四个区县30个村庄的500余户农户(两次调研的范围、家庭等大致相似,但是由于户主变动、乡村拆并等诸多因素,调研范围也略有差异),调研方式主要为随机抽样,调查方式为面谈与问卷调查相结合,调研内容主要包括农户个人和家庭特征(户主年龄、户主受教育程度、家庭人口数量、老人和小孩数量、劳动力数量、职业技能、耕地面积等)、收入水平、农业收入和非农收入状况、金融资产状况、负债水平、生产性资产特征、家庭耐用消费品特征、教育和医疗费用支出、社会资本特征(有无亲戚或好友为乡村干部、户主或家人是否村干部、调研年度礼金支出)、借贷特征(是否信用社社员、是否参加小组联保、是否了解贷款程序)、调研年度是否发生较大突发事件、娱乐支出、家庭房屋价值等。部分数据是通过委托学生作为暑期实践项目调查获得。书中用到的调查数据在相关章节中将详细说明。
为了保证调研数据的广泛性、真实性和有效性,本书采用分层抽样技术来获得相关信息。2011年笔者共调研了26个行政村,每个村随机抽取了20户农户随机采访,共获得问卷520份。通过对问卷的仔细筛选,笔者剔除了28份无效问卷,获取了有效问卷492份,问卷有效率为94.62%。2021年笔者共调研了30个行政村,每个村随机抽取了20户农户随机采访,共获得问卷600份。通过对问卷的仔细筛选,笔者剔除了50份无效问卷,获取了有效问卷550份,问卷有效率为91.67%,如表1-2所示。
表1-2 调研样本分布情况