中国农村可持续生计和发展研究:基于微观经济学的视角
上QQ阅读APP看书,第一时间看更新

第四节 数据采集和研究方法

一 数据采集

1.调查地点的选择

本书的数据主要来自两个研究,一是2008年西安交通大学等单位的调查“人口动态,农村生计选择和环境”数据库(梁义成,李树茁等,2010)。本书前七章的内容主要利用这个数据库。二是中国科学院和北京市水利科学研究所等单位的“密云水库上游流域区域生态合作评价“数据库”(梁义成,刘纲等,2013)。本书第八章主要利用密云的数据。

(1)陕西秦岭地区。周至县位于秦岭中部,是森林生态系统和天然植被保存较为完好的地区之一,野生动植物资源丰富,县内有多个国家级自然保护区和省级自然保护区,同时该地区又是周边城市用水的重要水源地,该地区人与环境矛盾、冲突的特征明显。调查地点为周至南部秦岭山脉之中的四个乡镇,该地区也为世界自然基金会(WWF)“秦岭保护与发展共进”项目区。周至县是西安最贫穷的县,而其山区中的各乡镇尤为贫穷。因为退耕还林等政策的实施和自然保护区的建立等,周至县的可耕种土地相对减少,人均耕地已从2002年的0.80亩降到2005年的0.61亩。

调查所在地处于秦岭山区,经济水平相对平原地区较低,但相对整个西部农村而言处于中游水平。农户的经济来源从有限的耕地转移到林业生产中,并受到自然环境的较大约束,外出打工是其重要的生活来源。在市场经济深化的过程中,一部分农户的收入水平有了较大的提高,但大多数农户仍然缺乏很好的收入来源。农户在经济水平上体现出较大的差异。周至调查地的农户生计概况,在农村地区具有一定的代表性。

出于建立自然保护区等原因,工业生产在当地受到限制。土地流转在当地较为鲜见,而劳动力迁移是当地农户收入的重要来源。许多农民迁移到外地特别是城市中以获取工资性收入,其行业集中在建筑业、服务业和采掘业等。这类工作在经济平稳时期是农户重要的收入来源,但农民经常面临失业、工资拖欠甚至人身安全等方面的风险。另外,由于当地特殊的生态环境,政府引导农户从事农家乐等第三产业,WWF也通过无息或低息贷款资助部分农户从事生态旅游产业。这些非农经营在大多数被调查的村普遍存在,但是数量较少,在调查地区,只有少数农户能够得到银行贷款或者WWF的金融资助。

当地的农业生产主要包括农、林两类。农业作物主要是小麦、玉米、土豆等粮食作物,产量低,多用于自给自足,很多农户仍然需要在市场上购买粮食。林地作物主要是山茱萸、核桃、板栗、花椒等经济作物,主要用于出售,这也是其最重要的农业收入来源。绝大多数农户的林产品都是在本村出售给商贩,虽然在形式上参与了市场,但作为价格接受者,其市场行为非常简单。

(2)密云水库上游。另外的调查区域包括密云水库上游的滦平、丰宁、赤城、密云四县。密云水库上游流域跨越北京市和河北省,其中北京市境内的面积约为3476.7km2,分布在密云、怀柔和延庆3个区县,占水库流域面积的23.3%,占北京市山区面积的33.3%。河北省境内的面积约为11892km2,分布在6个县:赤城县、丰宁满族自治县、滦平县、兴隆县、沽源县和崇礼县。密云水库上游“稻改旱”区域主要位于张家口市赤城县的白河河谷、黑河河谷以及承德市丰宁县和滦平县境内的潮河河谷地区。

白河发源于河北省沽源县大马群山东南,流经赤城,在青罗口村与发源于雕鹗镇的红河汇合,向东折去,在延庆县白河堡附近流入北京市。白河于延庆千家店镇附近纳入黑河,在宝山镇附近纳入汤河,于张家坟以东流入密云水库。该流域的“稻改旱”工程主要分布在沿河的样田乡、后城镇和雕鹗镇。

黑河发源于河北省沽源县境内的老掌沟,主要流经赤城县东南部,在三道营附近流入北京境内,于延庆县千家店镇附近汇入白河。该流域的“稻改旱”工程主要分布在东万口乡、茨营子乡和东卯镇。

潮河发源于河北省丰宁县上黄旗镇北,流经承德市丰宁县、滦平县,在密云县古北口镇流入北京境内,于高岭乡槽城子附近注入密云水库东北端。该流域的“稻改旱”工程主要分布在丰宁县的黑山嘴镇、大阁镇、南关乡、胡麻营乡、石人沟乡、天桥镇,滦平县的虎什哈镇、马营子乡、付家店乡、巴克什营镇。

2.调查目标、问卷设计和内容

调查的目标是了解农村的生计概况,探索农户生计策略的形成机制。调查问卷的设计过程如下:首先,在理论研究的基础上通过预试调查和小规模试调查的检验,课题组开发农户调查问卷。其次,课题组成员进行试调查,进一步了解当地情况和验证研究工具。最后,课题组利用成熟的问卷进行抽样调查。

调查问卷包括农户的基本情况、生计资本情况、生计活动情况、自然生态政策和生态补偿情况等内容。

3.抽样

在秦岭地区,调查采用分层多级抽样方法,按照乡、村、户三级进行抽样。首先,根据调查所需要的特定的自然生态条件,确定了处于周至南部山区的4个乡镇,即厚畛子乡、板房子乡、陈河乡和王家河乡。其次,通过咨询乡镇、村干部及周至县环保局的相关人员,主要按照经济发展水平、地理条件两个标准,并考虑该村生计类型与人口数量等因素的差异性,将每个乡的行政村划分为高、低两个层次,每个层次包含数量基本相同的村,组成两个样本框(经济发展水平主要依据村民的人均收入,地理条件是否为自然保护区及行政村的交通便捷状况等,生计类型包括农业生产、迁移打工和农家乐等非农经营)。再次,使用随机抽样的方法在每层中抽取村2~3个,每乡镇共4~6个村。最后,对抽取到的村采用整群抽样方法,即调查该村所有的常住农户并保证每个乡镇中一般有280个样本(由于王家河乡人口较少,计划样本量为210个)。预计调查四个乡镇16~24个行政村,总样本量1100个左右。

调查之前,课题组与一些被调查的村及乡镇干部做了沟通,了解了当地村庄的基本情况,并按照抽样原则,初步确定了样本框。由于山区经济条件落后、居住分散、信息不畅,存在较多的不确定性,课题组设计了详细的准备方案,并做到各个调查点的互相协调。在实际调查过程中,个别特别贫困的行政村由于人口较少且居住更为分散,课题组也适当增加了贫困村庄的样本数量。

在密云水库上游地区采用的也是分层多级抽样方法,按照乡、村、户三级进行抽样。首先,考虑到社会经济、交通等客观因素,我们从调查区域中选取了16个乡镇。其次,对于乡镇中的村通过咨询县、乡镇、村干部及相关人员,主要按照经济发展水平、地理条件两个标准,并考虑生计类型等因素的差异性(生计类型包括农业生产,打工和非农经营等),在每个乡镇中选取1~4个村。最后,对选取到的村使用随机抽样方法,抽取村中的常住农户(有家庭成员常住本村)。调查组实际于2011年5月到6月对4个县17个乡镇41个村庄的农户进行了调查。

4.问卷调查的质量控制

为了保证调查数据的质量,课题组实施了全过程的质量控制。

(1)培训的质量控制

第一,为了保证问卷调查的质量,课题组事先对参加调查的调查指导员进行了多次培训。培训达到了以下目标:

①调查指导员和调查员在调查过程中能够向被调查者正确提问;

②调查指导员和调查员能够就问卷中的某些问题(尤其是主观问题)进行适当的讲解;

③调查指导员和调查员能够正确判断被调查者提供的回答;

④调查指导员和调查员能够根据被调查者的回答正确地填写问卷。

第二,进行现场模拟访问。为了加深调查员对问题的理解,增加对实际调查过程的了解,无论是对调查指导员的培训还是对调查员的培训,在讲解问卷的全部内容后均当场进行了现场模拟访问。

(2)数据采集的质量控制措施

第一,跟访。跟访是此次数据采集过程中最重要的质量控制措施。由于山区环境的限制,复访变得相对困难,调查指导员很难单独找到复访对象,所以指导员加大了跟访力度。每个指导员负责两名调查员,根据对各位调查员工作能力的观察确定是否需要跟访以及需要跟访的调查员,以便在跟访过程中进一步纠正他们在访问过程中存在的问题。在这次调查中,为弥补复访困难带来的质量问题,即使调查员能够单独完成调查,许多指导员仍然每天进行一定数量的跟访,以保证数据的质量。

第二,问卷复核。调查员所完成的每一份问卷都要经过指导员的认真审核,通过审核以后才能判别为有效问卷。审核的内容包括问卷的填写方式是否准确、问卷的编码是否有误、问卷中包含的逻辑关系是否合理、该跳问的问题是否跳问、问题回答是否矛盾等。如果发现回收的问卷有错误,指导员必须在第二天碰头时及时将不合格问卷中存在的问题向各个调查员说明,要求其进行修改,对于答案不准确或遗漏的问题要进行第二次入户访问。大部分问题在问卷复核中都被发现,并且调查员根据情况进行了确认与更改,这样保证了数据在录入后,没有出现完全无效的问卷。

第三,复访。调查的质量控制以跟访为主,但仍根据情况从每位调查员上交的问卷中抽取了5%的问卷(共约46份)进行复访。重点了解调查员在访问时是否按照要求向被访者说明来意,对问题是否进行了适当的解释。如果发现问题要及时与调查员进行沟通,访问完成以后要对照两次访问的问卷,分析两份问卷不一致的地方。如果是因调查员技术而导致的错误,要求及时向该调查员进行反馈,以防止类似错误再次发生;如果是调查员人为的原因,则可以采取行政手段进行干预。复访结果显示,此次调查的复访一致率均在80%以上,符合质量要求。

(3)数据录入的质量控制

针对秦岭地区数据库内容较为庞杂的现实,课题组有针对性地编写了一组逻辑检测程序,在数据录入和自检工作完成以后,统一用这组程序进行检查,发现错误再进行修改,如此不断循环,直至所有可以更正的错误都消失为止,将最后无法更正错误的问卷判为不合格问卷。数据清洗完成后,对所有分类变量做了频次分析并对重要的连续变量做了异常值分析。实地调查完成之后把问卷数据录入Foxpro数据库中,按照随机原则抽取10%的问卷与数据库文件进行核对,检验数据录入的准确性。户问卷的计算机录入错误比率皆低于1%。总之,调查过程和数据录入过程都采取了相应的数据质量保证措施。从调查的过程控制、数据评估结果来看,数据质量基本得到保证。

二 研究方法

本书主要采取以下研究方法:

第一,利用文献研究寻找理论和实证依据,把握研究前沿;第二,基于文献考察的结论和系统工程的思想,在新古典经济学的范式中借鉴人口学视角,主要利用经济学的理论逻辑分析,改进可持续生计分析框架,以体现中国农户的生计特征;第三,在理论分析中,主要利用新家庭经济学和农民经济学中的农户模型,研究农户生计策略的形成机制,发现生计资本等要素对农户非农多样化行为、家庭劳动时间供给行为和农业生产行为的作用途径和方式;第四,在实证研究中主要采用统计和经济计量方法,包括常规的描述性统计分析、多元线性回归、Tobit回归以及一些较为复杂的计量模型,如内生选择的切换模型、多元Probit回归和联立方程组中的似不相关估计等。同时,也使用了技术经济学的相关方法,如利用前沿生产函数估算农业技术效率。