1.2.4 关于相关实证分析方法的梳理
1.农业产业空间格局的分析方法
对农业产业空间格局,特别是产业空间集聚特征进行测算的常用指标有区位熵、行业集中度、泰尔指数、莫兰指数、空间基尼系数等,不同指标具有不同的特点(杨春等,2008;陆文聪等,2008;杨万江等,2011;叶长盛等,2011)。
区位熵(Location Quotient,LQ)由哈盖特提出,是衡量区域要素空间专业化分布情况比较有价值的指标,能够有效揭示区域优势产业发展状况(王欢芳等,2018;董承良等,2018)。区位熵由于资料获取便利、计算方法简便、结果分析直观、能较好地反映地区层面的产业集聚水平,一直以来被广泛运用。例如,姚成胜等(2016)、程鹏飞等(2019)分别运用区位熵指数考察了中国水产业的地理集聚特征,以及中国林业产业集聚程度。但是,区位熵指标一方面存在对区域内企业规模与集聚特征考虑不足的问题(王欢芳等,2018),另一方面则可能存在区位熵较大但规模较小的问题,即不能准确对某种产业是否具有专业化优势进行判断(黄修杰等,2017)。
行业集中度由市场集中度演变而来,以行业中规模最大的前N家企业占整个行业的规模或市场份额之比衡量,是常用的衡量产业集聚格局的指标。尽管行业集中度测算方法简便,但存在无法反映产业空间格局变动的局限。此外,行业集中度N的选取存在主观性问题(王欢芳等,2018)。但是,相比区位熵,其更好地考虑了地区的生产规模(姚成胜等,2016)。
泰尔指数立足不同空间尺度,能够有效表达出分布的空间差异性,可同时衡量空间组内差距和组间差距对总差距的贡献率(李雪铭等,2018)。孙才志等(2009a,2009b)分别利用泰尔指数检验了中国农产品虚拟水与耕地资源的区域时空差异、中国畜牧产品虚拟水的区域分布空间差异,具有代表性。
莫兰指数是揭示空间相关性的重要指标,通过该指标大于0、小于0或等于0来判断空间地理现象之间是正空间自相关性、负空间自相关性,还是不存在空间自相关性,且莫兰指数又分为全域莫兰指数和局域莫兰指数(张复宏等,2017)。吴玉鸣(2010)基于全域莫兰指数和局域莫兰指数提出,中国省域农业产出存在明显的空间依赖性,空间分布表现为局域集聚的特征,且区域农业产出的全域莫兰指数呈现出距离衰减特性。张复宏等(2017)利用全域莫兰指数与局域莫兰指数对中国苹果主产区环境全要素生产率的时空格局演化进行分析,得出近年来中国苹果主产区环境全要素生产率呈现空间负相关性特征的结论。
基尼系数最早是由经济学家基尼在1992年提出的,是用于衡量居民内部收入分配差异的重要指标(淳阳等,2018)。空间基尼系数则参考该原理,用来反映产业区域分布不均程度(黄修杰等,2017)与产业地理空间集聚水平(王欢芳等,2018)。姚成胜等(2016)、黄修杰等(2017)、董承良等(2018)运用空间基尼系数对中国农业产业、水产养殖产业等的区域布局进行了考察。但是,空间基尼系数与区位熵一样,不能将企业规模和地理区域等因素的差异纳入考虑范围(王欢芳等,2018)。
除上述指标外,为解决区域规模差异及区域行政边界问题,Ellison 和 Kerr(2010)的EG指数与Mareon 和 Puech(2003)的基于距离的集聚指标也有部分学者采用(冷志明,2010),但一方面其计算复杂,另一方面尽管对于判断个别区域在空间整体内的布局效果明显,但对于邻近区域的关系、空间整体中心的演变缺乏解释力度,因此并不被广泛采用。总体上看,指标之间各有优劣,常常被配合使用,以更全面、准确地反映区域空间布局状态。
2.农业产业空间集聚形成的分析方法
早期学者们主要运用定性描述进行研究(周应恒,2007;李小建,2009;顾莉丽,2011;李小建等,2013),随着计量经济学的不断发展,基于计量模型检验农业产业空间集聚成因的研究日益丰富,具有能够基于数据准确判断各要素贡献程度及作用方向的优势。常用的模型有面板数据模型、空间计量模型与结构方程模型。
面板数据由于兼具时间序列和截面数据的优点,既能反映出时间层面的变化,又能体现同一时刻不同个体的差异,受到研究者们的欢迎(刘学良,2011)。面板数据模型的应用从20世纪80年代开始呈爆发增长,其中常用的面板数据模型分为两类,分别是固定效应模型和随机效应模型。在固定效应模型中,截距项是随机变量,与自变量变化有关。随机效应模型中的截距项虽然也是随机变量,但是它的变化与自变量无关,二者的取舍常用Hausman检验判断。杨春等(2008)、邓宗兵等(2013b)运用面板数据模型对中国粮食生产空间布局的驱动因素进行考察。
空间计量模型能够分析空间结构,处理空间相互作用,是一种在存在空间相关性的条件下反映空间变量之间关系的计量模型(潘泓旭,2015)。空间计量模型经过40余年的发展,形式丰富,包括只考虑因变量空间滞后项的空间滞后模型(SAR模型),只考虑误差项滞后项的空间误差模型(SEM模型),考虑因变量和误差项滞后项的广义空间自回归模型(SAC模型),考虑自变量和因变量空间滞后项的空间杜宾模型(SDM 模型),考虑自变量和误差项滞后项的空间杜宾误差模型(SDEM 模型)和考虑因变量、自变量与误差项空间滞后项的广义嵌套式空间模型(GNS模型)等(孙久文等,2014)。目前,较为常用的空间计量模型有两种,分别是空间滞后模型和空间误差模型。需要注意的是,只有存在空间自相关性的数据才有必要用空间计量模型估计。陆文聪等(2008)、杨春等(2010)、杨万江等(2011)分别运用空间误差模型、空间滞后模型和空间误差模型、固定效应空间滞后面板模型对粮食生产空间格局的变动进行研究,证明粮食生产存在显著的空间相关效应。
结构方程模型兴起于1973年,由瑞典统计学家、心理测量学家提出,是综合运用多元回归分析、路径分析和确认型因子分析方法的统计分析工具。由于具有能够直接处理潜变量和测量误差的优点,尤其是在管理学、心理学等社会学科中受到广泛运用(贾新明等,2008)。结构方程模型的主要思想是在强大的理论支持下,通过推论和假设,利用联立方程组求解。它通常由两部分组成,分别是测量模型和结构模型(程开明,2006)。测量模型分为外生变量测量方程和内生变量测量方程,分别揭示了外源指标和外源潜变量、内生指标和内生潜变量之间的关系。结构模型则反映了内生、外源潜变量之间的关系。就产业集聚而言,由于产业集聚的概念及其影响因素往往很难用单一变量或单一维度变量表示,甚至无法用显变量描绘,因此传统回归方法容易引发由于遗漏重要变量而造成的有偏估计。周应恒等(2012)运用结构方程模型对农业主产地与产业集聚的成因进行实证检验,是当前具有重要价值的参考文献。
3.农业产业空间集聚经济效应的分析方法
具有代表性的空间集聚经济效应的研究方法有时间序列模型、面板数据模型、空间计量模型,以及少量社会网络模型。
格兰杰因果关系检验、向量误差修正模型、基于面板数据的向量自回归模型等被学者们运用于检验工业、农业产业集聚对经济增长的影响。格兰杰因果关系检验是利用时间序列数据检验经济变量之间是否具有因果关系,以及具有什么样因果关系较为简便的方法。孙铁山(2016)运用格兰杰因果关系方法对经济集聚、空间结构演化和地区经济增长的因果关系进行了验证。但是,格兰杰因果关系检验只能应用于时间序列数据,在检验前需要进行严格的检验,并且对样本滞后期长度的选择较为敏感,具有一定局限性。向量误差修正模型与基于面板数据的向量自回归模型在格兰杰因果关系检验的基础上进行拓展。其中,向量误差修正模型只能用于有协整关系的非平稳时间序列建模,使用Johansen协整检验判别协整关系;基于面板数据的向量自回归模型则在数据量和变量系统反馈等方面具有优势。陈建军等(2008)、贾兴梅等(2014)、吴舒等(2016)分别基于上述两种方法对我国产业集聚对索洛剩余及竞争力的影响、蔬菜产业集聚与产业成长的关系、农业产业集聚与农业经济增长的关系进行检验。
社会网络分析近年来逐步被应用于探索检验产业集聚的运行机制及效应。产业集群的优势在于集群创新氛围。当下,邻近性对集群创新的影响备受关注。但是,随着通信技术与交通设施的日益发展,地理邻近性被视为基础性特征,社会邻近、关系邻近、组织邻近、制度邻近、知识邻近的重要作用逐步被纳入研究视野(Amin and Conhendet,2003;Boschma,2005;Agrawal et al.,2008;李琳等,2012)。社会网络分析以“关系”为基本分析单位,采用图论工具、代数模型技术描述关系模式并探究这些关系模式对结构中成员或整体的影响,是一种针对“关系数据”的跨学科分析方法,在社会学、经济学、管理学等领域得到广泛应用,已成为一种新的研究范式,对农业产业集聚研究有一定的意义。史焱文等(2016)基于社会网络分析方法及多元线性回归模型,从多元邻近性视角探索蔬菜企业地理邻近、关系邻近对当地农业产业集群创新的影响,具有一定的启示性。但是,社会网络分析方法对于关系主体的数量、主体间关系判断的准确性有所要求。
此外,面板数据模型及空间计量模型也被用于检验产业集聚对产业发展的贡献(朱英明,2006;吴玉鸣等,2007;王艳荣等,2012a;邓宗兵等,2013a),二者已在前文加以介绍,在此不做赘述。
4.农业环境可持续发展的分析方法
结合本研究的需要,重点对农业低碳生产与农业水资源节约利用的研究方法等文献进行综述。其中,对农业低碳生产的研究方法主要集中于碳生产率的相关研究,对农业水资源节约利用的梳理则集中于前文所述的最具有微观可操作性的滴灌技术采用的相关研究,具体如下:
关于碳生产率影响因素的研究主要集中在工业领域,基于面板数据模型(李亚冬等,2017;高文静等,2018)、空间计量模型(沈能等,2014)、门限回归模型(高文静等,2017;刘习平等,2017)等,验证了能源价格、研发投入、外商直接投资、政府干预、产业集聚、工业化、城镇化、污染治理等是影响碳生产率的重要因素。在对农业碳生产率影响因素的研究中,具有代表性的有宋博等(2016)基于联立方程组模型与似不相关回归方法,以北京市蔬菜种植户为例,对农户的专业化生产对农业产出和农业碳生产率的促进作用的研究,以及程琳琳等(2016,2018)运用空间计量模型,基于我国省级面板数据测算得出城镇化是影响农业碳生产率的重要因素结论的研究。
Logit、Probit、Tobit等二元选择模型一直以来被应用于滴灌技术采用的影响因素检验中(刘亚克等,2011;王格玲等,2015;贾蕊等,2018;李玉贝等,2017;贺志武等,2018;胡伦等,2018)。当被解释变量为离散、分类或是顺序变量的情况时,运用最小二乘法对模型估计会造成结果的有偏无效(刘亚克等,2011),离散选择模型则在估计被解释变量取值为有限的离散结果时具有突出优势,二元选择模型对于因变量是农户是否采用滴灌技术的模型而言具有较强的适用性。与此同时,在二元选择模型的基础上,学者们在估计方法上进行拓展,令对农户滴灌技术采用影响因素的研究更加丰富细致,如在Logit模型估计过程中增加中介效应估计。以贺志武等(2018)为代表的研究表明,农户风险偏好会通过风险认知的中介作用,间接影响农户节水灌溉技术采用的意愿;王格玲等(2015)运用分位数回归检验社会网络与农户节水灌溉技术采用之间的关系,得出社会网络对农户节水灌溉技术采用的影响总体上呈现倒“U”形关系的结论,并用门限回归模型对社会网络指数及结构与农户节水灌溉技术采用之间的倒“U”形关系进行稳健性检验;乔丹等(2017)运用结构方程模型检验社会网络对节水灌溉技术采用影响的直接效应与间接效应。此外,黄腾等(2018)还在农户节水技术采用成因分析的基础上进行拓展,运用内生转换模型分析有效节水灌溉技术采用对农业收入的影响,对本研究有重要的启示意义。