二、研究方法与数据概况
(一)研究方法
为了深入研究数字技术对农业产出的影响,本研究假设农业生产函数为C-D函数:
其中,Y为农业产出,L为劳动力投入,K为化肥等物质资本投入,T为土地投入,A为数字技术投入,α、β、γ分别为外生参数。
通过对式(1-1)两边取对数,可得:
因此,亩均农业产出可表示为:
在此基础上,由于亩均农业产出还会受到其他控制变量X的影响,因此本研究计量模型的表达式如下:
其中,因变量lnyi为亩均农业产出的对数,核心自变量lnai为亩均数字技术应用的对数,控制变量包含lnli、lnki、Xi,lnli为亩均劳动力投入的对数,lnki为亩均物质资本投入的对数,Xi为拟选择信息化环境与区域虚拟变量。
本研究采用分位数回归法,对数字技术应用与农业产出之间的关系进行稳健性检验。由于分位数回归能够对因变量进行条件分布刻画,每个分位点上的回归系数(特别是中央或尾部)具备该条件分布中的特性,因此,通过分位数回归法,能够识别出数字技术应用对农业产出的全部分位影响情况,有助于验证基准模型的有效性与稳健性。分位数回归模型表达式如下:
其中,Qq(lnyi|X)表示在给定自变量X,因变量lnyi在第q分位数上的值,θ(q)表示在第q分位数上的回归系数。
为了研究在不同资源禀赋环境下,应用数字技术对农业产出的影响,本研究首先根据亩均劳动力投入和亩均物质资本投入两个分组变量,将总样本分为若干个子样本;其次针对不同劳动力资源禀赋乡镇群体、不同物质资本禀赋乡镇群体,分别进行OLS回归,回归模型如下:
其中,w为本研究的分组变量,分别表示亩均劳动力投入与亩均物质资本投入,w0为分组变量的分组临界值。为了避免因样本量的限制而影响回归效果,本研究均根据分组变量将样本划分为两个组别。其中,由于亩均劳动力投入和亩均物质资本投入为连续变量,本研究将选取其0.5分位值作为分组临界值w0,根据分类,分别对各样本进行OLS回归,并将测算结果进行组间差异性比较。
(二)数据概况
1.数据来源
本研究所用数据来自2022年2月开展的“北京乡镇设施农业数字技术应用抽样调查”。近年来,北京市积极推进人工智能、5G、物联网、北斗、大数据、区块链等新一代数字技术与农业深度融合应用,在设施农业领域,部署了一批农业物联网工程、高效设施工程等,因此选取北京市设施农业领域开展研究具有代表性。本研究选取朝阳区、海淀区、丰台区、门头沟区、房山区、通州区、大兴区、顺义区、昌平区、平谷区、怀柔区、密云区、延庆区13个区的乡镇干部进行随机抽样调查。为了提高调查效率和数据质量,以调查问卷形式开展调查,开发了专门的App应用软件,并对答题时间进行了规定,共发放问卷200份,回收有效问卷172份。
2.变量选择与描述性统计
(1)因变量与核心自变量。对于因变量,本研究采用亩均农业产出来测度乡镇农业的产出情况,亩均农业产出是亩均设施农业产值的自然对数,均值为3.91。对于核心自变量,本研究聚焦于数字技术投入,为了使表征变量更具代表性和科学性,本研究核准了每个乡镇设施农业数字技术(包含生产环境监控技术、水肥一体化技术、病虫害监测预警技术等)应用总面积,因此本研究采用亩均数字技术应用面积的自然对数来表征数字技术投入,均值为0.02。由t检验初步可知,高数字技术投入乡镇(高/低数字技术投入是根据0.5分位值作为分组临界值划分的)的亩均农业产出均值为7.07,显著高于低数字技术投入乡镇的亩均农业产出均值3.40(见表1-3)。
表1-3 数字技术投入与农业产出t检验
注:***表示在1%水平上显著。
(2)控制变量。为了精确测算核心自变量对因变量的边际影响效应,本研究基于理论模型推导,在计量模型中加入了劳动力投入、物质资本投入、乡镇信息化环境以及乡镇区域虚拟变量,以控制其他因素可能造成的回归偏误。其中,劳动力投入是乡镇亩均设施农业从业人员的自然对数;物质资本投入是乡镇亩均设施农业化肥投入的自然对数;乡镇信息化环境由乡镇电商服务站覆盖率与政府农业信息化部门设置情况两个变量表征,乡镇电商服务站覆盖率是已建电商服务站的乡村数与行政村总数比值的自然对数,政府农业信息化部门设置情况是对是否设置承担信息化工作的行政科室、信息中心、信息站的评价;乡镇区域虚拟变量是根据北京市城市功能分区,将通州、大兴、顺义、昌平4个都市型现代农业的主要载体区域与其他区进行区别。在样本中,亩均劳动力投入的均值为0.23、亩均物质资本投入的均值为3.55、电商服务站覆盖率的均值为0.26、政府农业信息化部门设置情况的均值为0.59、区域虚拟变量的均值为0.30。
(3)工具变量。在内生性检验中,使用“亩均农业数字技术财政支持金额”作为工具变量,该变量是每个乡镇政府对促进农业数字技术推广应用的财政支出金额,为较好匹配核心自变量,同样计算了亩均金额的自然对数,其样本均值为1.18(见表1-4)。
表1-4 变量及其描述性统计
续表