3.3 人工智能在植物病虫害识别中的应用研究
森林病虫害是林业生产中极具破坏性的生物自然灾害,对我国的林业生产和生态环境造成了巨大危害,严重制约着我国林业的可持续发展。迄今为止,中国的森林病虫害种类共有8000多种,每年造成的经济损失高达50多亿元。过去10年年均森林病虫害发生面积1170万hm2,其主要表现为:危险性森林病虫害扩散蔓延迅速,对森林资源和自然景观构成巨大威胁;常发性森林病虫害面积居高不下,总体呈上升趋势;偶发性森林病虫害大面积爆发,损失严重(高永刚等,2006)。如何及时有效监测和防治森林病虫害成为林业工作者亟待解决的难题。
3.3.1 植物病虫害识别技术发展概况
植物病虫害识别最初是利用人工进行目测鉴别,这就要求工作人员具有很强的专业能力,且存在人工判断主观性强的问题,而且偏远地区或地势险峻的地方人员难以进入,无法对植物病虫害情况进行及时判别。随着计算机图像处理技术在生态领域的应用,基于图像分析技术的植物病虫害识别也取得了一些成果。张真等利用基于颜色直方图与双树复小波的昆虫图像自动分类、积分区域匹配和双树复小波的昆虫种类识别、颜色直方图和灰度共生矩阵的昆虫图像自动分类、昆虫区域颜色特征及支持向量机的昆虫分类等方法对森林害虫进行识别,取得了良好的效果(张真等,2010)。王正宏选取3类林业害虫为研究对象,实现对林业害虫图像的边缘检测,提取林业害虫图像的几何形状特征,并用差分盒维数方法提取了害虫的纹理特征,最后用支持向量机分类器初步实现了林业害虫的分类(王正宏,2010)。赵瑶池等提出一种基于纹理差异度引导的农作物病虫害精准分割方法:首先采用基于混合高斯模型的纹理差异度表示方法得到纹理差异度图像,然后利用Otsu自动阈值分割和形态学后处理可获得精准的害虫和病变区域轮廓(赵瑶池等,2015)。张烁等运用数字图像处理技术,针对杨树病害孢子图像的特性特征,提出一种采用弹性算法改进的BP神经网络模型用于杨树病害孢子图像的快速边缘检测(张烁等,2016)。Yuan等提出基于超像素和随机森林的方法检测虫害树,首先利用简单线性迭代聚类超像素分割算法将无人机图像分割成许多超像素;然后计算每个超像素中红、绿、蓝各颜色分量的均值、方差、最大值和最小值;最后基于上步计算出的颜色特征使用随机森林分类器训练和分类超像素,从而提取图像中的森林病虫害区域(Yuan et al.,2016)。牛冲等提出一种基于图像灰度直方图特征的草莓病虫害识别算法识别草莓蛇眼病,该算法首先计算训练集草莓叶片灰度图像的直方图,然后提取直方图的8个特征(平均灰度、标准偏差、三阶中心矩、平滑度、均匀性、平均信息量、最大概率灰度级、灰度范围)并进行归一化处理,通过支持向量机、K近邻及朴素贝叶斯3种识别方法对8个特征进行训练,得到相应的病虫害识别分类器(牛冲等,2017)。
近年来深度学习在计算机视觉领域获得突破性进展,并在植物病虫害识别领域得到初步应用。顾文璇将深度卷积神经网络应用于大豆叶片病虫害的识别,针对不同大小的输入数据设计不同网络结构,得到分割和识别结果,并与其他传统分类方法进行对比,发现深度学习的算法更为有效(顾文璇,2017)。周瑶以在田间和大棚采集到的典型有翅昆虫作为研究对象,以黄板和树莓派摄像头构建图像采集系统,对比了基于连通区域标记和基于深度学习网络YOLO的有翅昆虫检测与计数方法,然后提取有翅昆虫的颜色、形状、纹理等全局特征和HOG局部特征,并对比了YOLO深度学习网络、支持向量机和BP神经网络对指定种类的有翅昆虫的分类结果,研究表明,YOLO深度学习网络取得了更好的计数结果,支持向量机是很好的分类器(周瑶,2017)。张善文等引入冬枣病虫害的环境先验信息,提出一种基于环境信息和改进深度置信网络的冬枣病虫害预测模型,自2014年至2017年利用农业物联网传感器采集30个大棚冬枣常见的2种虫害和3种病害发生的环境信息序列6000多条,由此验证所提出的预测模型,其平均预测正确率比基于强模糊支持向量机的高出20多个百分点(张善文等,2017)。
3.3.2 植物病虫害监测技术
植物病虫害会造成森林植被的大量死亡并带来严重的经济损失,须及时发现病害植物,以便采取焚烧、就地砍伐等措施阻止疫情扩散。最常用的植物病虫害监测手段是利用人工进行监测,主要有以下3种方式(费运巧,2016):定期安排林场工作人员对易受灾的重点林区进行人工巡查,若发现疑似受灾林木则进行标记取样并验定;利用诱捕器诱捕待监测林区的致灾病虫,调查失叶率、虫口密度等相关数据,以判定林区的受灾情况;发动林区居民在日常生活中及时观察林木健康状况,发现异常情况及时上报当地森防站以采取有效防治措施。
与传统的人工巡查监测病虫害技术相比,使用地理信息系统的空间分析能力结合病虫害监测与预测模型对遥感数据进行分析,可以直观地观察到病虫害的分布情况。王植等首次提出利用高光谱遥感技术监测板栗病虫害,根据板栗植株染病前后光谱反射率的差异和结构异常在遥感数字图像上的记录,并结合地面调查,可实现板栗病虫害的早期监测,为利用高光谱遥感技术监测板栗病虫害提供了理论依据(王植等,2010)。李浩明基于组件式GIS技术及面向对象方法,结合已有病虫害监测预警模型,建立了完整的植物病虫害遥感监测及预测模型,使遥感数据能够在GIS平台中就可完成定量评价过程,探索了GIS和遥感在病虫害监测和预测方面的深度应用,病虫害监测与预测结果可以在地图上很明确地显示出来,让使用者对病虫害的分布和发展情况做到宏观上的把握,有利于病虫害防治工作的进行(李浩明,2011)。李新枝以湖北省武汉市黄陂区遭受马尾松毛虫危害的马尾松林为研究对象,选取虫害密度不同的林分设置标准地,利用携带高清相机的小型无人机,对不同受害程度的马尾松林分进行拍照,并以Landsat 8同步卫星遥感影像为数据源,通过对不同空间分辨率的低空无人机图像及高空卫星遥感图像数据进行分析,提取各种植被指数和纹理指标等,分析不同马尾松毛虫虫害程度在不同空间分辨率图像上的变化规律,建立马尾松毛虫危害程度与遥感数据之间的联系,为制定不同空间尺度遥感卫星数据的松毛虫危害诊断标准奠定基础(李新枝,2016)。张衡等提出基于高光谱数据提取的生化参数进行统计分析与建模,并基于高光谱遥感影像的图像处理分析技术,对森林病虫害进行高光谱遥感监测(张衡等,2014)。卢劲竹以果蔬植物(番茄、草莓)为研究对象,利用高光谱成像技术和荧光成像技术,经过2012—2015年的研究及实验,实现了植物叶部病害的田间检测,提出了田间基于光谱特征的叶部病害检测方法,搭建了田间光谱数据采集装置并实现了田间炭疽病叶片的早期检测和不同病害程度炭疽病叶片的分类,为其他同类植物及其叶部病害的快速实时诊断奠定了较为扎实的理论基础(卢劲竹,2016)。胡根生等利用无人机搭载双光谱相机获取高分辨率遥感病害松树图像,提取地物特征,构建特征向量,用改进的加权小波支持向量数据描述模型描述每类样本,根据待测样本在特征空间中的不同分布,分别采用最小相对距离法和隶属度函数法进行决策分类,实现了对病害松树的识别(胡根生等,2014)。针对最具危险性的林业有害生物——油松线虫病虫害,吴琼采用遥感图像处理技术对受灾区域进行检测,提出了一种基于感兴趣区域(Region Of Interest,ROI)检测与纹理特征相结合的松材线虫病检测方法。该方法通过使用基于频域调节的ROI检测,提取出遥感图像中包括病虫害区的所有的ROI,再利用深度神经网络分类方法对这些ROI进行分类,完成对遥感图像中的病虫害区域检测(吴琼,2013)。陈红艳以四川阿坝州理县云杉落针病为例,依据遥感监测森林病虫害基本原理与物理基础(即受害植被的反射率会发生明显变化),对地面调查点的数据和植被覆盖指数变化率进行一元回归分析,建立受害程度与植被覆盖指数变化率的一元回归模型(陈红艳,2017)。
近年来无人机作为一种低空飞行工具,具有操作灵活、拍摄时间自由、飞行成本低等优点,李卫正等利用小型无人机采集松材线虫病疫情地区的高空间分辨率影像,并经摄影测量软件LPS正射处理后,导入GeoLink软件中,人工目视寻找感病变色的病死木。该方法监测实施效率高,系统维护和使用成本较低,可为疫情区域判断疑似病死木提供定位技术支持(李卫正等,2014)。吕晓君等通过无人机对受害松林进行低空航拍,并将航片结合POS数据信息,利用空中三角测量技术制作成数字正射影像图(DOM),然后利用受害松树树冠颜色改变的特征对DOM进行目视解译,再对变色枯死木进行定位标注,最终统计出作业区域内变色树木数量(吕晓君等,2016)。
人工目测无人机图像中受灾区域耗时费力,科技人员开始探索结合图像分析技术对无人机采集的植物病虫害图像进行快速智能化监测的新方法,主要是利用无人机搭载可见光相机或高光谱成像仪,通过计算机自动分析所获取的高分影像及高光谱数据,及时发现森林病虫害区域,为实施治理措施及灾害损失评估提供依据。森林病虫害的航拍图像能够从多个角度较为全面地描述森林的整体情况,并利用计算机图像处理技术分析林区图像的颜色、纹理等特征对植物病虫害进行识别。刘文萍等利用无人机搭载可见光相机,对辽宁建平地区的油松和沙棘正射图像进行分析,提出了基于分数阶微分的标记分水岭算法,可准确识别出受灾沙棘(Liu et al.,2015)。该课题组还提出了一种二型模糊聚类算法,可准确识别受灾油松(Zhong et al.,2017)。张军国等提出一种基于复合梯度的分水岭图像分割算法对虫害图像进行处理。该方法引入全局直方图均衡化消除了图像暗纹理的影响,并采用形态学混合开闭重构滤波完成了图像样本的去噪处理,计算灰度图像各像素点的复合梯度实现了非相关区域(道路及裸地)的提取,最终利用分水岭算法实现了虫害区域的分割提取(张军国等,2017)。
3.3.3 人工智能植物病虫害识别关键技术
近年来,基于图像识别的病虫害识别方法在一定程度上解决了植物病虫害诊治问题,然而由于病虫害种类繁多,图像质量受光照影响较大,应用条件受限等问题为检测方法的有效实施带来很大难度,其实时性和准确性有待提高。随着深度学习技术在工业、服务业、医疗等行业的成功应用,将图像识别与深度学习技术相结合成为植物病虫害识别的新方向(图3-13)。
图3-13 无人机图像识别林区病虫害示意图
(1)图像分类。图像分类是指将一幅图像归为某种类别,其作用类似于人眼观察一幅图像,根据人所具有的知识辨认出图像中的物体,然后将该图像分到相关的图像类中。图像分类的主要步骤是首先利用特征提取函数提取图像中的颜色、纹理、形状等图像特征,然后将提取出的特征经分类器进行训练,最后利用训练好的分类模型对图像进行分类。
相较于传统的基于图像特征的图像分类方法,卷积神经网络拥有特征自主提取、自主学习的能力,并通过权值共享的方式大大简化了网络结构,使其所需的计算量明显下降。此外,卷积神经网络有着学习迁移的能力,经过训练的网络可以将之前所学到的特征应用于一项新的图像分类任务中,从而有效改善传统图像分类方法通用性差的问题,并且能大大提高图像分类的准确率及效率(杨泽明等,2018)。卷积神经网络(Convolutional Neural Network,CNN)的人工神经元可以响应一部分范围内的单元,对于图像处理有着出色的表现。由于卷积层中特征图的每个神经元与其输入进行局部连接,并通过对应的连接权值与局部输入进行加权求和再加上偏置值,该过程相当于卷积过程,CNN也由此而得名(Lécun et al.,1998)。在卷积神经网络中,一个卷积层可以有多个不同的卷积核(滤波器),每个卷积核在输入图像上滑动且每次只处理一小块图像,这样输入端的卷积层可以提取到图像中最基础的特征。CNN的基本结构由输入层、卷积层、池化层(下采样层)、全连接层及输出层构成。卷积神经网络的输入通常为原始图像。卷积层和池化层一般会取若干个,采用卷积层和池化层交替设置,即一个卷积层连接一个池化层,池化层后再连接一个卷积层,以此类推。卷积神经网络的训练目标是最小化网络的损失函数,输入的特征图经过前向传导后通过损失函数计算出与期望值之间的差异,称为“残差”。训练过程中,卷积神经网络常用的优化方法是梯度下降方法,残差通过梯度下降进行反向传播,逐层更新卷积神经网络的各个层的可训练参数,最终通过全连接层输出该图像属于某一类的概率分布,实现对图像的分类等任务(周飞燕等,2017)。随着卷积神经网络相关研究的不断推进,其相关应用领域的精度也得到了迅速的提高,在AlexNet将ImagNet的图像分类准确度大幅提升到84.7%之后,不断有改进的卷积神经网络模型被提出并刷新了AlexNet的纪录,由微软提出的ResNet已经将ImageNet的图像分类准确度提高到了96.4%。
(2)图像分割。图像分割是图像识别的首要步骤,它是按照一定准则将图像划分成若干个互不重叠的区域,且这些区域需具有均匀性和连通性。其中,均匀性是指该区域中的所有像素点具有相似的颜色、纹理等图像特征;连通性是指在该区域内存在连接任意两点的路径。从20世纪60年代起,国内外的专家学者就针对图像分割算法进行了广泛深入的研究,目前应用较为广泛的方法有如下几类:一是基于阈值的图像分割算法。按照判别准则函数自动求取图像像素灰度阈值,根据应用场景将高(或低)于阈值的像素确定为目标区域,低(或高)于阈值的像素设为背景区域。二是基于边缘的图像分割算法。图像的边缘指的是图像上灰度、彩色、纹理等信息不连续的或变化剧烈的位置。基于边缘的图像分割算法是利用图像梯度算子寻找图像内各物体的边缘,利用边缘信息完成图像的分割。三是基于区域的图像分割算法。以在图像空间中所划分的区域满足同质性为准则来提取若干特征相近或相同的像素点组成区域,常用的算法是区域生长与分裂合并。四是基于聚类的图像分割方法。聚类是将一组物理的或抽象的对象,根据一定的相似性准则对其进行区分或分类的过程。聚类的结果是使类内样本尽可能相似,类间样本尽可能相异。五是基于变形模型的图像分割。通过对图像曲线的能量方程进行最小化,使曲线收敛于目标的边缘。六是基于遗传算法的图像分割。遗传算法是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,常被用来自动选取分割阈值或优化参数。近年来,随着学者对数学知识的深入研究及人们对图像分割精度要求的提高,模糊聚类、人工神经网络、机器学习等技术在图像分割中得到了广泛的应用并取得了较好的效果,自动分割技术为图像分割领域提供了广阔的前景。
(3)病虫害分类及检测。图像分类是将图像结构化为某一类别的信息,用事先确定好的类别来描述图片,即把图像划分为单个类别,通常对应图像中最突出的物体,这一任务是最简单、最基础的图像理解任务。但在植物病虫害识别中,图片中通常包含不止一个目标,此时如果使用图像分类模型给图片分配单一的类别,其实是非常粗糙而不准确的方式。对于一张图片上有多个害虫或多处病斑的情况,需要目标检测技术针对图片中的每一个目标给定目标的类别和位置。分类任务关心整体,给出的是整张图片的内容描述,而检测则关注特定的物体目标,要求同时获得这一目标的类别信息和位置信息。
目前国内外的病虫害分类及检测的研究工作多数为以下两个方向:一是设计并提取基于计算机视觉的病虫害特征。该方法多采用病虫害图像的全局特征,如颜色特征、形态特征、纹理特征等。如基于内容的图片检索方法,这种方法需要对图像进行预处理来分离病虫害目标与背景后,再对图像进行特征提取,利用模板匹配算法作为相似度算法计算查询图片和模板图片的相似度,选取相似度最高的几个作为候选。由于基于全局特征的描述能力具有局限性,近年的研究出现了许多局部特征与全局特征相结合的特征表达方式,局部特征主要是局部区域或者点生成的对于照明、旋转、局部视点变化具有不变性的信息。此外,还有使用文字描述Semantically Related Visual(SRV)属性描述害虫局部特征及稀疏编码与空间金字塔模型相结合的图像表示方式检测植物病虫害。二是选择和优化基于机器学习的分类模型。常用的分类器主要有支持向量机(Support Vector Machine,SVM)、人工神经网络、K-nearest neighbor算法、Principal Component Analysis(PCA)方法等。利用此方法进行病虫害识别,需要在预处理后,人工设定待识别目标的多个颜色、形状及纹理等特征,并设计不同模型提取目标特征,再使用分类器进行分类,输出分类结果。上述算法中的特征本质上仍是由人工预先设定,虫体的完整性和不同物种间的相似性对结果有较大影响,并且对检测环境也有很高的要求,需要进行复杂的图像预处理。有些方法使用标本图像进行训练和测试,或要求显微镜、多角度拍摄等较高的拍摄条件,无法应用于自然环境中复杂背景下的检测。因此这些方法仍无法满足植物病虫害全自动监测的需求。
(4)深度学习。随着卷积神经网络在图像分类及目标检测任务方面的成功应用,一些利用深度学习实现病虫害检测的研究逐渐开展。深度学习技术不需要人工设定图像特征,计算机可自我学习大量图像数据中病虫害特征并生成特征的表达关系,可以很大程度上解决复杂背景、亮度不均和昆虫姿态及病斑多样化导致的识别困难问题。目前国内外研究者开展利用深度学习对病虫害识别研究中,已有利用目标检测技术对诱捕器和粘虫板中简单背景下的害虫进行识别计数,实现全自动、实时害虫检测系统。此外,还利用AlexNet、GoogleNet和ResNet等深度学习目标检测网络,检测复杂自然背景下的病虫害。
尽管基于深度学习的植物病虫害识别模型进一步提高了开放环境下多物种多病种的分类准确度,但实际应用中效果仍不理想。目前已实现自动化害虫识别的方法通常检测背景单一,无法保证复杂背景下害虫的精确识别。现有技术实现自然环境下病虫害的识别,还需依赖交互式的图像分割等人工操作,或在识别前通过图像处理算法获得昆虫的生态学形状、分割状态、颜色等特征,无法实现全自动化虫口统计、病害检测。虽然目前在植物病虫害识别领域,已有与植物病害相关的数据集PlantVillage,面向这一数据集,国内外学者提出了诸多精度较高的目标检测网络结构。但这些网络均为针对通用数据集的检测,在实际应用中针对特定环境下病害检测结果仍不理想,其中迁移学习的GoogleNet模型在PlantVillage数据集的准确率高达99.35%,但对开放环境中病害图片的识别率仅为31.40%,且目前针对植物虫害还存在数据量不足、数据类型单一的问题。在植物病虫害领域,尚无整合环境数值信息、病害选项信息和多器官图片信息的多模态数据集。此外,现有目标检测网络通常需要GPU等硬件环境配合,较难应用于实际农林业生产活动中。
因此,为将人工智能技术应用于林业生产,实现快速自动识别林间自然环境下的病虫害,亟待建立一个植物病虫害多模态大数据集,为病虫害的快速自动识别提供可靠依据。在数据的支持下,面向特定病虫害的轻量级目标检测深度神经网络的模型结构及训练算法仍是需要进一步探索研究的方向。此外,随着移动通信技术发展,在通过嵌入式平台及智能手机等便携式设备上部署检测模型,将检测结果传输至监测平台,可实现病虫害智能化远程实时监测,如图3-14所示。
图3-14 基于深度学习的病虫害检测