改进的群智能算法及其应用
上QQ阅读APP看书,第一时间看更新

1.3 发展概述

本节围绕合成孔径雷达目标识别,MEMS矢量水听器信号去噪和DOA估计,基于基因表达谱的癌症分类,传染病预测,机器人转向与地表水水质分类,空气质量指数预测与分类,股票指数预测进行讨论。

1.3.1 合成孔径雷达目标识别

雷达是一个有源系统,发射出的电磁波可以使我们观察到以前无法观察的地球表面特征[63]。作为一种有源系统,合成孔径雷达(synthetic aperture radar,SAR)是一种主动式的观测系统[64],主动发射能量而不依赖太阳光照,确保了全天时观察,而且云,雾和降水对微波影响都不大,保证了全天候成像,从而SAR系统就具备了连续观测运动现象的能力[65]和具有全天时,全天候的工作能力[66]。因此SAR已安装在卫星,舰船等多种平台上[67],已广泛应用于目标探测与追踪等方面[66]

世界各国投入了大量的精力进行SAR目标识别问题的研究,其中美国处在领先地位,比较著名的SAR ATR系统包括陆军实验室的SAR ATR系统和美国Sandia国家实验室的SAR ATR系统等[68]。SAR ATR系统是在雷达对目标进行检测和定位的基础上,根据目标和环境的雷达回波信号,提取目标特征,实现目标类别的判定。近年来,研究SAR图像的目标识别主要集中于基于美国运动和静止目标获取与识别(Moving and Stationary Target Acquisition and Recognition,MSTAR)的实测SAR地面静止目标数据[69]。国内对SAR的研究则相对较晚,不过现已在SAR图像的地物分割,分类和匹配以及舰船,道路识别等方面已经取得了一定的成果[69]

SAR图像的研究从算法实现的各个角度考虑,可以区分为有监督和无监督的算法,基于统计理论和神经网络的算法,分割和聚类的算法等[70]。目前已有研究SAR图像的方法有:基于模板匹配的SAR目标识别方法[69-72],基于模型的SAR图像目标识别方法[69][73][74],小波域非负矩阵分解特征提取方法[75],孪生卷积神经网络方法[76],迁移学习与深度卷积神经网络相结合的方法[77]和深度记忆卷积神经网络[78]等。特别是卷积神经网络作为深度学习的一种,能够直接将二维图像作为网络的输入,经卷积,池化等操作后可自动从原图中提取出低维抽象的特征[79],且权值共享等策略大大减少了权值数量,降低了网络训练的复杂程度[80]

1.3.2 MEMS矢量水听器信号去噪和DOA估计

近年来MEMS矢量水听器[81][82]因其优良的性能而被广泛使用于海洋,湖泊等水声环境中。但水声环境中的噪声复杂多变,MEMS矢量水听器收集到的源信号带有噪声,因此,有必要实现水声信号的信噪分离。波达方向角(Direction Of Arrival,DOA)估计是阵列信号处理领域的研究热点之一,在雷达、声呐、导航、无线通信、语音处理和射电天文学等领域具有较为广泛的应用[83-85]

目前已存在用来消除各种信号中的噪声和校正基线漂移的许多方法,例如有限脉冲响应[86],无限脉冲响应(Infinite Impulse Response,IIR)[87],自适应滤波器[88],小波变换方法[89],一般的硬阈值小波收缩方法[90],改进的小波阈值法[91],经验模态分解(Empirical Mode Decomposition,EMD)[92],集成经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)[93],变分模态分解(Variational Mode Decomposition,VMD)[94]等。

研究DOA估计的经典方法有多重信号分类(Multiple Signal Classification,Music)算法[95][96],最大似然估计(Maximum likelyhood Estimation,ML)算法[95]和旋转不变子空间算法(Estimation of Signal Parameters via Rotational Invariance Technique,ESPRIT)[95][96],这些算法以参数估计结果精确度高以及在低信噪比情况下的良好估计效果著称。随着计算机的发展和科学技术的进步,群智能算法与机器学习也应用于信号的DOA估计中,例如自组织神经网络[96],BP神经网络[97],灰狼算法[97],人工鱼群算法[98],引力搜索算法[99],果蝇算法优化广义回归神经网络[100]

1.3.3 基于基因表达谱的癌症分类

1999年首先提出基于基因表达谱的癌症分类是急性髓系白血病和急性淋巴细胞白血病的分类,这与以前的生物学知识分类完全不同[101]。自此以后,基于基因表达的癌症分类越来越引起研究人员的注意[102-104],成为研究热点问题之一。目前已经在癌症分类中采用了很多方法,如SVM[105-107]、独立因子分析[108]、间隔值分类[109]、基于粒子群优化的改进的间隔值分类[110]和k最近邻域[111]、遗传算法[112]、决策树[112]、人工神经网络(Artificial Neural Network,ANN)[113]等分类方法被广泛用于基因表达谱数据的分类。Furey等[114]分别以卵巢癌、结肠癌和白血病为研究对象,通过计算信噪比提取特征基因,运用SVM的方法分析基因表达谱数据,建立肿瘤预测模型。

1.3.4 传染病预测

准确监测和跟踪传染病有助于减少传染病的传播并将其风险降到最低,帮助卫生官员制定预防措施,并促进诊所和医院管理人员获得最佳人员配置和储备决策,有助于卫生官员制定预防措施和协助诊所医院管理人员[115]

准确地实时监测、早期检测和预测传染病,已经存在很多方法,如基于互联网搜索的谷歌流感趋势(Google Flu Trends,GFT)预测方法[116],自回归综合移动平均(Autoregressive Integrated Moving Average,ARIMA)模型预测H1N1流感[117],采用集成神经网络即组合自适应提升框架AdaBoost(Adaptive Boosting)和回声状态网络(Echo State Network)预测艾滋病[118]。文献[119]总结了传染病预测的各种方法,如人工神经网络及其变形、贝叶斯网络、图及其变形、决策树等。文献[120]探讨了利用人工智能方法分析大量传染病数据,有效地检测这些传染病。

1.3.5 机器人移动转向与地表水水质分类

机器人协助或取代人类的工作,广泛应用于医学、军事、工业和人类的日常生活等多个领域,特别是移动机器人因为具有非常强的实用性而被广泛研究[121]。例如:文献[122]利用模糊Elman网络算法建立了移动机器人路径规划模型实现最优的路径规划;文献[123]对多蚁群优化算法、融合蚁群算法在移动机器人路径规划方面的应用进行了分类比较与分析;文献[124]提出了一种预测越野移动机器人单轮打滑的新方法。

地表水的质量对人类的生活和身体健康状况都有着非常重要的影响。随着时代和社会的进步,人们对于地表水的质量研究的关注度正在逐渐增加,例如:文献[125]建立了小型水质遥感影像样本数据库,利用卷积神经网络模型实现对运河水质的快速分类;文献[126]采取聚类算法对目标值进行分类,通过计算各个数据点到聚类中心的距离来判别每个水样的类别;文献[127]利用图像分割方法,求取鱼体的质心坐标,通过鱼体的运动轨迹图像,制作正常与异常水质下两种轨迹图像数据集,建立卷积神经网络对Inception-v3网络提取的特征进行分类。

1.3.6 空气质量指数的预测与分类

随着人们生活水平的提高以及能源的大量消耗和污染物排放,人们生活的环境遭到了很大的破坏,特别是空气污染造成的雾霾天气,严重影响着人们的日常生活和身心健康。因此,空气质量预测与分类对指导人们生活和工作具有极其重要的意义[128]

很多研究人员致力于空气质量的预测与分类,并取得了很好的成绩。目前已存在很多空气质量指数(Air Quality Index,AQI)预测与分类的方法,如随机森林算法[129],小波Mallat算法和BP神经网络[130],社区划分的非线性回归[131],以互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)为基础的CEEMD-Elman模型[132],递归神经网络[133],改进的指数递减惯性权重-粒子群优化算法去优化径向基函数神经网络[50],时变惯性权重策略的PSO与重力搜索算法(GSA)相结合的混合算法TVIW-PSO-GSA[135]以及粒子群优化极限学习机[135]

1.3.7 股票指数预测

股票市场存在于我们的生活中,影响着人们的日常生活。预测股票指数的方法包括人工神经网络[7-5657136-148]、SVM[146][149-150]、自回归综合移动平均(ARIMA)模型[137][150]、自适应指数平滑模型[136]、期望理论[151]和多元回归模型[152-153]等。

目前,群智能算法的提出及其应用广泛,使得机器学习与之相结合构建新的模型预测股票趋势或股票价格。例如:Qiu等人[7]利用GA优化ANN模型获得最优的权值和偏差预测日本股市指数的走向;Chong等人[154]最近对深度学习网络在股市预测中的应用进行了系统分析,并使用深度学习网络对韩国KOSPI38股票收益率进行了预测;Salim Lahmiri[155]利用奇异谱分析将股票价格时间序列分解为少量独立分量作为预测因子,并结合PSO对支持向量回归机(Support Vector Regression,SVR)参数进行优化预测。

1.3.8 预测性能指标

评价模型预测性能的5种指标为均方误差(Mean Square Error,MSE)、平均绝对误差(Mean Absolute Error,MAE)、根均方误差(Root Mean Square Error,RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)和决定系数R2,具体定义如下:

式中:ysts分别为第s个样本的预测值和目标值(s=1,2,…,Q),Q是样本数。