网站首页 公文大全 个人文档 实用范文 讲话致辞 实用工具 心得体会 哲学范文 总结范文 范文大全 报告 合同 文书 信函 实用
  • 汇报体会
  • 节日庆典
  • 礼仪
  • 毕业论文
  • 评语寄语
  • 导游词
  • 口号大全
  • 其他范文
  • 百花范文网 > 实用范文 > 其他范文 > 基于海洋捕食者算法和ELM的空气质量指数预测,*

    基于海洋捕食者算法和ELM的空气质量指数预测,*

    时间:2023-06-26 09:50:08来源:百花范文网本文已影响

    龚 荣,谢宁新,李德伦,洪丽啦

    (广西民族大学 a.人工智能学院,b.电子信息学院,广西 南宁 530006)

    随着经济快速发展,城市工业和城镇化排放的大量污染气体造成严重的空气污染。空气污染对人类健康的危害逐日递增,环保部门逐渐重视空气质量监测,并实时发布监测数据。为增强空气质量预警能力和提高预警的精确度,学者们提出了多种空气质量指数(Air Quality Index,AQI)预测模型。精准的预测模型能够有效改善城市人民的生活,更是有效治理城市大气污染的突破口之一。空气质量指数通常反映了空气污染的变化趋势,可为空气污染治理措施提供数据支撑。由于AQI的复杂性和非线性等原因导致预测精度低、稳定性差。[1]

    目前,学者提出了多种模型来预测空气质量指数,主要有时间序列模型、回归统计模型、神经网络模型[2]、组合预测模型[3]、机器学习预测模型[4]以及人工智能模型[5]等。这些模型在预测空气质量指数上都各有优势和不足。神经网络模型在处理非线性问题中表现良好的性能,引起学者的广泛关注。张辰等人[6]提出深度神经网络预测空气质量,在一定程度上提高了预测准确性,但预测模型在训练大量数据过程中需要耗费较多的时间。张旭等人[7]运用粒子群算法和遗传算法优化BP神经网络预测PM2.5浓度,较单独使用BP神经网络预测具有更强的性能。但BP网络的反向传播更新参数过程中存在训练速度慢、训练过程比较复杂等问题。

    极限学习机(Extreme Learning Machine,ELM)[8]是Huang等人基于广义逆矩阵理论提出的一种神经网络,该方法能够在极短时间内快速获得较好的泛化能力,且能够避免神经网络因训练网络而产生的耗时问题。周伯荣等人[9]将ELM用于短时交通流预测,比其他模型耗时更少。ELM预测模型通常采取随机生成输入权重和偏置,从而导致了预测精度不高。针对这个问题,学者们运用优化算法的强大优化能力优化ELM的参数,郑皓天等人[10]将粒子群算法和ELM结合运用在火灾探测模型中,提高了火灾探测能力;
    汪慧阳等人[11]将遗传算法和ELM结合用于通信干扰评估,相比传统方法具有更优的评估结果。随着对优化算法的深入研究,学者提出了一系列优化能力更强的优化算法。其中海洋捕食者算法(Marine Predator Algorithm,MPA)[12]同其他算法相比具有更好的优化能力,该算法是由Faramarzi等人提出的一种新的元启发式算法。MPA在解决实际问题中展现出了较好的优化能力,但仍然存在优化能力不足的问题。

    为了提升MPA的性能,本文提出了一系列改进方法来提高算法优化能力。首先在MPA中通过随机生成初始种群,使得初始解在搜索空间分布不均,导致初始种群多样性不足。本文运用准反射学习策略对MPA种群进行初始化,增强算法种群的多样性,提升算法的探索能力。其次MPA的全局搜索能力不足,本文使用柯西扰动思想降低算法陷入局部桎梏的可能,在一定程度上能够提升算法的全局搜索能力。由于MPA算法在迭代过程中部分维度还未达到最优,本文通过纵横交叉策略实现对维度间的学习,进一步提升搜索精度。最后将改进后的算法优化ELM的参数,构建了一种IMPA-ELM模型用于空气质量指数预测。实验结果表明本文所提IMPA-ELM模型在空气质量指数预测方面具有较高的精度和可靠性。

    1.1 海洋捕食者算法

    MPA的灵感来源于海洋生物的莱维运动和布朗运动捕食策略,以及捕食者和猎物之间的最佳遭遇策略。MPA也是一种基于种群的优化算法,若种群数量为n并且个体维度为d,则用公式(1)表示初始种群。

    公式(1)中,Xij表示第i个个体在第j维上的值,i∈[0,n],j∈[0,d]。Xmin和Xmax分别表示搜索空间的下界和上界。

    MPA中的精英矩阵和猎物矩阵,分别用公式(2)、公式(3)表示:

    公式(2)中,XI表示精英捕食者向量,精英矩阵是由该向量复制n次而构建。MPA的优化过程是根据不同的速度比分为3个阶段。第1阶段:高速比阶段(v≥10),该阶段发生在迭代前期。该阶段主要进行勘探行为,其位置更新如下:

    在上述公式中,表示服从布朗运动的随机数向量。P=0.5是一个常数,∈(0,1)是一个均匀分布的随机向量。

    第2阶段:单位速度比阶段(v=1),该阶段发生在迭代中期。该阶段表示种群从勘探到开发的过渡,此时整个种群被划分为两个部分,其中一部分负责勘探,另一部分负责开发。其位置更新如下:

    在上述公式中,表示莱维分布的随机数向量;
    CF表示移动步长。

    第3阶段:低速比阶段(v=0.1),该阶段发生在迭代后期。该阶段主要负责开发。其位置更新如下:

    MPA中考虑到捕食环境变化对捕食者的影响,此阶段的位置更新所示:

    公式(13)中,FADs=0.2表示受捕食环境变化影响的概率,U→是一个只包含0和1的二进制向量。r是[0,1]中的均匀随机数表示种群中两个不重复的随机个体。

    1.2 极限学习机

    极限学习机是一种单隐层前馈神经网络(Single-hidden Layer Feedforward Neural Network,SLFNs)[8]。极限学习机不需要像BP神经网络中通过反向传播训练使误差降低。所以ELM不仅能减少预测模型的运算量,并且该模型的学习效率高、泛化能力强。

    极限学习机由输入层、隐藏层、输出层组成。假设有N个样本数据为1,2,3,…,N},若具有L个隐藏层神经元,激活函数为g( ⋅ ),则输出层的输出结果可用下式表示:

    在ELM模型中,ω和b的值是随机生成的,而参数β则需要计算,因此ELM模型的主要任务是对参数β的计算。而在模型训练过程中,其输出结果表示为:

    公式(15)中,H为隐藏层节点的输出,β为输出权重,T为输出层节点的期望输出。其H,β,T用矩阵分别表示为:

    为了能够在模型训练结束后,期望训练的结果最大程度接近真实值,只需要ELM模型满足公式(18)即可。

    公式(18)通过数学方法可以求出:

    其中,H+为矩阵H的Moore-Penrose广义逆。

    2.1 准反射学习初始化种群

    在MPA中种群的初始化是随机生成的。这种方式使得初始解在搜索空间分布不均,导致初始种群多样性不足。因此本文提出准反射学习(quasi-reflection-based learning,QRBL)[13]初始化种群来增强MPA初始种群的多样性,提升算法的探索能力。

    准反射学习也称拟反射学习,是反向学习(opposition-based learning, OBL)的一种变体。文献[14]表明准反射学习比反向学习更可能接近全局最优解。定义1和定义2给出了准反射学习的概念。

    定义1若x为实数并且x∈[a,b],那么x的准反射数可表示为xˉqr=rand((a+b)/2,x),其中rand()表示服从均匀分布的随机数。

    定 义2若P={x1,x2,…,xn}为 一 个n维 向 量 空 间 的 点,其 中x1,x2,…,xn都 为 实 数 且xi∈[a,b],∀i∈{1,2,…,n}。则P的 准 反 射 点,其 中可 表 示 为,而rand((ai+bi)/2,xi)表示在(ai+bi)/2与xi之间均匀分布的随机点。

    准反射学习引入到MPA中的种群初始化阶段生成初始种群的具体步骤为:假设算法初始种群数量为n,首先通过随机策略生成n个个体,再用准反射学习方法生成n个个体。然后计算适应度函数值,根据适应度函数值选择最优个体,这种方法能够有效地遍历搜索空间,一定程度上能够增加找到全局最优解的概率。

    2.2 柯西变异扰动个体思想

    柯西变异[15]来源于柯西分布,一维标准柯西分布的概率密度函数表达式为:

    图1为两种常见分布的概率密度函数曲线,从图1可以看出柯西分布两端更扁平,趋近于0的趋势更平缓,速度更缓慢,并在原点附近的峰值小于高斯分布。本文将柯西变异引入MPA的位置更新中,发挥其扰动能力,能够在一定程度上提升算法的全局寻优能力。基于柯西变异的位置更新方式为:

    图1 标准高斯分布、柯西分布概率密度函数曲线

    公式(21)中,Cauchy表示服从柯西分布的柯西算子,Xi为当前猎物的位置,Xnewi为柯西扰动后猎物的位置。

    2.3 纵横交叉学习策略

    MPA算法在迭代过程中,尤其是在迭代后期过程中,个体同化程度逐渐升高,某些个体的部分维度未达到最优,导致了这些个体的适应度差。因此在FADs影响后的种群中引入纵横交叉策略[16-17]对种群个体进行修正,该策略能够加快算法的收敛速度,提高算法的精度。

    2.3.1 水平交叉

    水平交叉是指对两个不同的个体在所有维度上进行算术交叉,使得不同个体之间能够相互学习,增强搜索能力。在执行水平交叉时,将设置两两不重复的父代个体X(i)和X(j),并且以交叉概率p1进行算术交叉,通常设置p1=1。父代交叉通过公式(22)、(23)产生子代个体:

    公式(22)、(23)中,r1、r2均为[0,1]之间的随机数;
    c1、c2均为[-1,1]之间的随机数;
    X(i,d)、X(j,d)分别表示为第d维的父代X(i)和X(j)分别表示为父代X(i)、X(j)在第d维交叉后产生的子代。生成的子代个体与父代个体进行竞争,最终保留最优个体。

    2.3.2 垂直交叉

    垂直交叉是指两个不同维度之间对所有个体进行算术交叉。在迭代过程中,垂直交叉搜索的父种群是来自水平交叉的优势种群,这就能够防止种群陷入局部最优。垂直交叉只产生一个子代个体,为停滞维度提供跳出局部最优的机会,而不会破坏另一个可能是全局最优的维度。假设对个体i的第d1维和d2维进行垂直交叉,子代个体可通过公式(24)得到:

    2.4 算法流程图

    基于上述分析,改进后的海洋捕食者算法流程图如图2所示。

    图2 改进后的海洋捕食者算法流程图

    ELM中输入权重和偏置这两个参数具有不确性,导致ELM预测出现精度低的问题。为解决该问题,本文利用IMPA对ELM的输入权重和偏置这两个参数优化,从而建立IMPA-ELM模型并将应用到空气质量指数预测中。

    在建立预测模型中首先需要对数据进行归一化处理。归一化处理便于消除量纲差异对预测结果的干扰,能够加快程序收敛速度。归一化公式如公式(25)所示:

    其中,X为归一化后的数据,x为原始数据,xmin、xmax分别代表原始数据中的最小值和最大值。

    基于IMPA-ELM的空气质量指数预测流程图如图3所示。

    图3 IMPA-ELM模型预测流程图

    为验证本文所提方法的有效性,本文使用的数据来自华为杯第十八届中国研究生数学建模提供的数据。该数据集提供了从2019年4月16日至2021年7月12日的6种污染物,包括SO2、NO2、O3、CO、PM2.5、PM10的监测浓度。由于受监测数据权限和监测设备功能限制,部分污染物监测数据缺失,经过分析所给数据的关联性,利用各污染物的日均值对数据的缺失值进行填充。在应用预测算法前,应将数据集中的异常值作为噪声去除,否则预测结果会出现较大的误差。经过处理后的数据集的各项统计指标如表1所示。本文按照大约8∶2的比例划分训练集和测试集,选取2019年4月16日至2021年3月15日的数据作为训练集,选取2021年3月16日至2021年7月12日的数据作为测试集。实验环境是在操作系统为Windows 11、处理器为Intel Core i7 2.90 GHz、内存为16 GB和MATLAB R2014b上完成的。

    表1 各项数据统计指标

    为了定量评估所提模型的预测性能,本文采用表2所示的3个指标对不同模型的预测结果进行比较。这3个指标主要衡量了预测值和真实值之间的偏差,反映了模型的预测精度,其值越小则表明模型预测精度越高。

    表2 三种评估指标

    为了比较所提出的IMPA-ELM预测模型的有效性,本文将粒子群算法(Particle Swarm Optimization,PSO)[18]、鲸鱼优化算法(Whale Optimization Algorithm,WOA)[19]分别和ELM结合构造了两种预测模型,简写为PSO-ELM和WOA-ELM。同时也使用ELM作为对比实验。为确保实验的公平性,本文将优化算法的种群规模设为20,优化参数的搜索范围设为[-1,1],算法的最大迭代次数设为100。由于智能算法存在一定的随机性,因此本文将每种算法独立重复运行10次。此外ELM的隐含层节点数设为100,激活函数使用sigmoid。在实验过程中粒子群算法的相关参数设置为c1=1.495,c2=1.495,ω=1,ωdamp=0.99;
    鲸鱼优化算法的相关参数设置为b=1。

    为了直观说明IMPA-ELM预测模型的效果,图4给出了四种模型预测空气质量指数的预测结果图,表3给出了四种模型在预测空气质量指数的预测误差;
    图5为对应的直方图。从表3可以看出在各个误差指标下误差最小的是IMPA-ELM模型,表明本文所提的预测模型能显著提升空气质量指数的预测能力;
    在预测误差上,IMPA-ELM模型的平均RMSE、平均MAE和平均MAPE分别为4.287、2.188、3.933%,和ELM相比,IMPA-ELM的三种误差平均值分别降低了30.78%、40.98%、43.84%;
    和PSO-ELM模型相比,IMPAELM模型的误差分别降低了34.35%、18.11%、11.38%;
    和WOA-ELM模型相比,IMPA-ELM模型的误差分别降低了32.55%、20.35%、16.50%。

    表3 四种模型的平均预测误差

    从图4可以看出IMPA-ELM模型在预测中能体现出更好的效果,相比其他几种预测模型在部分单点处的预测效果更好,这说明IMPA-ELM模型的泛化能力更好,能实现较高的拟合精度。图5表明IMPA-ELM模型在空气质量指数预测问题上和其他模型相比具有明显的优势,而PSO和WOA优化的ELM模型在预测中泛化能力差,导致RMSE高于ELM预测结果。表明IMPA算法可以进一步提高全局搜索能力,能有效优化ELM的权重和偏置。

    图4 四种模型的空气质量指数预测值与真实值的比较

    图5 四种模型的平均预测误差对比图

    本文针对ELM预测过程中输入层到隐藏层权重和偏置随机初始化导致预测结果精度不高的问题,提出了IMPA-ELM的预测模型。利用改进后的海洋捕食者算法优化ELM的权重和偏置,将优化后的ELM模型用于空气质量指数预测。实验结果表明,本文所提出的预测方法相对于其他几种预测方法在预测精度和可靠性方面更具有优势。

    猜你喜欢柯西空气质量交叉柯西积分判别法与比较原理的应用高师理科学刊(2020年2期)2020-11-26柯西不等式在解题中的应用语数外学习·高中版中旬(2020年2期)2020-09-10柯西不等式的变形及应用河北理科教学研究(2020年1期)2020-07-24“六法”巧解分式方程初中生世界·八年级(2019年6期)2019-08-13“空气质量发布”APP上线环境保护与循环经济(2017年3期)2017-03-03车内空气质量标准进展汽车与安全(2016年5期)2016-12-01重视车内空气质量工作 制造更环保、更清洁、更健康的汽车汽车与安全(2016年5期)2016-12-01开展“大气污染执法年”行动 加快推动空气质量改善中国环境监察(2016年11期)2016-10-24连数小学生导刊(低年级)(2016年9期)2016-10-13连一连小学生导刊(低年级)(2016年6期)2016-07-02

    相关热词搜索:空气质量 算法 海洋

    • 范文大全
    • 说说大全
    • 学习资料
    • 语录
    • 生肖
    • 解梦
    • 十二星座