网站首页 公文大全 个人文档 实用范文 讲话致辞 实用工具 心得体会 哲学范文 总结范文 范文大全 报告 合同 文书 信函 实用
  • 汇报体会
  • 节日庆典
  • 礼仪
  • 毕业论文
  • 评语寄语
  • 导游词
  • 口号大全
  • 其他范文
  • 百花范文网 > 实用范文 > 其他范文 > 基于改进YOLOv3的输送带纵向撕裂多视角检测方法

    基于改进YOLOv3的输送带纵向撕裂多视角检测方法

    时间:2023-04-08 11:45:07来源:百花范文网本文已影响

    王文善,郭永存,3,4,刘普壮,杨 豚,童佳乐

    (1.安徽理工大学 深部煤矿采动响应与灾害防控国家重点实验室,安徽 淮南 232001;2.安徽理工大学 机械工程学院,安徽 淮南 232001;3.矿山智能技术与装备省部共建协同创新中心,安徽 淮南 232001;4.安徽理工大学 矿山智能装备与技术安徽省重点实验室,安徽 淮南 232001)

    带式输送机是以输送带兼作牵引机构和承载机构的一种连续动作式运输设备,因具有长运距、大运量、连续运输、运行可靠等优点,已成为煤炭高效开采的关键设备[1-3]。在带式输送机中,输送带是承接物料最关键的部分。然而纵向撕裂是输送带损伤最为严重的形式,主要表现为出现较大裂纹或完全撕裂。输送带纵向撕裂主要发生在带式输送机的装载点处,其主要原因是落料口落下的物料时常会夹带着具有锐利边口的异物(如大块矸石和金属材料等),极易扎伤输送带,若没有及时发现,不但会撕裂整条输送带,还将使整个运输系统停车而影响生产,造成巨大的经济损失[4-8]。因此,对输送带纵向撕裂的实时检测具有重要意义。

    传统的输送带纵向撕裂检测方法有预填线圈检测法[9]、接触检测法[10]、漏料检测法[11]等,由于煤矿恶劣环境的影响,这些检测设备因稳定性和准确性低而逐渐被淘汰。目前已有多位学者将机器视觉技术应用于带式输送机的纵向撕裂检测中。文献[12]提出了基于激光的输送带纵向撕裂在线机器视觉检测方法,利用可见光CMOS摄像机采集输送带图像,然后分析判断输送带表面是否有裂口;文献[13]提出了一种基于红外和可见光融合的输送带纵向撕裂双目视觉检测方法,该方法相较于文献[12]方法在一定程度上提高了纵向撕裂的检测精度;文献[14]提出了输送带纵向撕裂检测预警的红外光谱分析方法,与现有的大多数方法不同,该方法通过红外热成像技术监测纵向撕裂的红外辐射场的变化过程,并通过红外辐射场的频域特征示数T来判断输送带是否存在纵向撕裂的隐患,进一步提高输送带纵向撕裂识别准确度;文献[15]提出了输送带纵向撕裂的多光谱视觉检测方法,该方法也可分类识别输送带的其他状态;文献[16]提出基于Hear-AdaBoost和级联算法的不均匀光照下输送带纵向撕裂检测方法;文献[17]采用弱磁检测技术、红外热成像技术和视觉检测技术等研发了一套矿用带式输送机智能监测系统,通过将多种检测技术融合,提高了纵向撕裂检测性能。文献[12-16]为输送带纵向撕裂检测提供了新方法,但是这些方法都是基于手工特征的传统算法,需要对采集的数据进行繁琐的预处理,且主要检测点位于输送带下表面,易忽略未贯穿的大裂纹形式,存在检测视角单一、速度慢和精度低等问题。

    近些年,深度学习技术的快速发展为输送带纵向撕裂提供了快速检测的新方法。基于深度学习的检测算法大致可分为2类:一类是two stage方法,主要以R-CNN算法[18-20]为主;另一类是one stage方法,主要以SSD算法[21-23]和YOLO算法[24-26]为主。two stage方法在检测准确率和定位精度上占优,one stage方法在算法速度上占优。YOLO是第1个在检测精度、检测速度上都取得优异效果的单阶段目标检测算法,其第3代YOLOv3算法相较于之前的算法,尤其是针对小目标,检测精度有显著提升,在实时目标检测领域中具有较高的研究和应用价值。然而传统YOLOv3算法借鉴残差神经网络(Resnet)模型搭建出53层神经网络(Darknet-53),较多的网络层数虽然对特征提取是有利的,但相应也会产生梯度消失现象以及降低检测速度,且本文中只需检测输送带纵向撕裂这一类目标,并不需要很复杂的网络层数。

    鉴于此,本文提出一种基于改进YOLOv3算法的输送带多视角检测方法。首先,该方法对原始YOLOv3算法网络进行改进设计,将Darknet-53简化为Darknet-29,将原有的3种不同尺度锚点改用为2种不同尺度锚点进行检测;其次,搭建实验平台制作纵向撕裂数据集,选用K-means算法对纵向撕裂标签进行聚类分析,确定先验框参数。实验结果表明:该方法不仅能较好地检测出输送带纵向撕裂,还可以分类识别出大裂纹或完全撕裂情形;改进后的YOLOv3算法对于输送带纵向撕裂的检测效果比改进前有明显提高。

    本文提出一种基于改进YOLOv3算法的输送带纵向撕裂多视角检测方法,该方法通过架设在垂直于输送带上、下两面的工业相机实时采集输送带运行图像。

    多视角检测实验平台如图1所示。

    图1中:上表面检测相机悬挂在落料口前侧无煤处正上方;下表面检测相机安装在上、下输送带之间;
    光源为可调节白光,照射角度均为正面照射。

    图1 纵向撕裂检测实验装置

    将采集的图像数据送入改进的YOLOv3网络中进行检测,YOLOv3算法检测分为2步:第1步识别纵向撕裂在输送带上的位置,在图像上对识别出的纵向撕裂区域自动裁剪获得纵向撕裂图像;第2步针对纵向撕裂图像进行分类识别。最后,针对识别出的大裂纹图像和完全撕裂图像给出不同图像处理信号。

    实验平台中使用的输送带是一种常见的煤矿用钢丝绳输送带,该输送带带宽为0.6 m,厚度为15 mm;输送机总长度为4 m,最大运行速度为4 m/s。

    本实验装置所用相机型号为海康威视MV-CA050-11UM/UC、机器视觉检测500万像素USB3.0工业相机;相机镜头型号为WL1406-5MP (6 mm焦距);光源型号为KM-BRD36030-白光(2个);光源控制器型号为DSC2.0-2C030W-24PS(60 W),可调节光源亮度;镜头滤镜使用工业滤光片。

    本实验所有的训练和测试均在同一计算机硬件平台上进行,训练和测试模型使用图形处理器GPU,所有程序在Ubuntu 18.04系统上运行,具体配置见表1所列。

    表1 实验环境

    2.1 检测原理

    YOLOv3算法中引入了多尺度特征金字塔网络(feature Pyramid network,FPN),通过上采样操作使深层特征的尺度变为与浅层特征尺度相同的特征,进而将深层特征和浅层特征进行融合。在图像特征提取方面,YOLOv3采用Darknet-53的网络结构(含有53个卷积层),相较于YOLOv2中的特征提取网格Darknet-19引入了残差网络结构,加深了网络的深度[27]。

    YOLOv3检测时,首先将输入的图片分割成S×S个网格,然后进行边界框的预测。预测框示意图如图2所示。

    图2 预测框示意图

    YOLOv3沿用YOLO9000预测边界框的方法,通过尺寸聚类确定先验框(Anchor box)大小,如图2中红色虚线所示。图2中:tx、ty、tw、th表示网格的预测值,在每个网格中输出对应于网格的相对中心坐标(σ(tx),σ(ty));pw、ph分别表示先验框的宽和高;cx和cy表示网格相对于左上角的偏移量。边界框的值可以表示为:

    bx=σ(tx)+cx,by=σ(ty)+cy,

    bw=pwetw,bh=pheth,σ(x)=1/(1+e-x)

    (1)

    预测框的中心点位置、宽、高、置信度以及分类信息是损失函数计算的重要参数值。预测框的置信度可用预测框与标记框之间的交并比(intersection over union,IoU)表示,其计算公式为:

    (2)

    其中:B1为预测框;B2为标记框。一般设置如下:PIoU>0.7的预测框为正例,即成功预测目标;PIoU<0.3的目标为反例,即背景。计算损失函数时,需尽量保持正、反例之间数量平衡。

    2.2 损失函数

    损失函数是用来评估模型真实值与预测值不一致程度的非负实值函数,损失值越小,模型的预测能力、鲁棒性越好。因此,本文YOLOv3算法在训练神经网络时优化的是损失函数,通过反向传播对模型不断进行更新,使得Loss逐渐减小,最终趋于稳定状态。

    YOLOv3的损失函数采用误差的平方并整合了预测框定位误差、有无目标的IOU误差以及分类误差。损失函数的计算公式如下:

    (3)

    2.3 网络结构改进设计

    原始YOLOv3算法借鉴残差神经网络模型搭建出53层神经网络Darknet-53,该网络结构包含52个卷积层和1个全连接层。较多的网络层数虽然对特征提取是有利的,但相应也会产生梯度消失现象以及增加检测时间,而且纵向撕裂只有大裂纹和完全撕裂2种类别,并不需要深层神经网络提取特征,因此本文运用类似于Darknet-53的网络模型搭建出29层网络模型Darknet-29,如图3所示。

    图3 Darknet-29网络结构

    改进后的YOLOv3网络结构如图4所示,其网络的基本组件Darknet-Conv是卷积层(convolutional,Conv)、批归一化(batch normalization,BN)以及激活函数层Leaky ReLU的集成。在所有的卷积层后增加批归一化,有助于加快训练过程并提高性能,同时可以缓解梯度消失问题。Leaky ReLU是ReLU激活函数的变体,在负值输入时有很小的坡度,解决了ReLU 函数进入负区间后神经元不学习的问题。YOLOv3的大组件Resn是由Darknet-Conv、Zero padding和n个残差单元Residual构成,这一结构有助于解决网络层数增加后梯度爆炸和梯度消失的问题。整个网络结构可以分为Darknet-29部分和YOLO部分,Darknet-29 由卷积层和残差网络组成,每个卷积层包括1×1 的卷标块CB1 和3×3的卷标块CB2,用于提取图像特征;YOLO部分通过借鉴FPN特征网络的思想进行多尺度特征融合,通过添加上采样层和连接层,融合了2个不同尺度的特征,在2个尺度的融合特征图上分别独立做检测。

    图4 改进的YOLOv3网络结构

    3.1 数据集制作与处理

    数据在深度学习中占有着重要地位,数据集的优劣对实际生产环境中输送带纵向撕裂的检测有着重要影响。本文采用图1所示的实验装置制作数据集,共采集大裂纹和完全撕裂的图片各300张。在深度学习中,样本数量越丰富,训练出来的模型效果越好,因此,需对原始数据进行数据增强处理,其中色调的变化范围为1.0~1.5倍,曝光的变化范围为1.0~1.5倍,色量的变化范围为0.9~1.1倍。通过数据增强技术,最终得到1 780张图片,其中大裂纹850张,完全撕裂930张,将所有图片按照7∶3分为训练集和测试集。

    使用labelImg工具对数据集进行人工边框标记,标注信息以PASCAL VOC格式存储,其中包含大裂纹和完全撕裂的类别和边框坐标。然后将数据进行预处理归一化操作,将目标实际标记框数据除以图像的高度和宽度,使得预处理数据被限制在0~1之间,可使训练过程更快读取数据,加速模型收敛。归一化操作后5个参数组成1组数据,分别包含分类序列(label)、标记框中心的x坐标和y坐标、标记框的宽w、标记框的高h,其表达式[28]如下:

    (4)

    其中:(xmax,ymax)为标记框右下角坐标;(xmin,ymin)为标记框左上角坐标;wp、hp分别为图像的高和宽。

    3.2 数据集标签聚类分析

    图5 不同K值对应的平均交并比

    3.3 模型的训练与评估

    网络模型训练前需设置相应训练参数,合适的参数值可以训练出较优的模型,本文设置的参数见表2所列,每次迭代过程加载64张图片并分16批次完成向前传播过程,待64张图片全部完成前向传播后,再进行一次反向传播更新参数。引入最优化方法中动量(momentum)参数,影响梯度下降到最优值的速度;引入权重衰减正则项(decay),防止模型训练过程中出现过拟合现象。模型一共训练5 000次,共耗时6 h。

    表2 网络训练参数

    本实验使用精确度(precision)、召回率(recall)、平均精度(average precision,AP)、所有目标类别平均检测精度的均值(mean average precision,mAP)以及每秒检测的图片数量(frame per second,FPS)来评价损失函数训练出来的模型性能[29]。

    精确度Pre、召回率Re、mAP、FPS的计算公式分别如下:

    (5)

    (6)

    (7)

    (8)

    其中:TP为真实的正样本数量;FP为虚假的正样本数量;FN为虚假的负样本数量;n为类别数;PA(i)为某一类的检测精度;Nfigure为检测图片总数;ttotal为检测总时间。

    3.4 实验结果分析

    输送带纵向撕裂检测结果如图6所示。其中:图6a为完全撕裂(L-T)检测结果,图6b为大裂纹(L-C)检测结果。

    图6 纵向撕裂检测结果

    相对于传统单维度检测方法,本文基于改进YOLOv3算法的输送带纵向撕裂多视角检测方法不仅可以有效解决输送带纵向撕裂问题,而且可以进行多目标分类识别,自动识别出大裂纹或者完全撕裂情形。

    改进模型的精度对比如图7所示。从图7可以看出,使用改进后的YOLOv3算法进行检测时,输送带纵向撕裂所有类别的平均检测精度AP相较于原始YOLOv3算法均没有下降,在保证检测精度的同时,显著增加了检测速度。

    图7 改进模型的精度对比

    模型分解实验结果见表3所列。其中:模型A为原始YOLOv3模型;模型B为在模型A的基础上简化特征提取网络,搭建出29层特征提取网络Darknet-29后的模型;模型C为在模型A的基础上减少1个特征尺度后的模型;模型D为在模型A的基础上引入Darknet-29和减少1个特征尺度后的模型。

    从表3可以看出,简化特征提取网络和减少1个特征尺度,对输送带纵向撕裂的检测精度影响不大,但是会显著提高检测速度。这是由于纵向撕裂的类别较少且各种类别尺寸相对集中,特征提取相对简单,不需要较多的网络层。

    表3 模型分解实验结果

    通过与几种先进的YOLO检测算法比较发现,改进后的YOLOv3算法对于输送带纵向撕裂检测效果最好。

    不同算法损失值迭代曲线的对比如图8所示。

    从图8可以看出,在相同的网络训练参数和硬件配置下,改进后的YOLOv3算法(YOLOv3-darknet29)损失值最低,模型效果最优;模型在前2 300次训练中迅速拟合,Loss值快速变小,在3 000次训练后逐渐趋于稳定,达到理想效果。

    图8 不同算法损失值迭代曲线的对比

    不同YOLO算法的检测性能对比见表4所列。

    从表4可以看出:改进后的YOLOv3算法所有目标类别检测精度的均值PmAP为98.7%,在几种算法中最高,相较于原始YOLOv3算法、YOLOv2算法和YOLOv3-Tiny算法,分别提高0.4%、8.1%、10.8%;YOLOv3-Tiny算法由于网络结构简单,其检测速度为132 帧/s,在几种算法中最快,但是其PmAP只有87.9%,难以满足实际生产环境中的精度要求,故不可取;改进后的YOLOv3算法在保证检测精度的条件下,具有较高的检测速度,相较于原始YOLOv3算法提高60.6%,相较于YOLOv2算法提高39.5%。

    表4 不同YOLO算法的检测性能对比

    网络模型在保证精度和速度的前提下所占用的内存越少,与硬件结合越有利。

    不同YOLO系列算法网络模型所占用内存大小如图9所示。

    从图9可以看出:YOLOv3-Tiny算法占用内存最少,仅为33 Mb,这是由于YOLOv3-Tiny网络结构比较简单;其次是改进后的YOLOv3算法,其占用内存大小为141 Mb,相较于原始YOLOv3算法和YOLOv2算法分别减少93 Mb和51 Mb。

    图9 不同YOLO系列算法网络模型占用内存

    从各种算法的检测速度fFPS、整体检测精度PmAP和模型占用内存可以看出,改进后的YOLOv3算法在输送带纵向撕裂检测方面优于其他几种算法,既具有较高的检测精度,又能保证较快的检测速度,可以满足输送带运行过程中实时检测的精度与速度要求。

    针对输送带纵向撕裂检测中存在的检测视角单一、速度慢、精度低等问题,本文提出一种基于改进YOLOv3算法的输送带纵向撕裂多视角检测方法。该方法对输送带检测装置进行改进设计,利用多个视角布置的工业相机采集输送带图像;对原始YOLOv3网络进行优化调整,从而获得一种快速、准确的端到端输送带纵向撕裂检测方法。根据实验结果得到以下结论:

    (1) 输送带纵向撕裂多视角检测方法不仅可有效解决输送带纵向撕裂问题,还可以进行多目标分类识别,自动识别出大裂纹或完全撕裂情形。

    (2) 相较于原始YOLOv3算法,改进后的YOLOv3算法平均检测精度均值PmAP在没有下降的情况下,检测速度提高了60.6%,达到53 帧/s,模型占用内存减少了93 Mb,仅为141 Mb。

    (3) 与其他算法性能的对比结果表明,改进后的YOLOv3算法在输送带纵向撕裂检测方面优于YOLOv2、YOLOv3-Tiny和原始YOLOv3算法,能够较准确快速地检测出输送带纵向撕裂问题。

    猜你喜欢输送带网络结构精度热连轧机组粗轧机精度控制一重技术(2021年5期)2022-01-18煤炭输送带空载率计算控制系统设计设备管理与维修(2021年21期)2021-12-29超高精度计时器——原子钟中学生数理化·八年级物理人教版(2019年9期)2019-11-25分析误差提精度中学生数理化·八年级物理人教版(2019年12期)2019-05-21基于DSPIC33F微处理器的采集精度的提高电子制作(2018年11期)2018-08-04基于互信息的贝叶斯网络结构学习北京信息科技大学学报(自然科学版)(2016年6期)2016-02-27知识网络结构维对于创新绩效的作用机制——远程创新搜寻的中介作用管理现代化(2016年3期)2016-02-06沪港通下A+ H股票网络结构演化的实证分析管理现代化(2016年3期)2016-02-06复杂网络结构比对算法研究进展智能系统学报(2015年4期)2015-12-27改性碳纳米管在矿用阻燃输送带覆盖胶中的应用橡胶工业(2015年10期)2015-08-01

    相关热词搜索:输送带 纵向 撕裂

    • 范文大全
    • 说说大全
    • 学习资料
    • 语录
    • 生肖
    • 解梦
    • 十二星座

    推荐访问