基于改进的SSD监理目标检测研究

摘 要 针对装饰装修工程中由人工验收带来的诸多问题,文中提出了一种改进的SSD算法并将其应用于监理工作来代替人工验收,推动智能监理的实现。由于SSD算法存在对同一目标复检以及小目标检测效果欠佳等问题,故文中利用DPN网络替换基础特征提取网络VGG16。DPN结合了Resnet和Densenet的优点,具有更好的特征提取能力。通过加权FPN融合特征图,突出不同层特征图的贡献,丰富用于预测的特征图语义。利用深度可分离卷积降低模型的参数量,提高算法的推理速度。实验对比发现,改进后模型的平均精度提升了3.47%,对小数目检测平均精度的提升可达15%,证明新模型在监理目标检测任务中效果良好。

监理是装饰装修工程的一大重点,从工程施工到交付,监理工作具有十分重要的地位。目前,装饰装修监理工作主要依靠具有多年工作经验的员工,不仅增加了企业成本,还可能产生误检。近年来,计算机视觉技术发展迅速,已被应用到自动驾驶、行人检测、机器人、文本验证等领域中[1-6]。本文利用目标检测技术识别监理工作中的目标,为后续从图片中获取更深层次的验收信息及解决人工监理问题提供了参考。

目标检测算法主要分为两类:一类是以区域卷积神经网络(Region-Convolutional Neural Network,R-CNN)算法系列为代表的基于区域建议的目标检测与识别算法;另一类是基于回归的检测算法,以单点多盒检测器(Single Shot MultiBox Detector,SSD) 、YOLO(You Only Look Once ,YOLO) 为代表。前者具有较高的预测准确率,后者则在算法速度上占优。

为了兼顾时效性与准确性的要求,本文采用的基础算法为SSD。SSD算法已为目标检测开发人员广泛使用,效果良好[7-8]。但是SSD仍存在两个问题:(1)不同层的特征图独立作为分类网络的输入时,容易出现同一物体被大小不同的框同时检测出来的情况;(2)该方法对小目标检测效果较差。

针对这些问题,研究人员开发了一系列基于SSD的改进算法。文献[9]引入全局上下文模块,提高了特征提取能力。文献[10~11]采用K-means聚类对模型默认框的数量、高宽比进行优化,使模型更加具有针对性。文献[12]在每层预测前加入残差模块,使特征包含更多的语义信息。文献[13]引入空间以及通道注意力机制,增大特征提取的感受野。文献[14~15]使用轻量级网络MobileNet替代SSD特征提取网络,增加了网络深度,降低了模型大小,一定程度上可以改善小目标检测问题。文献[16]使用转置卷积操作构建循环特征聚合模型,提高了检测精度。文献[17]通过在非极大抑制中嵌入特征向量的方式,二次筛选默认框,改善了重叠目标漏检的问题。虽然目前已有基于SSD的改进算法,但小目标检测效果仍然欠佳。

本文对SSD算法应用于装饰装修工程监理工作进行研究,并针对算法的不足进行了改进,主要改进包括:(1)更改基础特征提取网络为DPN(Dual Path Networks);(2)采用加权特征金字塔,融合不同层的语义信息;(3)采用深度可分离卷积减小模型。

1 SSD算法模型

SSD算法于2016年被首次提出。其作为one-stage(直接回归物体的类别概率和位置坐标值)算法,与two-stage(先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类)相比具有更快的检测速度,这也增加了其在工业领域的应用可行性。

SSD结合YOLO中的回归思想和Faster R-CNN中的锚(Anchor)机制,为每个特征图的单元设置一系列先验框[18]。与Faster R-CNN锚机制不同,SSD的锚分布在多个尺度的特征图上,这使得SSD可以用多尺度各个位置的区域特征进行回归,既保持了YOLO速度快的特性,也保证了一定的准确性。先验框的设置包括尺度和长宽比两个方面,尺度遵循着线性变化的原则,随着特征图大小的降低而增加,计算式如下

基于改进的SSD监理目标检测研究患者端的便利,得益于医务端设计的“未雨绸缪”和精密规划,“医务通”APP应运而生。在这一端口,可进行在院患者查询、医生排班表、院内大会诊,院内通知和科室管理的强化,也为随访中心和患者院后康复护理提供了大力支持。“在移动端病历和影像等的支持下,院内和院际大会诊可同步调取和录播,也可用于联盟内医院教学。”孙岩国介绍,在网络支持下,实时、动态的工作服务平台被建立。医务人员间、生态诊疗系统共融、共进、共享,提升患者就医体验的同时方便了医生,也打造了大医二院的服务品牌。

基于改进的SSD监理目标检测研究[20]的思路与Resnet基本一致,它的特点是将前面所有层与后面层进行密集连接,通过通道上的连接实现特征复用。图2和图3为残差网络与密集网络结构图,Resnet进行特征图的相加(Add),而Densenet做了异通道特征图的连接(Concate)。这两种方式各有优点,前者凸显了特征的复用,后者则能够探索出新的特征。DPN吸收了Resnet与Densenet的优点,如图4所示的双路径将两种网络的理念结合到了一起。文献[21]通过实验证明,与Resnet和Densenet相比,DPN网络性能更优异。

基于改进的SSD监理目标检测研究据统计,1998年,中国参与绿色食品开发的企业有619个,绿色食品产品销售额为285亿元,实现利润17亿元。

2.2 加权特征金字塔

计算机视觉的基本挑战之一是多尺度识别。目前,特征金字塔(Feature Pyramid Network,FPN) 已经成为不同尺度目标检测系统的基本构件之一。

SSD各层用于预测的特征图相互独立,势必会忽视部分信息。浅层特征图含有较多的位置信息,而高层特征图则具有较多的语义信息。将浅层与高层特征进行融合,可提升网络的预测效果。

通常对FPN进行融合时,不同层的权重相同,但是尺度不同对输出特征的贡献也不一样。故本文在此基础上,对特征图进行加权融合。

本文选取与原算法相同尺度的特征图进行预测。各层特征图通过上下采样缩放,调整为同一尺度,对缩放后的特征图进行1×1卷积统一通道数后,赋权相加,该权值可以进行学习。特征融合模块结构如图5所示,输出计算式为

基于改进的SSD监理目标检测研究在修复中应最大可能保留原有历史要素,地面铺装承载当时建筑形制、构件结构和材料工艺特征,还反映历史上室内铺装的变动状况.维护与修复的目的是为了尽可能减缓劣化进程而不损害其特色,不妨碍或破坏历史结构,不改变其历史价值的特征[5].应考虑与遵循真实性原则,以历史信息的最大保存为要务,所要恢复的原状应有充分文献档案证据支撑,而非基于风格统一的主观臆断;腐坏缺失部分的替换也需以现存实物为参照和鉴定.

表2 实验环境

Table 2. Experimental environment

基于改进的SSD监理目标检测研究①志愿助人服务:门诊服务中心、门诊各楼层志愿者负责协助病人自助挂号、缴费、打印化验单;急诊分诊处志愿者负责维护医疗工作秩序;门诊B超室志愿者负责协助医务人员登记,分流引导病人及家属到相应就诊楼层和诊室检查。②志愿关怀服务:积极为残疾、老年、体弱、行动不便及其他特需病人、外国友人等提供诸如搀扶、陪同、轮椅、拐杖、平车协助的优质服务;帮助危重症、老年、体弱病人办理住院手续并陪送至病房;主动、热情地为病人及家属提供指路、引导服务。③志愿环卫服务:维持安静、清洁、整齐、安全、良好的医院环境;协助护工清理病人就诊途中的分泌物、排泄物、呕吐物等,为病人提供舒适、优质的医疗服务。

基于改进的SSD监理目标检测研究他的研究团队在试验田收获了所谓的“训练种群”:500棵被选单株可反映一个总数为2500棵的种群(它们的基因组测序已经完成)。通过遗传数据与实际表型特征结合起来,安德森可以更好地预测哪些植物将有最好的抗病能力,以及哪些遗传序列会赋予这种表型特征。

基于改进的SSD监理目标检测研究[1] 杨晓丽,刘博涛,赵哲,等.基于视觉与激光雷达数据融合的前车识别研究[J].汽车实用技术,2020,45(18):22-24.

Yang Xiaoli,Liu Botao,Zhao Zhe,et al.Front vehicle recognition based on fusion of vision and lidar data[J].Automobile Applied Technology,2020,45(18):22-24.

[2] 姚启才,汪地,廖茂生.基于机器视觉的机械臂智能抓取系统设计[J].计量与测试技术,2020,47(10):28-33.

Yao Qicai,Wang Di,Liao Maosheng.Intelligent grasping system design of robot arm based on machine vision[J].Metrology & Measurement Technique,2020,47(10):28-33.

[3] 张达峰,刘宇红,张荣芬.基于深度学习的智能辅助驾驶系统[J].电子科技,2018,31(10):60-63.

Zhang Dafeng,Liu Yuhong,Zhang Rongfen.Intelligent assistant driving system based on deep learning[J].Electronic Science and Technology,2018,31(10):60-63.

[4] 陶映帆,胡鹏飞,杨文明.智能家居中的计算机视觉技术[J].人工智能,2020(5):30-38.

Tao Yingfan,Hu Pengfei,Yang Wenming.Computer vision technology in smart home[J].AI-View,2020(5):30-38.

[5] 胡振寰.基于深度学习算法的遮挡行人检测[D].柳州:广西科技大学,2019.

Hu Zhenhuan.Occlusion pedestrian detection based on deep learning algorithm[D].Liuzhou:Guangxi University of Science and Technology,2019.

[6] 周文凯,韩芳,孔维健.基于Faster-RCNN的极验点选式验证码识别[J].电子科技,2019,32(9):42-45.

Zhou Wenkai,Han Fang,Kong Weijian.Point-selective geetest CAPTCHA recognition based on Faster-RCNN[J].Electronic Science and Technology,2019,32(9):42-45.

[7] 李光曜.基于深度学习的遥感图像目标检测方法研究[D].石家庄:石家庄铁道大学,2019.

Li Guangyao.Target detection method of remote sensing image based on deep learning[D].Shijiazhuang:Shijiazhuang Tiedao University,2019.

[8] 杨璐.基于SSD的人脸检测算法研究[D].镇江:江苏科技大学,2019.

Yang Lu.Research on face detection algorithm based on SSD algorithm[D].Zhenjiang:Jiangsu University of Science and Technology,2019.

[9] 吴华运,任德均,付磊,等.基于改进型SSD算法的空瓶表面缺陷检测[J].计算机与现代化,2020(4):121-126.

Wu Huayun,Ren Dejun,Fu Lei,et al.Surface defect detection of empty bottles based on improved SSD algorithm[J].Computer and Modernization,2020(4):121-126.

[10] 刘学,李范鸣,刘士建.改进的SSD红外图像行人检测算法[C].上海:上海市红外与遥感学会,2019.

Liu Xue,Li Fanming,Liu Shijian.Improved SSD infrared image pedestrian detection algorithm[C].Shanghai:Proceedings of the Shanghai Institute of Infrared and Remote Sensing,2019.

[11] 苟先太,黄巍,刘琪芬.基于改进SSD模型的牛脸检测[J].计算机工程与设计,2020,41(3):833-837.

Gou Xiantai,Huang Wei,Liu Qifen.Cattle face detection based on improved SSD model[J].Computer Engineering and Design,2020,41(3):833-837.

[12] Zhai S,Shang D,Wang S,et al.DF-SSD: An improved SSD object detection algorithm based on densenet and feature fusion[J].IEEE Access,2020(8):24344-24357.

[13] Li Y L,Wang S.HAR-Net: Joint learning of hybrid attention for single-stage object detection[J].IEEE Transactions on Image Processing,2020,29(11):3092-3103.

[14] 沈新烽,姜平,周根荣.改进SSD算法在零部件检测中的应用研究[J].计算机工程与应用,2020,56(12):1-10.

Shen Xinfeng,Jiang Ping,Zhou Genrong.Application of improved SSD algorithm in parts detection[J].Computer Engineering and Applications,2020,56(12):1-10.

[15] Kanimozhi S,Gayathri G,Mala T.Multiple real-time object identification using Single shot multi-box detection[C].Chennai:Proceedings of the 2019 International Conference on Computational Intelligence in Data Science,2019.

[16] 郭川磊.基于转置卷积操作改进的SSD目标检测算法研究[D].成都:成都信息工程大学,2019.

Guo Chuanlei.Research on improved SSD target detection algorithm based on transposed convolution operation[D].Chengdu:Chengdu University of Information Technology,2019.

[17] 焦鑫,杨伟东,刘全周,等.用于ADAS实时目标车辆检测的改进SSD算法[J].汽车安全与节能学报,2020,11(3):337-344.

Jiao Xin,Yang Weidong,Liu Quanzhou,et al.Improved SSD algorithm for real-time target vehicle detection in ADAS[J].Journal of Automotive Safety and Energy,2020,11(3):337-344.

[18] 黎阳,沈烨,刘敏,等.融合运动信息与表观信息的多目标跟踪算法[J].电子科技,2020,33(9):21-24.

Li Yang,Shen Ye,Liu Min,et al.Multi-target tracking algorithm by combining motion information and apparent information[J].Electronic Science and Technology,2020,33(9):21-24.

[19] He K,Zhang X,Ren S , et al. Identity mappings in deep residual networks[C].Amsterdam:European Conference on Computer Vision,2016.

[20] Huang G,Liu Z,Laurens V,et al.Densely connected convolutional networks[C].Honolulu:IEEE Conference on Computer Vision and Pattern Recognition,2017.

[21] Chen Y,Li J,Xiao H,et al.Dual path networks[C].New York:Proceedings of the Thirty-first International Conference on Neural Information Processing Systems,2017.

本文由高级搬砖工程师发表,不代表爱监理立场,如若转载,请注明出处:https://www.ijianli.cn/27483.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
高级搬砖工程师的头像高级搬砖工程师普通用户
上一篇 2022年11月28日
下一篇 2022年11月28日

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注