监理是装饰装修工程的一大重点,从工程施工到交付,监理工作具有十分重要的地位。目前,装饰装修监理工作主要依靠具有多年工作经验的员工,不仅增加了企业成本,还可能产生误检。近年来,计算机视觉技术发展迅速,已被应用到自动驾驶、行人检测、机器人、文本验证等领域中[1-6]。本文利用目标检测技术识别监理工作中的目标,为后续从图片中获取更深层次的验收信息及解决人工监理问题提供了参考。
目标检测算法主要分为两类:一类是以区域卷积神经网络(Region-Convolutional Neural Network,R-CNN)算法系列为代表的基于区域建议的目标检测与识别算法;另一类是基于回归的检测算法,以单点多盒检测器(Single Shot MultiBox Detector,SSD) 、YOLO(You Only Look Once ,YOLO) 为代表。前者具有较高的预测准确率,后者则在算法速度上占优。
为了兼顾时效性与准确性的要求,本文采用的基础算法为SSD。SSD算法已为目标检测开发人员广泛使用,效果良好[7-8]。但是SSD仍存在两个问题:(1)不同层的特征图独立作为分类网络的输入时,容易出现同一物体被大小不同的框同时检测出来的情况;(2)该方法对小目标检测效果较差。
针对这些问题,研究人员开发了一系列基于SSD的改进算法。文献[9]引入全局上下文模块,提高了特征提取能力。文献[10~11]采用K-means聚类对模型默认框的数量、高宽比进行优化,使模型更加具有针对性。文献[12]在每层预测前加入残差模块,使特征包含更多的语义信息。文献[13]引入空间以及通道注意力机制,增大特征提取的感受野。文献[14~15]使用轻量级网络MobileNet替代SSD特征提取网络,增加了网络深度,降低了模型大小,一定程度上可以改善小目标检测问题。文献[16]使用转置卷积操作构建循环特征聚合模型,提高了检测精度。文献[17]通过在非极大抑制中嵌入特征向量的方式,二次筛选默认框,改善了重叠目标漏检的问题。虽然目前已有基于SSD的改进算法,但小目标检测效果仍然欠佳。
本文对SSD算法应用于装饰装修工程监理工作进行研究,并针对算法的不足进行了改进,主要改进包括:(1)更改基础特征提取网络为DPN(Dual Path Networks);(2)采用加权特征金字塔,融合不同层的语义信息;(3)采用深度可分离卷积减小模型。
1 SSD算法模型
SSD算法于2016年被首次提出。其作为one-stage(直接回归物体的类别概率和位置坐标值)算法,与two-stage(先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类)相比具有更快的检测速度,这也增加了其在工业领域的应用可行性。
SSD结合YOLO中的回归思想和Faster R-CNN中的锚(Anchor)机制,为每个特征图的单元设置一系列先验框[18]。与Faster R-CNN锚机制不同,SSD的锚分布在多个尺度的特征图上,这使得SSD可以用多尺度各个位置的区域特征进行回归,既保持了YOLO速度快的特性,也保证了一定的准确性。先验框的设置包括尺度和长宽比两个方面,尺度遵循着线性变化的原则,随着特征图大小的降低而增加,计算式如下



2.2 加权特征金字塔
计算机视觉的基本挑战之一是多尺度识别。目前,特征金字塔(Feature Pyramid Network,FPN) 已经成为不同尺度目标检测系统的基本构件之一。
SSD各层用于预测的特征图相互独立,势必会忽视部分信息。浅层特征图含有较多的位置信息,而高层特征图则具有较多的语义信息。将浅层与高层特征进行融合,可提升网络的预测效果。
通常对FPN进行融合时,不同层的权重相同,但是尺度不同对输出特征的贡献也不一样。故本文在此基础上,对特征图进行加权融合。
本文选取与原算法相同尺度的特征图进行预测。各层特征图通过上下采样缩放,调整为同一尺度,对缩放后的特征图进行1×1卷积统一通道数后,赋权相加,该权值可以进行学习。特征融合模块结构如图5所示,输出计算式为

表2 实验环境
Table 2. Experimental environment
①志愿助人服务:门诊服务中心、门诊各楼层志愿者负责协助病人自助挂号、缴费、打印化验单;急诊分诊处志愿者负责维护医疗工作秩序;门诊B超室志愿者负责协助医务人员登记,分流引导病人及家属到相应就诊楼层和诊室检查。②志愿关怀服务:积极为残疾、老年、体弱、行动不便及其他特需病人、外国友人等提供诸如搀扶、陪同、轮椅、拐杖、平车协助的优质服务;帮助危重症、老年、体弱病人办理住院手续并陪送至病房;主动、热情地为病人及家属提供指路、引导服务。③志愿环卫服务:维持安静、清洁、整齐、安全、良好的医院环境;协助护工清理病人就诊途中的分泌物、排泄物、呕吐物等,为病人提供舒适、优质的医疗服务。


Yang Xiaoli,Liu Botao,Zhao Zhe,et al.Front vehicle recognition based on fusion of vision and lidar data[J].Automobile Applied Technology,2020,45(18):22-24.
[2] 姚启才,汪地,廖茂生.基于机器视觉的机械臂智能抓取系统设计[J].计量与测试技术,2020,47(10):28-33.
Yao Qicai,Wang Di,Liao Maosheng.Intelligent grasping system design of robot arm based on machine vision[J].Metrology & Measurement Technique,2020,47(10):28-33.
[3] 张达峰,刘宇红,张荣芬.基于深度学习的智能辅助驾驶系统[J].电子科技,2018,31(10):60-63.
Zhang Dafeng,Liu Yuhong,Zhang Rongfen.Intelligent assistant driving system based on deep learning[J].Electronic Science and Technology,2018,31(10):60-63.
[4] 陶映帆,胡鹏飞,杨文明.智能家居中的计算机视觉技术[J].人工智能,2020(5):30-38.
Tao Yingfan,Hu Pengfei,Yang Wenming.Computer vision technology in smart home[J].AI-View,2020(5):30-38.
[5] 胡振寰.基于深度学习算法的遮挡行人检测[D].柳州:广西科技大学,2019.
Hu Zhenhuan.Occlusion pedestrian detection based on deep learning algorithm[D].Liuzhou:Guangxi University of Science and Technology,2019.
[6] 周文凯,韩芳,孔维健.基于Faster-RCNN的极验点选式验证码识别[J].电子科技,2019,32(9):42-45.
Zhou Wenkai,Han Fang,Kong Weijian.Point-selective geetest CAPTCHA recognition based on Faster-RCNN[J].Electronic Science and Technology,2019,32(9):42-45.
[7] 李光曜.基于深度学习的遥感图像目标检测方法研究[D].石家庄:石家庄铁道大学,2019.
Li Guangyao.Target detection method of remote sensing image based on deep learning[D].Shijiazhuang:Shijiazhuang Tiedao University,2019.
[8] 杨璐.基于SSD的人脸检测算法研究[D].镇江:江苏科技大学,2019.
Yang Lu.Research on face detection algorithm based on SSD algorithm[D].Zhenjiang:Jiangsu University of Science and Technology,2019.
[9] 吴华运,任德均,付磊,等.基于改进型SSD算法的空瓶表面缺陷检测[J].计算机与现代化,2020(4):121-126.
Wu Huayun,Ren Dejun,Fu Lei,et al.Surface defect detection of empty bottles based on improved SSD algorithm[J].Computer and Modernization,2020(4):121-126.
[10] 刘学,李范鸣,刘士建.改进的SSD红外图像行人检测算法[C].上海:上海市红外与遥感学会,2019.
Liu Xue,Li Fanming,Liu Shijian.Improved SSD infrared image pedestrian detection algorithm[C].Shanghai:Proceedings of the Shanghai Institute of Infrared and Remote Sensing,2019.
[11] 苟先太,黄巍,刘琪芬.基于改进SSD模型的牛脸检测[J].计算机工程与设计,2020,41(3):833-837.
Gou Xiantai,Huang Wei,Liu Qifen.Cattle face detection based on improved SSD model[J].Computer Engineering and Design,2020,41(3):833-837.
[12] Zhai S,Shang D,Wang S,et al.DF-SSD: An improved SSD object detection algorithm based on densenet and feature fusion[J].IEEE Access,2020(8):24344-24357.
[13] Li Y L,Wang S.HAR-Net: Joint learning of hybrid attention for single-stage object detection[J].IEEE Transactions on Image Processing,2020,29(11):3092-3103.
[14] 沈新烽,姜平,周根荣.改进SSD算法在零部件检测中的应用研究[J].计算机工程与应用,2020,56(12):1-10.
Shen Xinfeng,Jiang Ping,Zhou Genrong.Application of improved SSD algorithm in parts detection[J].Computer Engineering and Applications,2020,56(12):1-10.
[15] Kanimozhi S,Gayathri G,Mala T.Multiple real-time object identification using Single shot multi-box detection[C].Chennai:Proceedings of the 2019 International Conference on Computational Intelligence in Data Science,2019.
[16] 郭川磊.基于转置卷积操作改进的SSD目标检测算法研究[D].成都:成都信息工程大学,2019.
Guo Chuanlei.Research on improved SSD target detection algorithm based on transposed convolution operation[D].Chengdu:Chengdu University of Information Technology,2019.
[17] 焦鑫,杨伟东,刘全周,等.用于ADAS实时目标车辆检测的改进SSD算法[J].汽车安全与节能学报,2020,11(3):337-344.
Jiao Xin,Yang Weidong,Liu Quanzhou,et al.Improved SSD algorithm for real-time target vehicle detection in ADAS[J].Journal of Automotive Safety and Energy,2020,11(3):337-344.
[18] 黎阳,沈烨,刘敏,等.融合运动信息与表观信息的多目标跟踪算法[J].电子科技,2020,33(9):21-24.
Li Yang,Shen Ye,Liu Min,et al.Multi-target tracking algorithm by combining motion information and apparent information[J].Electronic Science and Technology,2020,33(9):21-24.
[19] He K,Zhang X,Ren S , et al. Identity mappings in deep residual networks[C].Amsterdam:European Conference on Computer Vision,2016.
[20] Huang G,Liu Z,Laurens V,et al.Densely connected convolutional networks[C].Honolulu:IEEE Conference on Computer Vision and Pattern Recognition,2017.
[21] Chen Y,Li J,Xiao H,et al.Dual path networks[C].New York:Proceedings of the Thirty-first International Conference on Neural Information Processing Systems,2017.
黄 静,谢 宣
本文《基于改进的SSD监理目标检测研究》来源于公开发表的文章,转发用于学习交流,版权归原作者或原出处所有,若有侵权,请通知我们删除。
本文由高级搬砖工程师发表,不代表爱监理立场,如若转载,请注明出处:https://www.ijianli.cn/27483.html

