基于改进的SSD监理目标检测研究

监理是装饰装修工程的一大重点，从工程施工到交付，监理工作具有十分重要的地位。目前，装饰装修监理工作主要依靠具有多年工作经验的员工，不仅增加了企业成本，还可能产生误检。近年来，计算机视觉技术发展迅速，已被应用到自动驾驶、行人检测、机器人、文本验证等领域中[1-6]。本文利用目标检测技术识别监理工作中的目标，为后续从图片中获取更深层次的验收信息及解决人工监理问题提供了参考。

目标检测算法主要分为两类：一类是以区域卷积神经网络(Region-Convolutional Neural Network，R-CNN)算法系列为代表的基于区域建议的目标检测与识别算法；另一类是基于回归的检测算法，以单点多盒检测器(Single Shot MultiBox Detector，SSD) 、YOLO(You Only Look Once ，YOLO) 为代表。前者具有较高的预测准确率，后者则在算法速度上占优。

为了兼顾时效性与准确性的要求，本文采用的基础算法为SSD。SSD算法已为目标检测开发人员广泛使用，效果良好[7-8]。但是SSD仍存在两个问题：(1)不同层的特征图独立作为分类网络的输入时，容易出现同一物体被大小不同的框同时检测出来的情况；(2)该方法对小目标检测效果较差。

针对这些问题，研究人员开发了一系列基于SSD的改进算法。文献[9]引入全局上下文模块，提高了特征提取能力。文献[10～11]采用K-means聚类对模型默认框的数量、高宽比进行优化，使模型更加具有针对性。文献[12]在每层预测前加入残差模块，使特征包含更多的语义信息。文献[13]引入空间以及通道注意力机制，增大特征提取的感受野。文献[14～15]使用轻量级网络MobileNet替代SSD特征提取网络，增加了网络深度，降低了模型大小，一定程度上可以改善小目标检测问题。文献[16]使用转置卷积操作构建循环特征聚合模型，提高了检测精度。文献[17]通过在非极大抑制中嵌入特征向量的方式，二次筛选默认框，改善了重叠目标漏检的问题。虽然目前已有基于SSD的改进算法，但小目标检测效果仍然欠佳。

本文对SSD算法应用于装饰装修工程监理工作进行研究，并针对算法的不足进行了改进，主要改进包括：(1)更改基础特征提取网络为DPN(Dual Path Networks)；(2)采用加权特征金字塔，融合不同层的语义信息；(3)采用深度可分离卷积减小模型。

1 SSD算法模型

SSD算法于2016年被首次提出。其作为one-stage(直接回归物体的类别概率和位置坐标值)算法，与two-stage(先由算法生成一系列作为样本的候选框，再通过卷积神经网络进行样本分类)相比具有更快的检测速度，这也增加了其在工业领域的应用可行性。

SSD结合YOLO中的回归思想和Faster R-CNN中的锚(Anchor)机制，为每个特征图的单元设置一系列先验框[18]。与Faster R-CNN锚机制不同，SSD的锚分布在多个尺度的特征图上，这使得SSD可以用多尺度各个位置的区域特征进行回归，既保持了YOLO速度快的特性，也保证了一定的准确性。先验框的设置包括尺度和长宽比两个方面，尺度遵循着线性变化的原则，随着特征图大小的降低而增加，计算式如下

基于改进的SSD监理目标检测研究

1 SSD算法模型

2.2 加权特征金字塔

发表回复