基于自适应学习率的运动目标高效检测算法

郝晓丽; 刘伟; 牛保宁; 吕进来

doi:10.12178/1001-0548.2019131

基于自适应学习率的运动目标高效检测算法

doi: 10.12178/1001-0548.2019131

太原理工大学信息与计算机学院　山西晋中　030600

基金项目: 国家重点研发计划(2017YFB1401001)

详细信息

作者简介:
郝晓丽，女，副教授，主要从事视频图像处理，情感计算，数据挖掘等方面的研究. E-mail：414919661@qq.com

中图分类号: TP391

High-Efficiency Detection Algorithm for Moving Targets Based on Adaptive Learning Rate

College of Information and Computer, Taiyuan University of Technology　Jinzhong Shanxi　030600

摘要: 该文提出了一种改进的基于自适应学习率高斯建模的三帧差分算法。通过基于自适应学习率的混合高斯背景建模，实现背景模型的自适应修正，保证算法在动态环境中能完整提取目标内部信息。其次，采用基于边缘提取的三帧差分改进算法，完成对目标轮廓的快速提取，并以此作为目标图像的边缘补充。实验结果表明，该算法能够完整提取运动目标，并保证目标边缘的连续与平滑，同时检测的速度得到提升，可广泛应用于智能监控、医疗等领域。
- 自适应学习率 /
- 边缘提取 /
- 混合高斯建模 /
- 运动目标检测 /
- 三帧差分
Abstract: This paper proposes a three-frame difference method based on adaptive learning rate Gaussian mixture modeling. Through the Gaussian mixture background modeling based on adaptive learning rate, the adaptive correction of the background model is realized, and the algorithm can completely extract the internal information of the target in the dynamic environment. Then, the three-frame difference improvement algorithm based on edge extraction is used to extract the target contour rapidly and use it as the edge complement. The experimental results show that the algorithm can completely extract moving targets and ensure the continuity and smoothness of the target edges. At the same time, the speed of target detection is increased, and it can be widely used in intelligent video surveillance, medical treatment and other fields.
- adaptive learning rate /
- edge extraction /
- Gaussian mixture modeling /
- moving target detection /
- three-frame difference

图 1 算法对比图

下载: 全尺寸图片幻灯片

图 2 算法模块图

下载: 全尺寸图片幻灯片

图 3 检测结果对比图

下载: 全尺寸图片幻灯片

图 4 目标完整度及学习率变化图

下载: 全尺寸图片幻灯片

图 5 目标完整度对比图

下载: 全尺寸图片幻灯片

图 6 检测结果对比图

下载: 全尺寸图片幻灯片

图 7 算法对比

下载: 全尺寸图片幻灯片

图 8 算法对比

下载: 全尺寸图片幻灯片

表 1 算法评价结果

检测算法	视频数据	Recall /%	Precision /%	FM /%	处理速度 /s·f⁻¹
文献[9]	视频1 视频2	82.06	75.79	78.80	0.17
文献[5]	视频1 视频2	86.78	78.05	82.18	0.36
文献[14]	视频1 视频2	87.60	92.70	90.08	0.19
本文算法	视频1 视频2	96.32	92.14	94.18	0.24

下载: 导出CSV

[1]	PENG T, WANG C, WANG X, et al. Object detection in videos by high quality object linking[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, PP(99): 1.
[2]	WANG B, LIN Z. Improvements on Vibe algorithm for detecting foreground objects[C]//2016 5th International Conference on Computer Science and Network Technology (ICCSNT). [S.l.]: IEEE, 2017:10.1109/ICCSNT.2016.8069375.
[3]	CHU H, YANG Y, XIE Z, et al. Research of behavior recognition algorithm based on block matrix[C]//IEEE International Conference on Mechatronics & Automation. [S.l.]: IEEE, 2016: 1716-1720.
[4]	王忠华, 王超. 联合帧间差分和边缘检测的运动目标检测算法[J]. 南昌大学学报(理科版), 2017, 41(1):42-46. WANG Zhong-hua, WANG Chao. Interframe difference and edge detection-based moving object detection algorithm[J]. Journal of Nanchang University (Natural Science), 2017, 41(1): 42-46.
[5]	张磊, 傅志中, 周岳平. 基于HSV颜色空间和Vibe算法的运动目标检测[J]. 计算机工程与应用, 2014(4):181-185. doi: 10.3778/j.issn.1002-8331.1305-0026 ZHANG Lei, FU Zhi-zhong, ZHOU Yue-ping. Moving objects detection based on HSV colorspace and Vibe algorithm[J]. Computer Engineering and Applications, 2014(4): 181-185. doi: 10.3778/j.issn.1002-8331.1305-0026
[6]	周经美, 赵祥模, 程鑫, 等. 结合光流法的车辆运动估计优化方法[J]. 哈尔滨工业大学学报, 2016, 48(9):65-69. doi: 10.11918/j.issn.0367-6234.2016.09.012 ZHOU Jing-mei, ZHAO Xiang-mo, CHENG Xin, et al. Optical flow-based optimization method of vehicle motion estimation[J]. Journal of Harbin Institute of Technology, 2016, 48(9): 65-69. doi: 10.11918/j.issn.0367-6234.2016.09.012
[7]	肖军, 朱世鹏, 黄杭, 等. 基于光流法的运动目标检测与跟踪算法[J]. 东北大学学报(自然科学版), 2016, 37(6):770-774. XIAO Jun, ZHU Shi-peng, HUANG Hang, et al. Object detecting and tracking algorithm based on optical flow[J]. Journal of Northeastern University (Natural Science), 2016, 37(6): 770-774.
[8]	ZHONG Z, ZHANG Bob, LU Guang-ming, et al. An adaptive background modeling method for foreground segmentation[J]. IEEE Transactions on Intelligent Transportation Systems, 2017, 18(5): 1109-1121. doi: 10.1109/TITS.2016.2597441
[9]	袁益琴, 何国金, 王桂周, 等. 背景差分与帧间差分相融合的遥感卫星视频运动车辆检测方法[J]. 中国科学院大学学报, 2018, 35(1):50-58. YUAN Yi-qin, HE Guo-jin, WANG Gui-zhou, et al. A background subtraction and frame subtraction combined method for moving vehicle detection in satellite video data[J]. Journal of University of Chinese Academy of Sciences, 2018, 35(1): 50-58.
[10]	赵晓梅, 孙建德, 张元元. 基于分层匹配五元组Codebook的运动目标检测算法[J]. 计算机工程与应用, 2016, 52(7):196-201. doi: 10.3778/j.issn.1002-8331.1404-0374 ZHAO Xiao-mei, SUN Jian-de, ZHANG Yuan-yuan. Moving objects extraction algorithm based on hierarchical matching 5-tuple codebook[J]. Computer Engineering and Applications, 2016, 52(7): 196-201. doi: 10.3778/j.issn.1002-8331.1404-0374
[11]	杨文浩, 李小曼. 融合子块梯度与线性预测的单高斯背景建模[J]. 计算机应用, 2016, 36(5):1383-1386. doi: 10.11772/j.issn.1001-9081.2016.05.1383 YANG Wen-hao, LI Xiao-man. Single Gaussian model for background using block-based gradient and linear prediction[J]. Journal of Computer Applications, 2016, 36(5): 1383-1386. doi: 10.11772/j.issn.1001-9081.2016.05.1383
[12]	杜鹃, 吴芬芬. 高斯混合模型的运动目标检测与跟踪算法[J]. 南京理工大学学报, 2017, 41(1):41-46. DU Juan, WU Fen-fen. Movement target tracking algorithm by using Gaussian mixture model[J]. Journal of Nanjing University of Science and Technology, 2017, 41(1): 41-46.
[13]	苏剑臣, 李策, 杨峰. 基于边缘帧差和高斯混合模型的行人目标检测[J]. 计算机应用研究, 2018, 35(4):1246-1249. doi: 10.3969/j.issn.1001-3695.2018.04.061 SU Jian-chen, LI Ce, YANG Feng. Detection method for pedestrian target based on Gaussian mixture model and edge frame difference[J]. Application Research of Computers, 2018, 35(4): 1246-1249. doi: 10.3969/j.issn.1001-3695.2018.04.061
[14]	张汇, 杜煜, 宁淑荣, 等. 基于faster RCNN的行人检测方法[J]. 传感器与微系统, 2019, 38(2):153-155, 159. ZHANG Hui, DU Yu, NING Shu-rong, et al. Pedestrian detection method based on faster RCNN[J]. Transducer and Microsystem Technologies, 2019, 38(2): 153-155, 159.
[15]	孙挺, 齐迎春, 耿国华. 基于帧间差分和背景差分的运动目标检测算法[J]. 吉林大学学报(工学版), 2016, 46(4):1325-1329. SUN Ting, QI Ying-chun, GENG Guo-hua. Moving object detection algorithm based on frame difference and background subtraction[J]. Journal of Jilin University (Engineering and Technology Edition), 2016, 46(4): 1325-1329.
[16]	李晓瑜, 马大中, 付英杰. 基于三帧差分混合高斯背景模型运动目标检测[J]. 吉林大学学报(信息科学版), 2018, 36(4):61-69. LI Xiao-yu, MA Da-zhong, FU Ying-jie. Moving object detection using mixed gauss background model based on three frame differencing[J]. Journal of Jilin University (Information Science Edition), 2018, 36(4): 61-69.
[17]	MITTAL M, VERMA A, KAUR I, et al. An efficient edge detection approach to provide better edge connectivity for image analysis[J]. IEEE Access, 2019, 7(99): 33240-33255.

[1]	巩彬, 安爱民, 石耀科, 杜先君. 一种基于IMODA自适应深度信念网络的复杂模拟电路故障诊断方法 . 电子科技大学学报, 2024, 53(): 1-18. doi: 10.12178/1001-0548.2023047
[2]	. 一种自适应在线学习测评方法 . 电子科技大学学报, 2020, 49(5): 1-7. doi: 10.12178/1001-0548.2019259
[3]	易诗, 陈鑫凯, 宋瑞源, 常锦鹏, 周卓勋. 适用于智能球机的高鲁棒性侵入跟踪方法 . 电子科技大学学报, 2019, 48(5): 754-758. doi: 10.3969/j.issn.1001-0548.2019.05.015
[4]	张延良, 卢冰, 张伟涛, 李兴旺. 一种检测视频中运动目标的新方法 . 电子科技大学学报, 2019, 48(1): 46-52. doi: 10.3969/j.issn.1001-0548.2019.01.008
[5]	章军辉, 李庆, 陈大鹏. 车辆多模式多目标自适应巡航控制 . 电子科技大学学报, 2018, 47(3): 368-375. doi: 10.3969/j.issn.1001-0548.2018.03.008
[6]	田坤, 李晋. 太赫兹频段微动特征边缘检测及提取方法 . 电子科技大学学报, 2018, 47(1): 19-24, 36. doi: 10.3969/j.issn.1001-0548.2018.01.003
[7]	闫钧华, 段贺, 艾淑芳, 李大雷, 许倩倩. 旋转复杂背景中红外运动小目标实时检测 . 电子科技大学学报, 2017, 46(5): 697-702. doi: 10.3969/j.issn.1001-0548.2017.05.010
[8]	孙萍, 晏明国, 张鸿泽, 黄琦, 周林, 赵苡, 彭富刚, 刘培良. 差分脉冲阳极溶出伏安法检测重金属离子 . 电子科技大学学报, 2017, 46(5): 784-789. doi: 10.3969/j.issn.1001-0548.2017.05.022
[9]	周牧, 张巧, 田增山, 蒲巧林, 李玲霞. 基于图像边缘检测的WLAN室内用户运动地图构建 . 电子科技大学学报, 2016, 45(2): 240-245.
[10]	夏猛, 杨小牛. 基于三次相位补偿的运动目标参数估计 . 电子科技大学学报, 2013, 42(4): 559-564. doi: 10.3969/j.issn.1001-0548.2013.04.006
[11]	姜柯, 李艾华, 苏延召. 基于改进码本模型的视频运动目标检测算法 . 电子科技大学学报, 2012, 41(6): 932-936. doi: 10.3969/j.issn.1001-0548.2012.06.022
[12]	陈晓梅, 孟晓风, 王国华. 自适应阈值估计的MS模型仿真建模 . 电子科技大学学报, 2011, 40(1): 58-63. doi: 10.3969/j.issn.1001-0548.2011.01.011
[13]	罗洪艳, 杨维萍, 郑小林, 侯文生, 胡南, 廖彦剑. 小鼠切片图像自动去背景方法的研究 . 电子科技大学学报, 2011, 40(4): 625-629. doi: 10.3969/j.issn.1001-0548.2011.03.031
[14]	周秀云, 何晓渝, 冯中正. 左中右差分绝对值最大法的边缘检测方法研究 . 电子科技大学学报, 2010, 39(3): 388-391. doi: 10.3969/j.issn.1001-0548.2010.03.014
[15]	王博, 张建奇. 红外运动弱小目标的动态规划检测 . 电子科技大学学报, 2009, 38(4): 613-616. doi: 10.3969/j.issn.1001-0548.2009.04.032
[16]	曾磊, 曾斌, 韩迪. 分布式SAR系统中运动目标检测定位技术 . 电子科技大学学报, 2007, 36(1): 40-43.
[17]	姚远程, 马上. 一种视频图像中运动目标检测方法研究 . 电子科技大学学报, 2006, 35(4): 458-460,477.
[18]	张宇. 基于差分和肤色图像的人脸检测算法 . 电子科技大学学报, 2005, 34(4): 497-500.
[19]	齐红星, 陈树德, 乔登江, 庞小峰. 电磁场时域解的差分-谱混合方法 . 电子科技大学学报, 2004, 33(4): 349-352.
[20]	张翔, 刘媚洁, 陈立伟. 基于数学形态学的边缘提取方法 . 电子科技大学学报, 2002, 31(5): 490-493.

点击查看大图

图(8) / 表(1)

计量

文章访问数: 5117
HTML全文浏览量: 1713
PDF下载量: 52
被引次数: 0

全文HTML

运动目标检测能够识别目标运动所引起的帧间差异，是计算机视觉研究的一个重要分支^[1]。运动目标检测的核心是快速、完整地获取视频图像中的运动物体。快速性要求获取运动目标时，保持算法的低复杂度，实现实时检测。完整性不仅要保证所获取目标轮廓的完整性，更强调充分、完整地获取运动目标的内部信息。

为了快速获取目标，人们通常采用帧间差分法和基于Vibe的背景建模法^[2]。帧间差分法依据相邻帧间的图像差异获取目标，该方法计算简单、实时性强。但由于帧间图像同一位置的灰度值非常相近，容易导致空洞现象，使得运动目标的内部信息提取不完整。而基于Vibe的背景建模则是将当前帧的像素值与其邻域N个样本集建立起的背景模型进行比较，通过设定阈值将该像素点判定为前景或背景，该方法运算速率快，易于实现。但由于受限于基于少量样本建立的背景模型，当样本趋于无穷大时才能准确描述场景，在实际场景的应用中，当发生瞬时的光线突变时，背景模型来不及更新，容易将前景误判为背景，产生“空洞”现象。针对此问题，文献[3]采用膨胀、腐蚀形态学方法填充运动目标内部细小的空洞，解决了部分“空洞”现象；但由于像素点的扩充及消除，使得图像中连通区域的大小发生改变，很难得到完整且面积接近真实目标的检测结果。文献[4]在传统三帧差分基础上，运用Canny算子扩充图像边缘，减弱了“空洞”现象，但对于运动过快的物体，由于相邻帧间差异过大，易产生“重影”。而文献[5]通过HSV颜色空间和Vibe算法的结合实现运动目标内部信息的检测。

为了保证所获取目标的完整性，通常采用背景差分法^[6]和LK光流法^[7]，LK光流法通过各个像素的矢量特征对视频图像进行动态分析，从而得到完整目标，但其计算量过大，导致实时性和可用性差。背景差分根据当前帧与背景模型之间的差异，构建各像素点的高斯模型，通过目标像素与高斯模型的匹配，以获取运动目标。此方法通过建立稳定的背景模型来保证获取目标内部信息的完整性^[8]。建立背景模型的方法有均值背景建模^[9]、CodeBook背景建模^[10]、单高斯背景建模^[11]等。但上述方法所建立的背景模型仅适用于单一场景，在复杂背景下由于背景像素点与噪音的干扰，易造成目标信息的丢失及误判。而基于混合高斯建模的背景差分法^[12]以不断更新背景模型的方式实现运动目标的完整提取，但在学习过程中，高斯模型的更新多采用固定速率，忽略了在不同阶段的背景建模中，其更新速率应存在差异的事实。若仅以固定的更新速率完成背景模型的更新，易造成算法复杂度增加，实时性受到影响。针对实时性差等问题，文献[13]运用帧间差分实时性好的优势，来提高混合高斯建模的运算速度，但由于模型的更新速率无法适应背景信息的变化，使得算法对动态背景的适应性减弱；同时在物体运动缓慢或过快时，易造成像素点重叠较多或位置区域变化过大，若延用传统相邻帧间差分方式，会造成目标信息的丢失或“重影”。

运用深度学习的方法实现运动目标检测是近几年的研究热点。如文献[14]提出了基于Faster RCNN的行人检测方法，利用CNN提取图像特征，通过聚类和构建区域建议网络(RPN)提取可能含有行人的区域，再利用检测网络对目标区域进行判别和分类，从而得到运动目标。它提高了目标检测的准确度及速度，但会对一些形似目标的静止物体产生虚警与误判。

因此，目前的运动目标检测算法主要存在两方面的问题：1)当存在背景动态变化、噪声干扰及物体运动缓慢时，目标图像中对比度低的部分区域易被误判为背景，导致内部信息无法完整获取，易产生“空洞”问题；2)在物体快速运动时，由于边缘像素的位置发生较大变化，在差分运算时运动目标的轮廓易产生“重影”及边缘缺失的现象。

针对上述问题，本文提出了基于自适应学习率高斯建模的改进三帧差分算法，主要提出了两点改进：1)鉴于三帧差分实时性强的优势，为保证快速且尽可能完整地获取目标轮廓，采用任意帧间差分法，使差分结果不仅包括相邻帧间的差分信息，还包括跨帧差分的目标信息，以此增加差分图像所包含的边缘信息，防止由于像素点获取过多所造成的“重影”；2)鉴于混合高斯背景建模具有完整提取目标信息、抗干扰能力强的优势，为弥补三帧差分法极易带来的“空洞”问题，提出基于自适应学习率的混合高斯背景建模法对目标的内部信息进行提取，通过背景模型的自适应修正，实现目标内部信息的充分获取，提高目标检测的完整性。

3. 结束语

本文为了提高运动目标检测算法在动态背景中检测的完整性及快速性，提出一种改进的基于自适应学习率高斯建模的改进三帧差分算法。针对目标检测过程中背景变换及像素点获取不完整所导致目标内部信息缺失的问题，采用基于自适应学习率的混合高斯背景建模，加快高斯模型的迭代速度，实现背景模型的自适应更新。考虑到基于自适应学习率的混合高斯背景建模算法复杂度仍然较高，且存在边缘不连续的缺陷，提出基于边缘提取的三帧差分改进算法，将采用任意帧间差分法的三帧差分与边缘图像结合，获取更为完整的目标轮廓，并将结果作为基于自适应学习率的混合高斯背景建模算法的补充。本文算法结合了混合高斯建模，能完整地提取目标内部信息，抗干扰能力强，能快速提取目标轮廓、实时性高。实验结果表明，本文算法可以有效地消除动态背景及光照变换造成的干扰，在复杂环境中仍可以完整提取目标。

参考文献 (17)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于自适应学习率的运动目标高效检测算法

doi: 10.12178/1001-0548.2019131

作者简介:
郝晓丽，女，副教授，主要从事视频图像处理，情感计算，数据挖掘等方面的研究. E-mail：414919661@qq.com

High-Efficiency Detection Algorithm for Moving Targets Based on Adaptive Learning Rate

计量

基于自适应学习率的运动目标高效检测算法

doi: 10.12178/1001-0548.2019131

太原理工大学信息与计算机学院　山西晋中　030600

作者简介:
郝晓丽，女，副教授，主要从事视频图像处理，情感计算，数据挖掘等方面的研究. E-mail：414919661@qq.com

English Abstract

High-Efficiency Detection Algorithm for Moving Targets Based on Adaptive Learning Rate

College of Information and Computer, Taiyuan University of Technology　Jinzhong Shanxi　030600

全文HTML

1.1. 基于自适应学习率的混合高斯背景建模

1.1.1. 问题与解决思路

1.1.2. 高斯模型的更新

1.2. 基于边缘提取的三帧差分改进算法

1.2.1. 问题与解决思路

1.2.2. 基于边缘提取的三帧差分改进算法

1.3. 基于自适应学习率高斯建模的改进三帧差分算法

2.1. 自适应学习率对混合高斯背景建模的影响

2.2. 验证基于边缘提取的三帧差分改进算法

2.3. 多场景验证

2.3.1. 静态背景的目标检测

2.3.2. 动态背景的运动目标检测

目录

期刊在线

编辑办公

友情链接

留言板

基于自适应学习率的运动目标高效检测算法

doi: 10.12178/1001-0548.2019131

作者简介: 郝晓丽，女，副教授，主要从事视频图像处理，情感计算，数据挖掘等方面的研究. E-mail：414919661@qq.com

High-Efficiency Detection Algorithm for Moving Targets Based on Adaptive Learning Rate

计量

出版历程

基于自适应学习率的运动目标高效检测算法

doi: 10.12178/1001-0548.2019131

太原理工大学信息与计算机学院 山西 晋中 030600

作者简介: 郝晓丽，女，副教授，主要从事视频图像处理，情感计算，数据挖掘等方面的研究. E-mail：414919661@qq.com

English Abstract

High-Efficiency Detection Algorithm for Moving Targets Based on Adaptive Learning Rate

College of Information and Computer, Taiyuan University of Technology Jinzhong Shanxi 030600

全文HTML

1.1. 基于自适应学习率的混合高斯背景建模

1.1.1. 问题与解决思路

1.1.2. 高斯模型的更新

1.2. 基于边缘提取的三帧差分改进算法

1.2.1. 问题与解决思路

1.2.2. 基于边缘提取的三帧差分改进算法

1.3. 基于自适应学习率高斯建模的改进三帧差分算法

2.1. 自适应学习率对混合高斯背景建模的影响

2.2. 验证基于边缘提取的三帧差分改进算法

2.3. 多场景验证

2.3.1. 静态背景的目标检测

2.3.2. 动态背景的运动目标检测

目录

期刊在线

编辑办公

友情链接

作者简介:
郝晓丽，女，副教授，主要从事视频图像处理，情感计算，数据挖掘等方面的研究. E-mail：414919661@qq.com

太原理工大学信息与计算机学院　山西晋中　030600

作者简介:
郝晓丽，女，副教授，主要从事视频图像处理，情感计算，数据挖掘等方面的研究. E-mail：414919661@qq.com

College of Information and Computer, Taiyuan University of Technology　Jinzhong Shanxi　030600