融合超像素分割与码本模型的目标检测算法

凡时财; 曾祥峰; 周雪; 邹见效; 徐红兵

doi:10.3969/j.issn.1001-0548.2017.04.016

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名

邮箱

手机号码

标题

留言内容

验证码

融合超像素分割与码本模型的目标检测算法

电子科技大学自动化工程学院, 电子科技大学信息生物学研究中心成都 611731

基金项目:

国家自然科学基金面上项目 61472063

国家自然科学基金青年基金 61503061

中央高校基本科研业务费 ZYGX2016J102

吉林大学符号计算与知识工程教育部重点实验室开放基金 93K172017K02

详细信息

作者简介:
凡时财(1980-), 男, 博士, 副教授, 主要从事模式识别与智能信息处理方面的研究

中图分类号: TP391

Object Detection Algorithm Based on the Combination of the Superpixel Segmentation and Codebook Model

School of Automation Engineering, Center for Informational Biology, University of Electronic Science and Technology of China Chengdu 611731

摘要: 针对码本模型在前景目标检测中的效率有待进一步提高的现状，提出了融合超像素分割的码本构建算法。为减小处理对象的规模，设计了按照颜色及空间相似度聚类原始像素点的思路。以超像素作为码本构建单元，有利于抑制局部噪声并降低码本的冗余度。实验结果表明，融合超像素分割的码本模型算法在保持前景目标检测准确性的情况下，能显著减少视频处理过程中的内存消耗以及提高视频帧处理效率，在基于DM6437的嵌入式处理平台上达到了实时处理的性能。

关键词:

Abstract: A novel codebook model combined with the superpixel segmentation method is proposed in this paper to improve the efficiency of object detection. The original pixels are clustered based on the similarities of both color and location information to reduce the processing cost. Our revised codebook model based on the superpixel could not only suppress the effect of local noise, but also reduce the redundancy of codebook. Simulation results indicate that, our proposed algorithm could reduce the memory consumption and improve the processing speed significantly without sacrificing the detection precision. Our algorithm could implement the object detection in real time in the embedded video processing system based on the DM6437 processor.

Key words:

算法

Office

Badweather

Skating

码本

17.578

44.494

44.521

自适应码本

13.183

33.371

33.372

融合超像素的码本

2.282

3.433

3.434

融合超像素分割与码本模型的目标检测算法

电子科技大学自动化工程学院, 电子科技大学信息生物学研究中心成都 611731

基金项目:

国家自然科学基金面上项目 61472063

国家自然科学基金青年基金 61503061

中央高校基本科研业务费 ZYGX2016J102

吉林大学符号计算与知识工程教育部重点实验室开放基金 93K172017K02

作者简介:
凡时财(1980-), 男, 博士, 副教授, 主要从事模式识别与智能信息处理方面的研究

收稿日期: 2016-05-26

修回日期: 2016-11-14

刊出日期: 2017-07-30

中图分类号: TP391

关键词:

全文HTML

前景目标检测是计算机视觉领域最基础的研究课题之一，其检测效果对视频图像的后期处理质量有着极为重要的影响。目前较为主流的检测方法包括帧间差分法^[1-2]、光流法^[3-4]和背景减除法^[5-6]，其中，背景减除法最为常用。

背景减除法的核心任务是构建准确性高、适应性强的背景模型。高斯(含混合高斯)背景建模法通过对每个像素进行高斯统计建模，能够较好地刻画背景的统计特性并能对环境噪声有较强的适应能力。但其不足在于因复杂度高导致的大运算量以及多参数的求解问题^[7-8]，因此处理高分辨率视频流的时间消耗较大。基于模本的背景建模法通过对每个像素点在时间序列上的颜色扭曲度以及亮度信息构建码本模型，具有计算量和内存占用都较小的优势。随着码本模型的应用，近年也产生了多种改进的码本模型算法以提高其检测准确度或者算法效率。将传统的RGB空间转换为YUV空间进行码字描述^[9-10]，以及对码字快速排序以提高首次匹配成功率^[11-12]的方法可提高算法实时性。文献[13]采用mean-shift进行码字更新提高了目标检测的准确度，通过对码字结构进行简化运算后可以减少内存消耗^[14]。文献[15]通过自适应学习颜色畸变与亮度边界参数的改进也提高了前景检测准确率。上述码本模型算法虽然在提高检测速度、降低资源占用率等方面有所改进，但在处理高分辨率视频时的实时性指标方面仍有待进一步改善，特别是在计算性能与资源有限的嵌入式视频处理平台中的应用还有一定差距。

为进一步提高码本算法的检测效率，本文提出了融合超像素分割的码本模型，将传统的以像素为处理单元的方法转化为以具有相似特征的超像素为处理单元的码本构建方法，一方面可以抑制局部噪声的干扰，另一方面可以明显减小码本数量。在多组视频流数据上的实验结果表明，本文方法在保持前景检测准确率的情况下(甚至在前景检测率上略有提升)，不仅显著提高了算法的运算速度，还降低了内存的占用率，特别是在基于DM6437的嵌入式视频处理平台上能显著提高检测效率，达到实时检测的效果。

2. 码本更新与目标检测

为适应光线变化导致的干扰，以及较长时间不动的前景应视为背景等多种因素的影响，需要将不再发生变化的前景更新到背景模型，实现更为准确的前景目标检测。

2.1. 码本更新策略

码本背景模型的更新通过缓存Cache的更新实现。在前景目标检测阶段，给每个超像素块建立一个缓存Cache来存储前景码本。码本更新的策略为：

1) 建立并初始化基于超像素的前景码本；

2) 对于超像素块M，被判断为前景后与该Cache码本进行比较，如果与现有码字匹配则更新该码字，如果与现有码字不匹配则增加该码字；

3) 如果新的码字在Cache中存放的时间大于阈值T_add，或者旧的码字在Cache中存放的时间超过T_del且近段时间没有被匹配，则将该码字从Cache中去除，放入该超像素背景码本中。

2.2. 二值化处理

对每一帧待检测的视频流完成码本模型对比后，匹配成功的为背景，不成功的为前景。即完成前景目标的检测，得到离散的、形状大致与目标一致的前景区域，进一步对结果进行腐蚀膨胀处理后得到完整的二值图。

5. 结束语

为进一步提高码本模型在前景检测中的速度以及降低资源的占用率，本文提出了融合超像素分割的码本模型构建算法。通过对物理空间上具有相似特征的像素点的提取与划分，该方法在一定程度上抑制了局部噪声的干扰，减少了待处理视频帧的处理单元，即减少码本数量，达到显著提高处理速度的目的。基于3类标准数据集的实验结果表明，本文方法不仅在一定程度上提高了检测准确度，还显著提高了算法检测的快速性、降低了内存的使用率，具有良好的应用前景，特别是在嵌入式视频处理平台上具有明显的优势。

超像素分割中的两个关键参数K和m对目标检测的性能具有一定的影响，K的取值一般是几百的量级，而m的取值一般为几十的量级。其具体值的选择与待检测图像的目标形状以及颜色分布组成都有密切联系，实际中需要根据少量代表帧的分割结果进行确定。

当然，本文方法仍然存在一定局限性，如其二值化前景图的边缘不够清晰，对于局部特征变化较大(局部特征相似度不高)的场景效果并不理想。因此，使算法适应局部场景变化以及改善检测结果边缘效果，以进一步提高检测结果准确度是下一步的研究方向。

参考文献 (18)

[1]	HARWOOD I D, DAVIS L W. Real-time surveillance of people and their activities[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22(8):809-830. doi: 10.1109/34.868683
[2]	屈晶晶, 辛云宏.连续帧间差分与背景差分相融合的运动目标检测方法[J].光子学报, 2014, 43(7):213-220. http://www.cnki.com.cn/Article/CJFDTOTAL-GZXB201407040.htm QU Jing-jing, XIN Yun-hong. Combined continuous frame difference with background difference method for moving object detection[J]. Acta Photonica Sinica, 2014, 43(7):213-220. http://www.cnki.com.cn/Article/CJFDTOTAL-GZXB201407040.htm
[3]	ADIV G. Determining three-dimensional motion and structure from optical flow generated by several moving objects[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1985, PAMI-7(4):384-401. https://www.ncbi.nlm.nih.gov/pubmed/21869277
[4]	魏志强, 纪筱鹏, 冯业伟.基于自适应背景图像更新的运动目标检测方法[J].电子学报, 2005, 33(12):2261-2264. doi: 10.3321/j.issn:0372-2112.2005.12.038 WEI Zhi-qiang, JI Xiao-peng, FENG Ye-wei. A moving object detection method based on self-adaptive updating of background[J]. Acta Electronica Sinica, 2005, 33(12):2261-2264. doi: 10.3321/j.issn:0372-2112.2005.12.038
[5]	WREN C R, AZARBAYEJANI A, DARRELL T, et al. Real-time tracking of the human body[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7):780-785. doi: 10.1109/34.598236
[6]	陈磊, 邹北骥.基于动态阈值对称差分和背景差法的运动对象检测算法[J].计算机应用研究, 2008, 25(2):488-490. http://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ200802053.htm CHEN Lei, ZOU Bei-ji. New algorithm for detecting moving object based on adaptive background subtraction and symmetrical differencing[J]. Application Research of Computers, 2008, 25(2):488-490. http://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ200802053.htm
[7]	SUHR J K, JUNG H G, LI G, et al. Mixture of Gaussians-based background subtraction for Bayer-pattern image sequences[J]. IEEE Transactions on Circuits & Systems for Video Technology, 2011, 21(3):365-370. https://www.researchgate.net/profile/Gen_Li16/publication/220597834_Mixture_of_Gaussians-Based_Background_Subtraction_for_Bayer-Pattern_Image_Sequences/links/5693772f08aec14fa55e88fa.pdf?origin=publication_detail
[8]	NGUYEN T M, WU Q M J. Fast and robust spatially constrained Gaussian mixture model for image segmentation[J]. IEEE Transactions on Circuits & Systems for Video Technology, 2013, 23(4):621-635. https://www.researchgate.net/publication/260665267_Fast_and_Robust_Spatially_Constrained_Gaussian_Mixture_Model_for_Image_Segmentation
[9]	王雯, 陈丽, 李晨, 等. YUV空间下基于码本模型的视频运动目标检测方法[J].武汉大学学报:工学版, 2015(3):412-416. http://www.cnki.com.cn/Article/CJFDTOTAL-WSDD201503024.htm WANG Wen, CHEN Li, LI Chen, et al. Moving target detection method based on codebook model under YUV space[J]. Engineering Journal of Wuhan University, 2015(3):412-416. http://www.cnki.com.cn/Article/CJFDTOTAL-WSDD201503024.htm
[10]	徐成, 田峥, 李仁发.一种基于改进码本模型的快速运动检测算法[J].计算机研究与发展, 2010, 47(12):2149-2156. http://www.cnki.com.cn/Article/CJFDTOTAL-JFYZ201012023.htm XU Cheng, TIAN Zheng, LI Ren-fa. A fast motion detection method based on improved codebook model[J]. Journal of Computer Research and Development, 2010, 47(12):2149-2156. http://www.cnki.com.cn/Article/CJFDTOTAL-JFYZ201012023.htm
[11]	姜柯, 李艾华, 苏延召.基于改进码本模型的视频运动目标检测算法[J].电子科技大学学报, 2012, 41(6):932-936. http://www.juestc.uestc.edu.cn/CN/abstract/abstract1465.shtml JIANG Ke, LI Ai-hua, SU Yan-zhao. Moving targets detecting algorithm in video based on improved codebook model[J]. Journal of University of Electronic Science and Technology of China, 2012, 41(6):932-936. http://www.juestc.uestc.edu.cn/CN/abstract/abstract1465.shtml
[12]	姜柯, 李艾华, 苏延召.双重自适应码本模型在运动目标检测中的应用[J].计算机辅助设计与图形学学报, 2013, 25(1):67-73. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJF201301009.htm JIANG Ke, LI Ai-hua, SU Yan-zhao. Moving objects detection with double adaptive codebook model[J]. Journal of Computer-Aided Design & Computer Graphics, 2013, 25(1):67-73. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJF201301009.htm
[13]	郭春生, 王盼.一种基于码本模型的运动目标检测算法[J].中国图象图形学报, 2010, 15(7):1079-1083. doi: 10.11834/jig.080502 GUO Chun-sheng, WANG Pan. An algorithm based on codebook model to moving objects detection[J]. Journal of Image and Graphics, 2010, 15(7):1079-1083. doi: 10.11834/jig.080502
[14]	李文辉, 李慧春, 王莹, 等.对码本模型中码字结构的改进[J].吉林大学学报:理学版, 2012, 50(3):517-522. http://www.cnki.com.cn/Article/CJFDTOTAL-JLDX201203030.htm LI Wen-hui, LI Hui-chun, WANG Ying, et al. Improvement on codeword structure in codebook model[J]. Journal of Jilin University(Science Edition), 2012, 50(3):517-522. http://www.cnki.com.cn/Article/CJFDTOTAL-JLDX201203030.htm
[15]	SHAH M, DENG J D, WOODFORD B J. A self-adaptive codebook (SACB) model for real-time background subtraction[J]. Image & Vision Computing, 2015, 38:52-64. https://www.researchgate.net/profile/Jeremiah_Deng/publication/275058799_A_Self-Adaptive_CodeBook_SACB_Model_for_Real-time_Background_Subtraction/links/55b0b41f08aeb0ab4669a5c7.pdf?inViewer=0&pdfJsDownload=0&origin=publication_detail
[16]	REN X, MALIK J. Learning a classification model for segmentation[C]//2003 IEEE International Conference on Computer Vision.[S.l.]:IEEE, 2003, 1:10-17.
[17]	ACHANTA R, SHAJI A, SMITH K A, et al. SLIC superpixels compared to state-of-the-art superpixel methods[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11):2274-2282. doi: 10.1109/TPAMI.2012.120
[18]	GOYETTE N, JODOIN P M, PORIKLI F, et al. Change detection net:a new change detection benchmark dataset[C]//IEEE Computer Society Conference on Computer Vision & Pattern Recognition Workshops.[S.l.]:IEEE, 2012:1-8.

[1]	赵云龙, 田生祥, 李岩, 罗龙, 齐鹏文. 基于注意力模型和Soft-NMS的输电线路小目标检测方法 . 电子科技大学学报, 2023, 52(6): 906-914. doi: 10.12178/1001-0548.2022290
[2]	邓佳丽, 龚海刚, 刘明. 基于目标检测的医学影像分割算法 . 电子科技大学学报, 2023, 52(2): 254-262. doi: 10.12178/1001-0548.2022081
[3]	周雪, 梁超, 何均洋, 唐瀚林. 一体化多目标跟踪算法研究综述 . 电子科技大学学报, 2022, 51(5): 728-736. doi: 10.12178/1001-0548.2021349
[4]	候少麒, 梁杰, 殷康宁, 刘学婷, 殷光强. 基于空洞卷积金字塔的目标检测算法 . 电子科技大学学报, 2021, 50(6): 843-851. doi: 10.12178/1001-0548.2021032
[5]	艾斯卡尔·艾木都拉, 武文成. 基于多尺度局部梯度的点目标检测技术 . 电子科技大学学报, 2019, 48(6): 893-903. doi: 10.3969/j.issn.1001-0548.2019.06.014
[6]	闫钧华, 段贺, 艾淑芳, 李大雷, 许倩倩. 旋转复杂背景中红外运动小目标实时检测 . 电子科技大学学报, 2017, 46(5): 697-702. doi: 10.3969/j.issn.1001-0548.2017.05.010
[7]	贾海涛, 方道恒, 舒畅. 阵列摄像机测量系统研究与实现 . 电子科技大学学报, 2015, 44(6): 835-839. doi: 10.3969/j.issn.1001-0548.2015.06.007
[8]	杨海光, 易青颖, 李中余, 武俊杰, 黄钰林, 杨建宇. 临近空间慢速平台SAR地面动目标检测与成像 . 电子科技大学学报, 2014, 43(6): 838-844. doi: 10.3969/j.issn.1001-0548.2014.06.008
[9]	任金胜, 贾海涛. 基于改进目标检测能量项的联合语义分割和目标检测 . 电子科技大学学报, 2014, 43(5): 749-753. doi: 10.3969/j.issn.1001-0548.2014.05.020
[10]	张抒, 解梅. 基于热扩散理论的窗融合方法研究 . 电子科技大学学报, 2014, 43(2): 257-261. doi: 10.3969/j.issn.1001-0548.2014.02.019
[11]	胡学海, 王厚军, 黄建国. 分布式目标检测融合决策优化算法 . 电子科技大学学报, 2013, 42(3): 375-379. doi: 10.3969/j.issn.1001-0548.2013.03.011
[12]	刘啸滨, 郭兵, 沈艳, 朱建, 王继禾, 伍元胜. 基于ARM处理器的嵌入式软件能耗统计模型 . 电子科技大学学报, 2012, 41(5): 770-774. doi: 10.3969/j.issn.1001-0548.2012.05.024
[13]	姜柯, 李艾华, 苏延召. 基于改进码本模型的视频运动目标检测算法 . 电子科技大学学报, 2012, 41(6): 932-936. doi: 10.3969/j.issn.1001-0548.2012.06.022
[14]	樊玲, 张晓玲. 雷达微弱目标探测的改进检测前跟踪算法 . 电子科技大学学报, 2011, 40(6): 839-843. doi: 10.3969/j.issn.1001-0548.2011.06.006
[15]	刘啸滨, 郭兵, 沈艳, 王继禾, 伍元胜. 嵌入式软件算法级功耗BP网络模型研究 . 电子科技大学学报, 2011, 40(6): 921-926. doi: 10.3969/j.issn.1001-0548.2011.06.022
[16]	饶妮妮, 王祥林, 周博, 程宇锋, 王刚. 线性预测盲源提取算法应用于阵列雷达的分析 . 电子科技大学学报, 2010, 39(1): 1-5. doi: 10.3969/j.issn.1001-0548.2010.01.001
[17]	辛勤, 粘永健, 万建伟, 何密. 基于FastICA的高光谱图像压缩技术 . 电子科技大学学报, 2010, 39(5): 711-715,730. doi: 10.3969/j.issn.1001-0548.2010.05.014
[18]	王博, 张建奇. 红外运动弱小目标的动态规划检测 . 电子科技大学学报, 2009, 38(4): 613-616. doi: 10.3969/j.issn.1001-0548.2009.04.032
[19]	吴琦, 熊光泽. 嵌入式系统功耗优化电池模型 . 电子科技大学学报, 2007, 36(3): 551-554.
[20]	曾磊, 曾斌, 韩迪. 分布式SAR系统中运动目标检测定位技术 . 电子科技大学学报, 2007, 36(1): 40-43.

留言板