基于多尺度特征预测的异常事件检测

王军

doi:10.12178/1001-0548.2021333

基于多尺度特征预测的异常事件检测

doi: 10.12178/1001-0548.2021333

王军^,

电子科技大学中山学院机电工程学院　广东中山　528402

基金项目: 国家自然科学基金(51678075)

详细信息

作者简介:
王军(1971- )，男，博士，副教授，主要从事图像处理与模式识别方面的研究

通讯作者: 王军，E-mail：106919257@qq.com

中图分类号: TP391

Abnormal Event Detection Based on Multi-Scale Features Prediction

WANG Jun^,

College of Mechanical and Electrical Engineering, Zhongshan Institute, University of Electronics Science and Technology　Zhongshan Guangdong　528402

摘要: 传统异常事件检测方法面临着视频中物体大小变化、背景等问题的影响。为了解决该问题，提出了一种基于多尺度特征预测的异常事件检测方法。首先，利用空洞卷积提取不同大小感受野的特征并进行融合以解决物体大小变化的问题。然后，使用一种轻量化的通道注意力方法来减少无效背景信息的影响。最后，为了充分利用视频帧之间的上下文信息，采用深度特征预测模块根据历史时刻的特征预测当前时刻的特征，并根据预测特征与真实特征之间的差异进行异常判断。在USCD Ped2，UMN两个基准数据集上进行了实验，实验结果表明了该文方法的有效性。
- 异常事件检测 /
- 通道注意力 /
- 特征预测 /
- 多尺度特征
Abstract: A novel method for abnormal event detection is proposed based on multi-scale feature prediction. Firstly, dilated convolution network is used to extract the features of different size receptive fields and fuse them so that address the objects of different scale in video frame. Secondly, a lightweight channel-wise attention module is applied to reduce the impact of background information. Finally, in order to make full use of the context information between video frames, a deep feature prediction module is applied to predict the features of the current moment based on the features of the historical moment, and the prediction error is used for abnormality judgment. Experiments were performed on the two benchmark data sets of USCD Ped2 and UMN to test and evaluate the proposed method. The experiments results show that the proposed method is more effective than other state-of-the-art methods.
- abnormal event detection /
- channel-wise attention /
- feature prediction /
- multi-scale feature
图 1 多尺度特征融合模块结构

下载: 全尺寸图片幻灯片

图 2 轻量化通道模块注意力结构

下载: 全尺寸图片幻灯片

图 3 不同方法在Ped2上的帧级别ROC曲线对比

下载: 全尺寸图片幻灯片

图 4 不同方法在UMN上的帧级别ROC曲线对比

下载: 全尺寸图片幻灯片

表 1 特征预测模块的结构

Layer Filter/Stride Activation function

Conv1 (1×1×512)/1 ReLU
Conv2 (1×1×256)/1 ReLU
Conv3 (1×1×128)/1 −
Conv4 (1×1×256)/1 ReLU

下载: 导出CSV

表 2 不同方法在USCD Ped2和UMN上的$ {\varDelta _s} $对比结果

方法数据集
Ped2 UMN

U-Net 0.435 0.362
U-Net with Multi-scale feature fusion module 0.468 0.395

下载: 导出CSV

表 3 不同通道注意力的对比实验结果

方法数据集
Ped2 UMN

Without channel-wise attention 0.468 0.395
With SENet 0.493 0.413
With proposed attention module 0.502 0.429

下载: 导出CSV

[1]	LIU W, LUO W, LIAN D, et al. Future frame prediction for anomaly detection-a new baseline[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2018: 6536-6545.
[2]	LU C, SHI J, JIA J. Abnormal event detection at 150 fps in matlab[C]//2013 IEEE International Conference on Computer Vision. [S.l.]: IEEE, 2013: 2720-2727.
[3]	SULTANI W, CHEN C, SHAH M. Real-World anomaly detection in surveillance videos[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2018: 6479-6488.
[4]	SONG H, SUN C, WU X, et al. Learning normal patterns via adversarial attention-based autoencoder for abnormal event detection in videos[J]. IEEE Transactions on Multimedia, 2020, 22(8): 2138-2148. doi: 10.1109/TMM.2019.2950530
[5]	NGUYEN T N, MEUNIER J. Anomaly detection in video sequence with appearance-motion correspondence[C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV). [S.l.]: IEEE, 2019: 1273-1283.
[6]	CHANG Y, TU Z, XIE W, et al. Clustering driven deep autoencoder for video anomaly detection[C]//16th European Conference on Computer Vision (ECCV). Glasgow: Springer, 2020: 329-345.
[7]	ZHAO Y, DENG B, SHEN C, et al. Spatio-temporal autoencoder for video anomaly detection[C]//Proceedings of the 25th ACM International Conference on Multimedia. New York: Association for Computing Machinery, 2017: 1933-1941.
[8]	FERNANDO T, DENMAN S, SRIDHARAN S, et al. Soft + hardwired attention: An lstm framework for human trajectory predictionand abnormal event detection[J]. Neural Networks 2018, 108: 466-478.
[9]	YANG B, CAO J, WANG N, et al. Anomalous behaviors detection in moving crowds based on a weighted convolutional autoencoder-long short-term memory network[J]. IEEE Transactions on Cognitive and Devel-Opmental Systems, 2019, 11(4): 473-482. doi: 10.1109/TCDS.2018.2866838
[10]	LEE S, KIM H G, RO Y M. Bman: Bidirectional multi-scale aggregation networks for abnormal event detection[J]. IEEE Transactions on Image Processing, 2020, 29: 2395-2408. doi: 10.1109/TIP.2019.2948286
[11]	ABATI D, PORRELLO A, CALDERARA S, et al. Latent space autoregression for novelty detection[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). [S.l.]: IEEE, 2019: 481-490.
[12]	HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2018, 7132-7141.
[13]	ZHANG Y, LU H C, ZHANG L H, et al. Combining motion and appearance cues for anomaly detection[J]. Pattern Recognition, 2016, 51: 443-452. doi: 10.1016/j.patcog.2015.09.005
[14]	MEHRAN R, OYAMA A, SHAH M. Abnormal crowd behavior detection using social force model[C]//2009 IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2009: 935-942.
[15]	CONG Y, YUAN J, LIU J. Sparse reconstruction cost for abnormal event detection[C]//2011 IEEE Conference on Computer Vision and Pattern Recognition. Colorado: IEEE, 2011: 3449-3456.
[16]	ZHANG Y, LU H C, ZHANG L H, et al. Video anomaly detection based on locality sensitive hashing filters[J]. Pattern Recognition, 2016, 59: 302-311. doi: 10.1016/j.patcog.2015.11.018
[17]	LIU Y S, LI C L, P´oczos Barnaba´s. Classifier two-sample test for video anomaly detections[EB/OL]. [2021-10-11]. http://www.bmva.org/bmvc/2018/contents/papers/0237.pdf.
[18]	WANG Y, ZHANG Q, LI B. Efficient unsupervised abnormal crowd activity detection based on a spatiotemporal saliency detector[C]//2016 IEEE Winter Conference on Applications of Computer Vision (WACV). [S.l.]: IEEE, 2016: 1-9.
[19]	MAHADEVAN V, LI W, BHALODIA V, et al. Anomaly detection in crowded scenes[C]//Computer Vision & Pattern Recognition. [S.l.]: IEEE, 2010: 1975-1981.

[1]	崔少国, 独潇, 张宜浩. 基于兴趣注意力网络的会话推荐算法 . 电子科技大学学报, 2024, 53(1): 67-75. doi: 10.12178/1001-0548.2022307
[2]	陈欣, 李闯, 金凡. 量子自注意力神经网络的时间序列预测 . 电子科技大学学报, 2024, 53(1): 110-118. doi: 10.12178/1001-0548.2022340
[3]	孙长印, 梁有为, 江帆, 王军选. 场景化毫米波特征选择和波束预测算法 . 电子科技大学学报, 2023, 52(5): 689-698. doi: 10.12178/1001-0548.2022214
[4]	郭峰, 陈中舒, 代久双, 吴云峰, 刘军, 张昌华. 基于动态先验特征的包覆药多类型外观缺陷深度检测框架 . 电子科技大学学报, 2023, 52(6): 872-879. doi: 10.12178/1001-0548.2022326
[5]	赵云龙, 田生祥, 李岩, 罗龙, 齐鹏文. 基于注意力模型和Soft-NMS的输电线路小目标检测方法 . 电子科技大学学报, 2023, 52(6): 906-914. doi: 10.12178/1001-0548.2022290
[6]	齐鹏文, 李渊, 李岩, 罗龙, 赵云龙. 基于注意力模型的输电线路隐患检测 . 电子科技大学学报, 2023, 52(2): 240-246. doi: 10.12178/1001-0548.2022063
[7]	陈永, 蒋丰源, 詹芝贤. 多尺度残差注意力的高速铁路OFDM信道估计 . 电子科技大学学报, 2023, 52(4): 512-522. doi: 10.12178/1001-0548.2022205
[8]	方祺娜, 许小可. 基于异质模体特征的社交网络链路预测 . 电子科技大学学报, 2022, 51(2): 274-281. doi: 10.12178/1001-0548.2021181
[9]	周丰丰, 牛甲昱. 细胞穿膜肽识别问题的多特征融合卷积网络预测算法 . 电子科技大学学报, 2022, 51(4): 494-499. doi: 10.12178/1001-0548.2021391
[10]	郭磊, 王邱龙, 薛伟, 郭济. 基于注意力机制的光线昏暗条件下口罩佩戴检测 . 电子科技大学学报, 2022, 51(1): 123-129. doi: 10.12178/1001-0548.2021222
[11]	张凤荔, 王雪婷, 王瑞锦, 汤启友, 韩英军. 融合动态图表示和自注意力机制的级联预测模型 . 电子科技大学学报, 2022, 51(1): 83-90. doi: 10.12178/1001-0548.2021100
[12]	曹红艳, 许小可, 许爽. 基于多模体特征的科学家合作预测 . 电子科技大学学报, 2020, 49(5): 766-773. doi: 10.12178/1001-0548.2019173
[13]	李学明, 岳贡, 陈光伟. 基于多模态注意力机制的图像理解描述新方法 . 电子科技大学学报, 2020, 49(6): 867-874. doi: 10.12178/1001-0548.2019228
[14]	艾斯卡尔·艾木都拉, 武文成. 基于多尺度局部梯度的点目标检测技术 . 电子科技大学学报, 2019, 48(6): 893-903. doi: 10.3969/j.issn.1001-0548.2019.06.014
[15]	邓钰, 雷航, 李晓瑜, 林奕欧. 用于目标情感分类的多跳注意力深度模型 . 电子科技大学学报, 2019, 48(5): 759-766. doi: 10.3969/j.issn.1001-0548.2019.05.016
[16]	蒋伟雄, 曾令李, 秦键, 刘华生, 沈辉, 王维. 利用动态功能连接对健康危险性行为特征的预测 . 电子科技大学学报, 2018, 47(6): 927-931. doi: 10.3969/j.issn.1001-0548.2018.06.020
[17]	李彦冬, 雷航, 郝宗波, 唐雪飞. 基于多尺度显著区域特征学习的场景识别 . 电子科技大学学报, 2017, 46(3): 600-605. doi: 10.3969/j.issn.1001-0548.2017.03.020
[18]	王明会, 龚艺, 王强, 冯焕清, 李骜. 整合序列与蛋白相互作用特征的亚细胞定位预测 . 电子科技大学学报, 2015, 44(3): 467-470. doi: 10.3969/j.issn.1001-0548.2015.03.026
[19]	沈志熙, 代东林, 赵凯. 基于多特征分步模糊推理的边缘检测算法 . 电子科技大学学报, 2014, 43(3): 381-387. doi: 10.3969/j.issn.1001-0548.2014.03.011
[20]	韩杰思, 沈建京. 采用图像滤波的多特征JPEG盲检测 . 电子科技大学学报, 2011, 40(2): 255-260. doi: 10.3969/j.issn.1001-0548.2011.02.020

点击查看大图

图(4) / 表(3)

计量

文章访问数: 3690
HTML全文浏览量: 1124
PDF下载量: 70
被引次数: 0

全文HTML

随着公共安全体系建设的不断发展，监控摄像头被广泛应用在各种公共场合中，如商场、街道、银行等。由于监控视频内容庞大，人工进行异常事件检测会耗费大量的人力物力^[1-4]。因此，如何建立一个高效的自动异常事件检测系统非常重要，这也是计算机视觉研究的一个重要方向。

异常事件检测大体可分为基于手工特征的方法和基于深度学习的方法，近年来基于深度学习的方法被广泛研究^[1,5-10]。由于深度神经网络卓越的生成能力，基于重建和预测的异常事件检测方法被广泛地使用。文献[1]开创性地将U-net网络引入异常事件检测领域中，根据历史时刻的视频帧预测未来帧，并根据预测误差进行异常检测。文献[5]对U-Net网络进行改进，将其变化为一个双流网络，网络的两个流分别对视频帧进行重建和预测，并引入生成对抗的思想进行训练，以生成更加逼真的图像，最后根据重建误差进行异常判断。考虑到视频是由一系列关联性很强的图像组成，不少学者提出时间信息的概念，并将其用于视频异常事件检测中。文献[7]利用3D卷积提取输入视频片段中的空间特征和时间信息特征，并使用两个3D反卷积分别进行重建和预测。循环神经网络(recurrent neural network, RNN)及其变体由于其优秀的时间信息编码能力被用于异常事件检测中。文献[8]将LSTM网络与软硬注意力相结合提出行人轨迹预测网络，该网络不仅关注行人的历史轨迹，同时还关注该行人的邻域对其轨迹的影响。文献[9]将卷积自编码器与ConvLSTM相结合，利用卷积自编码器获取空间特征的变化，利用ConvLSTM记录特征随时间的变化，并将光流作为补充信息，从全局−局部的角度分析异常。此外，由于监控视频的视角大多是固定的，视频中可能会出现不同大小的物体，因此多尺度特征被引入到检测模型中。文献[10]提出一种双边多尺度聚合网络，该网络利用不同膨胀率的空洞卷积提取不同大小感受野的特征，利用ConvLSTM进行双边时间信息编码。

虽然视频异常检测已经取得了一些成就，但依然存在一些问题。如视频中物体大小的变化、复杂背景的影响以及不同场景下异常的定义不同等。为了解决以上问题，本文提出一种充分利用多尺度特征和时间−空间信息的异常事件检测方法。首先，利用经过预训练的VGG16网络提取特征，构建多尺度特征融合模块获取更多不同大小感受野的信息，以获得对输入视频帧的完备表示。其次，使用一种轻量化的通道注意力模块来强调视频中重要的前景信息，以减少背景信息对检测的影响。在此基础上，根据历史时刻特征预测当前时刻的特征，这将有助于弥补前文模块中对上下文信息和时间信息利用不足的缺陷。在训练阶段，最小化预测特征与真实特征之间的欧式距离使整个网络收敛。在测试阶段，本文认为仅包含正常事件的视频帧可以很好地预测，而包含异常事件的视频帧将会产生很大的预测误差。因此，在测试时将根据预测误差进行异常判断。在USCD Ped2和UMN两个基准数据集上进行了实验，实验结果表明了提出方法的有效性。

5. 结束语

本文提出了一种充分利用视频中多尺度信息和时间信息的异常事件检测网络，该网络不仅关注视频中的全局−局部信息，还考虑了空间−时间信息。该网络利用空洞卷积获取多个不同大小的感受野的信息并进行融合以获得整个视频帧的全局−局部表示，并且引入一种轻量化通道注意力机制，通过计算特征图中不同通道所含信息的重要程度，提升重要通道的权重，抑制背景和噪声等干扰因素的影响。最后，为了充分利用时间信息，使用自编码器编码历史时刻的特征序列并预测当前时刻的特征，预测特征与真实特征之间的误差将被用于异常判断。在两个基准数据集上与几种方法进行了对比实验，实验结果证明了本文方法的有效性。

参考文献 (19)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于多尺度特征预测的异常事件检测

doi: 10.12178/1001-0548.2021333

作者简介:
王军(1971- )，男，博士，副教授，主要从事图像处理与模式识别方面的研究

通讯作者: 王军，E-mail：106919257@qq.com

Abnormal Event Detection Based on Multi-Scale Features Prediction

计量

基于多尺度特征预测的异常事件检测

doi: 10.12178/1001-0548.2021333

电子科技大学中山学院机电工程学院　广东中山　528402

作者简介:
王军(1971- )，男，博士，副教授，主要从事图像处理与模式识别方面的研究

通讯作者: 王军，E-mail：106919257@qq.com

English Abstract

Abnormal Event Detection Based on Multi-Scale Features Prediction

College of Mechanical and Electrical Engineering, Zhongshan Institute, University of Electronics Science and Technology　Zhongshan Guangdong　528402

全文HTML

4.1. 实验数据

4.2. 实验设置

4.3. 消融实验

4.3.1. 多尺度特征的影响

4.3.2. 通道注意力的影响

4.4. 对比实验

目录

期刊在线

编辑办公

友情链接

Layer	Filter/Stride	Activation function
Conv1	(1×1×512)/1	ReLU
Conv2	(1×1×256)/1	ReLU
Conv3	(1×1×128)/1	−
Conv4	(1×1×256)/1	ReLU

方法	数据集
方法	Ped2	UMN
U-Net	0.435	0.362
U-Net with Multi-scale feature fusion module	0.468	0.395

方法	数据集
方法	Ped2	UMN
Without channel-wise attention	0.468	0.395
With SENet	0.493	0.413
With proposed attention module	0.502	0.429

方法	数据集
方法	Ped2	UMN
Without channel-wise attention	0.468	0.395
With SENet	0.493	0.413
With proposed attention module	0.502	0.429

留言板

基于多尺度特征预测的异常事件检测

doi: 10.12178/1001-0548.2021333

作者简介: 王军(1971- )，男，博士，副教授，主要从事图像处理与模式识别方面的研究

通讯作者: 王军，E-mail：106919257@qq.com

Abnormal Event Detection Based on Multi-Scale Features Prediction

计量

出版历程

基于多尺度特征预测的异常事件检测

doi: 10.12178/1001-0548.2021333

电子科技大学中山学院机电工程学院 广东 中山 528402

作者简介: 王军(1971- )，男，博士，副教授，主要从事图像处理与模式识别方面的研究

通讯作者: 王军，E-mail：106919257@qq.com

English Abstract

Abnormal Event Detection Based on Multi-Scale Features Prediction

College of Mechanical and Electrical Engineering, Zhongshan Institute, University of Electronics Science and Technology Zhongshan Guangdong 528402

全文HTML

4.1. 实验数据

4.2. 实验设置

4.3. 消融实验

4.3.1. 多尺度特征的影响

4.3.2. 通道注意力的影响

4.4. 对比实验

目录

期刊在线

编辑办公

友情链接

作者简介:
王军(1971- )，男，博士，副教授，主要从事图像处理与模式识别方面的研究

电子科技大学中山学院机电工程学院　广东中山　528402

作者简介:
王军(1971- )，男，博士，副教授，主要从事图像处理与模式识别方面的研究

College of Mechanical and Electrical Engineering, Zhongshan Institute, University of Electronics Science and Technology　Zhongshan Guangdong　528402