基于近似存在性查询的高效图像异常检测方法

伍凌川; 史慧芳; 邱枫; 石义官

doi:10.12178/1001-0548.2024032

基于近似存在性查询的高效图像异常检测方法

doi: 10.12178/1001-0548.2024032

伍凌川¹,
史慧芳¹,
邱枫^{1, 2},
石义官^{1, 2, ,}

1.
中国兵器装备集团自动化研究所有限公司，绵阳 621000
2.
北京理工大学机械与车辆学院，北京 100081

基金项目: 国防基础科研（JCKY2022209A002）；国家自然科学基金重点项目（T2293771）

详细信息

作者简介:
伍凌川（1978— ），男，正高级工程师，主要从事弹药装药装配工艺技术、智能制造技术研究

通讯作者: 石义官，E-mail：shiyg888@163.com

中图分类号: TP391.4

An Efficient Image Anomaly Detection Approach Based on Approximate Membership Query

WU Lingchuan¹,
SHI Huifang¹,
QIU Feng^{1, 2},
SHI Yiguan^{1, 2
, ,}

1.
Automation Research Institute Co., Ltd. of China South Industries Group Corporation, MianYang 621000, China
2.
School of mechanical engineering, Beijing Institute of Technology, Beijing 100081, China

摘要: 对于图像异常检测问题，查询测试样本在正常样本集中的K近邻距离并估计其异常程度，是一类准确率较高、对复杂分布的效果较稳定的方法。此类方法采用近似最近邻搜索（Approximate Nearest Neighbour Search, ANNS）索引进行K近邻搜索。但由于ANNS查询操作较高的计算开销和现实问题中庞大的数据量，此类方法的计算效率难以应对低时延、高吞吐量的应用场景。该文基于局部敏感哈希和布隆过滤器，提出了一种近似存在性查询（Approximate Membership Query, AMQ）方法，用特征近似存在性预测异常样本。相比于ANNS，AMQ具有更低的计算复杂度且更适合单指令多数据并行，可以有效解决基于特征库检索方法的计算性能瓶颈。在MVTec-AD数据集上的实验结果显示，基于AMQ的方法的异常分割准确率仅比ANNS方法降低1%左右，但推理时延、吞吐量、内存开销显著较优，接近端到端深度学习异常检测模型的计算效率。
- 异常检测 /
- 无监督学习 /
- 近似存在性查询 /
- 布隆过滤器 /
- 局部敏感哈希
Abstract: An accurate and stable approach to image anomaly detection is to query the K-nearest neighbours of the image features from normal examples and estimate the anomaly score, relying on approximate nearest neighbour search (ANNS) indices. ANNS query operation has high computational cost on large datasets, unpractical for low-latency and high-throughput scenarios. Based on locality sensitive hashing and Bloom filters, an approximated membership query (AMQ) based approach is proposed to predict anomalies by approximate membership of features. AMQ can address the performance bottleneck of search-based methods, given its lower complexity and better compatibility with single-instruction multiple-data parallelism than ANNS. Experimental results on MVTec-AD show that the accuracy of AMQ-based method is just decreased about 1% in comparison with ANNS-based methods, while the inference latency, the throughput and the memory footprint are significantly improved, close to the efficiency of end-to-end deep learning anomaly detection models.
- Anomaly Detection /
- Unsupervised Learning /
- Approximate Membership Query /
- Bloom Filter /
- Locality Sensitive Hashing

图 1 基于特征库检索的图像异常检测流程图

下载: 全尺寸图片幻灯片

图 2 基于特征近似存在性查询的图像异常检测流程图

下载: 全尺寸图片幻灯片

图 3 样本及其特征分布

下载: 全尺寸图片幻灯片

图 4 部分样本及其异常分数

下载: 全尺寸图片幻灯片

图 5 PatchCore与本文方法各步骤计算时延占比对比

下载: 全尺寸图片幻灯片

图 6 PatchCore与本文方法各步骤显存消耗占比对比

下载: 全尺寸图片幻灯片

图 7 不同局部敏感哈希组数G与布隆过滤器空间M设置对准确率（Image/Pixel AUROC）与时延的影响

下载: 全尺寸图片幻灯片

表 1 本文方法与其他对比方法在MVTec-AD数据集的准确率与性能

方法	Image AUROC	Pixel AUROC	时延/ms	吞吐量/FPS	显存峰值/GB	内存峰值/GB
CFA[13]	66.57%	89.83%	14.9	215	2.204	4.747
CFlow[7]	83.25%	93.22%	112.9	44	2.814	4.586
Efficient-AD[4]	54.68%	82.59%	8.4	325	2.146	4.616
PatchCore+HNSW[11]	89.82%	96.76%	176.9	12	18.606	20.135
PatchCore+IVFPQ[11]	91.19%	96.68%	108.3	11	21.188	21.304
本文方法	90.50%	95.29%	22.6	190	6.942	5.668

下载: 导出CSV

[1]	吕承侃, 沈飞, 张正涛, 等. 图像异常检测研究现状综述[J]. 自动化学报, 2022, 48(6): 1402-1428. LV C K, SHEN F, ZHANG Z T, et al. Review of image anomaly detection[J]. Acta Automatica Sinica, 2022, 48(6): 1402-1428.
[2]	AKCAY S, ATAPOUR-ABARGHOUEI A, BRECKON T P. GANomaly: semi-supervised anomaly detection via adversarial training[C]//JAWAHAR C, LI H, MORI G, et al. Asian Conference on Computer Vision. Cham: Springer, 2019: 622-637.
[3]	DENG H Q, LI X Y. Anomaly detection via reverse distillation from one-class embedding[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2022: 9727-9736.
[4]	BATZNER K, HECKLER L, KÖNIG R. EfficientAD: Accurate visual anomaly detection at millisecond-level latencies[C]//Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision. New York: IEEE, 2024: 127-137.
[5]	张玥, 陈锡伟, 陈梦丹, 等. 基于对比学习生成对抗网络的无监督工业品表面异常检测[J]. 电子测量与仪器学报, 2023, 37(10): 193-201. ZHANG Y, CHEN X W, CHEN M D, et al. Unsupervised surface anomaly detection of industrial products based on contrastive learning generative adversarial network[J]. Journal of Electronic Measurement and Instrumentation, 2023, 37(10): 193-201.
[6]	ADEY P, HAMILTON O, BORDEWICH M, et al. Region based anomaly detection with real-time training and analysis[C]//Proceedings of the 18th IEEE International Conference on Machine Learning and Applications. New York: IEEE, 2019: 495-499.
[7]	GUDOVSKIY D, ISHIZAKA S, KOZUKA K. CFLOW-AD: Real-time unsupervised anomaly detection with localization via conditional normalizing flows[C]//Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision. New York: IEEE, 2022: 1819-1828.
[8]	TAILANIAN M, PARDO Á, MUSÉ P. U-flow: A U-shaped normalizing flow for anomaly detection with unsupervised threshold[EB/OL]. [2024-01-08]. http://arxiv.org/abs/2211.12353.
[9]	张兰尧, 陈晓玲, 张达敏, 等. ValidFlow: 基于标准化流的无监督图像缺陷检测[J]. 数据采集与处理, 2023, 38(6): 1445-1457. ZHANG L Y, CHEN X L, ZHANG D M, et al. ValidFlow: Unsupervised image defect detection based on normalizing flows[J]. Journal of Data Acquisition and Processing, 2023, 38(6): 1445-1457.
[10]	DEFARD T, SETKOV A, LOESCH A, et al. PaDiM: A patch distribution modeling framework for anomaly detection and localization[C]//International Conference on Pattern Recognition. Cham: Springer, 2021: 475-489.
[11]	ROTH K, PEMULA L, ZEPEDA J, et al. Towards total recall in industrial anomaly detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2022: 14298-14308.
[12]	BERGMANN P, BATZNER K, FAUSER M, et al. The MVTec anomaly detection dataset: A comprehensive real-world dataset for unsupervised anomaly detection[J]. International Journal of Computer Vision, 2021, 129(4): 1038-1059. doi: 10.1007/s11263-020-01400-4
[13]	LEE S, LEE S, SONG B C. CFA: Coupled-hypersphere-based feature adaptation for target-oriented anomaly localization[J]. IEEE Access, 2022, 10: 78446-78454. doi: 10.1109/ACCESS.2022.3193699
[14]	CUI Y J, LIU Z X, LIAN S G. A survey on unsupervised anomaly detection algorithms for industrial images[J]. IEEE Access, 2023, 11: 55297-55315. doi: 10.1109/ACCESS.2023.3282993
[15]	MALKOV Y A, YASHUNIN D A. Efficient and robust approximate nearest neighbor search using hierarchical navigable small world graphs[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(4): 824-836. doi: 10.1109/TPAMI.2018.2889473
[16]	BARANCHUK D, BABENKO A, MALKOV Y. Revisiting the inverted indices for billion-scale approximate nearest neighbors[C]//European Conference on Computer Vision. Cham: Springer, 2018: 209-224.
[17]	CHARIKAR M S. Similarity estimation techniques from rounding algorithms[C]//Proceedings of the thiry-fourth annual ACM symposium on Theory of computing. New York: ACM, 2002: 380–388.
[18]	BLOOM B H. Space/time trade-offs in hash coding with allowable errors[J]. Communications of the ACM, 1970, 13(7): 422-426. doi: 10.1145/362686.362692
[19]	DAHLGAARD S, KNUDSEN M B T, THORUP M. Practical hash functions for similarity estimation and dimensionality reduction[C]//Proceedings of the Proceedings of the 31st International Conference on Neural Information Processing Systems. New York: ACM, 2017: 6618–6628.
[20]	JOHNSON J, DOUZE M, JÉGOU H. Billion-scale similarity search with GPUs[J]. IEEE Transactions on Big Data, 2021, 7(3): 535-547. doi: 10.1109/TBDATA.2019.2921572

[1]	王军. 基于多尺度特征预测的异常事件检测 . 电子科技大学学报, doi: 10.12178/1001-0548.2021333
[2]	邹宜金, 连应华, 黄新宇, 刘培, 王颖蕊. 基于声纹的高泛化性风机叶片异常检测方法研究 . 电子科技大学学报, doi: 10.12178/1001-0548.2021080
[3]	陈俊周, 王娟, 龚勋. 基于级联生成对抗网络的人脸图像修复 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2019.06.016
[4]	李厚彪, 樊庆宇, 耿广磊. 基于自适应同时稀疏表示的鲁棒性目标追踪 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2018.01.001
[5]	李玮, 张大方, 徐冰. 面向NDN中名字查找的哈希布鲁姆过滤器 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2017.05.016
[6]	吴亚东, 蒋宏宇, 赵思蕊, 李波. 网络安全数据3D可视化方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2015.04.020
[7]	贾真, 杨燕, 何大可. 基于弱监督学习的中文百科数据属性抽取 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2014.05.022
[8]	王江峰, 张茂军, 包卫东, 熊智辉, 张铁林. 使用轨迹片段分析的监控场景模型建立方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2012.04.012
[9]	阳小龙, 张敏, 胡武生, 徐杰, 隆克平. 基于尖点突变模型的IP网络异常行为检测方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2011.06.017
[10]	张雪芹, 顾春华, 吴吉义. 异常检测中支持向量机最优模型选择方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2011.04.017
[11]	王敏琴, 韩国强, 涂泳秋. 新型的无监督纹理分割方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2010.01.003
[12]	杨宏宇, 朱丹, 谢丰, 谢丽霞. 入侵异常检测研究综述 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2009.05.014
[13]	杨丹, 胡光岷, 李宗林, 姚兴苗. 全局的多流量相关异常检测算法 . 电子科技大学学报,
[14]	曾金全, 赵辉, 刘才铭, 彭凌西. 受免疫原理启发的Web攻击检测方法 . 电子科技大学学报,
[15]	匡胤, 黄迪明. 基于抗体网络的邮件过滤器设计 . 电子科技大学学报,
[16]	鲁珂, 赵继东, 叶娅兰, 曾家智. 一种用于图像检索的新型半监督学习算法 . 电子科技大学学报,
[17]	王波, 黄迪明. 遗传神经网络在邮件过滤器中的应用 . 电子科技大学学报,
[18]	张衡, 张毓森. 一种基于LSM的数据源在异常检测中的应用 . 电子科技大学学报,
[19]	傅彦, 周俊临. 基于无监督学习的盲信号源分离技术研究 . 电子科技大学学报,
[20]	程郁凡, 韩玮, 李少谦. 基于FFT的快速跳频同步信号存在性检测 . 电子科技大学学报,

点击查看大图

图(7) / 表(1)

计量

文章访问数: 327
HTML全文浏览量: 102
PDF下载量: 2
被引次数: 0

全文HTML

无监督图像异常检测（Unsupervised Image Anomaly Detection）任务在仅有正常图像训练样本的条件下，训练模型从可能含有异常区域的图像中识别异常区域位置（通常以图像语义分割的形式输出）。无监督图像异常检测在工业缺陷检测、安防监控、卫星遥感、军事侦察、医学图像分析等领域具有广泛的应用场景^[1]。特别是在工业制造领域的产品表面缺陷检测任务中，产品缺陷类型种类繁多、形态尺度多变、标注成本高，给有监督模型训练带来了困难。因此经常依赖于无监督图像异常检测技术，仅使用无缺陷的样本进行训练，识别任何未知的缺陷。

目前，基于深度学习的无监督图像异常检测领域，主要有基于重建（Reconstruction）的方法、基于概率密度估计（Probability Density Estimation）的方法和基于特征库检索（Memory Bank Retrieval）的方法等。

基于重建的研究思路以生成对抗网络（Generative Adversarial Network, GAN）、变分自编码（Variational Auto-Encoder, VAE）网络等图像生成模型或知识蒸馏架构的教师-学生模型为基础，用正常图像数据训练模型进行图像压缩重建或表征学习训练。推理时异常的图像特征没有参与过训练、难以被模型准确地编码-解码，因此重构误差较高的区域可被判定为异常。代表性的方法有文献[2]提出的基于GAN提出的重构异常检测模型和文献[3]提出的基于蒸馏的单分类方法等。文献[4]提出的Efficient-AD模型，结合了蒸馏和生成模型两种思路并使用轻量级主干网络，取得了毫秒级的时延。文献[5]提出了一种使用对比学习训练GAN模型的方法进行基于重建的异常检测，获得了较高的准确率。

基于概率密度估计的研究思路源于近年来标准化流（Normalizing Flow）模型的快速发展。虽然异常检测问题很容易抽象为概率密度估计问题（低概率密度样本可认为是异常），但传统的参数概率模型、核密度估计等方法难以适应高维、复杂的图像特征分布。如文献[6]提出的基于区域的核密度估计方法主要适用于较小的数据集和较低的维度。标准化流模型则为图像特征提供了一种高效的概率建模方式。文献[7]提出的CFlow模型，利用条件标准化流（Conditional Normalizing Flow）对不同场景下的概率密度建模并检测异常。文献[8]结合U-Net的模型结构特点和标准化流模型，提出了U-Flow模型用多层次的检测结果增强鲁棒性。文献[9]在标准化流基础上改进了更高效的模型结构，提升了推理速度。

基于特征库检索的方法沿袭了基于K近邻的机器学习异常检测思路，用深度学习模型从图像中提取不同尺度的图像特征并加入近似最近邻搜索（Approximate Nearest Neighbour Search, ANNS）索引结构；推理时，提取测试图像的深度特征为查询向量搜索K近邻，并使用K近邻的距离计算异常得分，距离越远、异常得分越高。文献[10]提出以马氏距离（Mahalanobis Distance）计算测试样本与正常样本的深度特征距离，但其距离计算复杂度限制了可扩展性。文献[11]提出的PatchCore模型，通过Core Set采样和ANNS索引结构大幅度减少了计算量，在文献[12]等数据集上取得了领先的准确率。文献[13]对特征库采样与检索结构进行了改进，在保持准确率的同时提高了检索效率。

文献[14]的实验结果显示，相比于另两种研究思路，基于特征库检索的方法在各类图像异常检测数据集上能更稳定地取得较高的准确率，对复杂分布的适应性更强。然而，特征库检索的计算量较大、内存开销较高。相比于端到端的生成模型和标准化流模型，更难以部署到要求高吞吐量、低时延的应用场景。

基于特征库搜索的基本思路如图1所示。此类方法使用卷积神经网络从正常样本图像中提取各个区域的深度特征向量，然后存储进层次导航小世界图（Hierarchical Navigable Small World, HNSW）^[15]、乘积量化倒排索引（Inverted File Product Quantization, IVFPQ）^[16]等ANNS索引结构。在推理时，使用ANNS索引搜索测试图像深度特征的K近邻，并以K个最近邻的正常特征的距离计算测试集样本的异常分数。通常距离越远，则异常分数越高。

该技术路径的主要计算性能瓶颈在于K近邻搜索。目前最高效的几类ANNS索引结构的搜索操作时间复杂度为对数级，在正常样本训练集非常大时，搜索操作时延较长。此外，基于K-D树或近邻图的索引结构难以利用GPU的高并行度优势，在高吞吐量的应用场景中存在性能劣势，搜索速度远低于特征提取速度。

实际上，推理流程中异常检测模型并不需要知道K近邻具体来自于哪些样本，而只需要知道K近邻与查询向量的距离。换言之，如果能低代价地估计查询向量在特征空间中近邻区域是否存在近似向量，并以此替代ANNS，就能解决此类方法的性能瓶颈。因此，本文所提出方法的核心思路是将计算量较大的深度特征近似K近邻搜索替换为近似存在性查询（Approximate Membership Query, AMQ），从而减少计算复杂度、提高模型推理速度。

图 1 基于特征库检索的图像异常检测流程图

3. 结束语

本文提出了一种基于近似存在性查询的图像异常检测无监督方法，用局部敏感哈希与布隆过滤器对近邻样本存在性进行估计并计算异常分数，替代现有的基于特征库检索的方法中计算量较大的近似最近邻搜索。实验结果显示，本文方法能在基本保持准确率的同时，显著提升算法运行速度与吞吐量，适宜于要求低时延、高并发的无监督图像异常检测应用场景。

参考文献 (20)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于近似存在性查询的高效图像异常检测方法

doi: 10.12178/1001-0548.2024032

作者简介:
伍凌川（1978— ），男，正高级工程师，主要从事弹药装药装配工艺技术、智能制造技术研究

通讯作者: 石义官，E-mail：shiyg888@163.com

An Efficient Image Anomaly Detection Approach Based on Approximate Membership Query

计量

基于近似存在性查询的高效图像异常检测方法

doi: 10.12178/1001-0548.2024032

1. 中国兵器装备集团自动化研究所有限公司，绵阳 621000

2. 北京理工大学机械与车辆学院，北京 100081

作者简介:
伍凌川（1978— ），男，正高级工程师，主要从事弹药装药装配工艺技术、智能制造技术研究

通讯作者: 石义官，E-mail：shiyg888@163.com

English Abstract

An Efficient Image Anomaly Detection Approach Based on Approximate Membership Query

1. Automation Research Institute Co., Ltd. of China South Industries Group Corporation, MianYang 621000, China

2. School of mechanical engineering, Beijing Institute of Technology, Beijing 100081, China

全文HTML

1.1. 图像深度特征提取

1.2. 局部敏感哈希

1.3. 布隆过滤器与异常分数计算

2.1. 实验设置

2.2. 准确率与效率对比实验

2.3. 效率分析

2.4. 超参分析

目录

期刊在线

编辑办公

友情链接

留言板

基于近似存在性查询的高效图像异常检测方法

doi: 10.12178/1001-0548.2024032

作者简介: 伍凌川（1978— ），男，正高级工程师，主要从事弹药装药装配工艺技术、智能制造技术研究

通讯作者: 石义官，E-mail：shiyg888@163.com

An Efficient Image Anomaly Detection Approach Based on Approximate Membership Query

计量

出版历程

基于近似存在性查询的高效图像异常检测方法

doi: 10.12178/1001-0548.2024032

1. 中国兵器装备集团自动化研究所有限公司，绵阳 621000 2. 北京理工大学 机械与车辆学院，北京 100081

作者简介: 伍凌川（1978— ），男，正高级工程师，主要从事弹药装药装配工艺技术、智能制造技术研究

通讯作者: 石义官，E-mail：shiyg888@163.com

English Abstract

An Efficient Image Anomaly Detection Approach Based on Approximate Membership Query

1. Automation Research Institute Co., Ltd. of China South Industries Group Corporation, MianYang 621000, China 2. School of mechanical engineering, Beijing Institute of Technology, Beijing 100081, China

全文HTML

1.1. 图像深度特征提取

1.2. 局部敏感哈希

1.3. 布隆过滤器与异常分数计算

2.1. 实验设置

2.2. 准确率与效率对比实验

2.3. 效率分析

2.4. 超参分析

目录

期刊在线

编辑办公

友情链接

作者简介:
伍凌川（1978— ），男，正高级工程师，主要从事弹药装药装配工艺技术、智能制造技术研究

1. 中国兵器装备集团自动化研究所有限公司，绵阳 621000

2. 北京理工大学机械与车辆学院，北京 100081

作者简介:
伍凌川（1978— ），男，正高级工程师，主要从事弹药装药装配工艺技术、智能制造技术研究

1. Automation Research Institute Co., Ltd. of China South Industries Group Corporation, MianYang 621000, China

2. School of mechanical engineering, Beijing Institute of Technology, Beijing 100081, China