留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于双判别器的GANomaly异常检测方法研究

刘韵婷 谭明晓 高宇 戴佳霖

刘韵婷, 谭明晓, 高宇, 戴佳霖. 基于双判别器的GANomaly异常检测方法研究[J]. 电子科技大学学报. doi: 10.12178/1001-0548.2023157
引用本文: 刘韵婷, 谭明晓, 高宇, 戴佳霖. 基于双判别器的GANomaly异常检测方法研究[J]. 电子科技大学学报. doi: 10.12178/1001-0548.2023157
LIU Yunting, TAN Mingxiao, GAO Yu, DAI Jialin. Research on GANoamly Anomaly Detection Method Based on Double Discriminant[J]. Journal of University of Electronic Science and Technology of China. doi: 10.12178/1001-0548.2023157
Citation: LIU Yunting, TAN Mingxiao, GAO Yu, DAI Jialin. Research on GANoamly Anomaly Detection Method Based on Double Discriminant[J]. Journal of University of Electronic Science and Technology of China. doi: 10.12178/1001-0548.2023157

基于双判别器的GANomaly异常检测方法研究

doi: 10.12178/1001-0548.2023157
基金项目: 辽宁省教育厅面上项目(LJKMZ2022061);辽宁省自然科学基金项目(2022-KF-14-022)
详细信息
    作者简介:

    刘韵婷,博士,副教授,主要从事深度学习、数据分析及无线传感器网络等方向的研究

    通讯作者: 71019976@qq.com
  • 中图分类号: TP391

Research on GANoamly Anomaly Detection Method Based on Double Discriminant

  • 摘要: 在异常检测领域中,生成对抗网络(Generative Adversarial Nets, GAN)和自编码器(Autoencoder, AE)近年来取得了较好的应用效果。然而,现有的基于GAN的异常检测模型普遍存在重构能力差的问题。针对于此,该文提出一种双判别器的GANomaly网络模型,其中,全局判别器用于提高图像的重构能力,局部判别器用于提高在空间层次的编码能力。分别在MvTec数据集和自制轮胎X光图像数据集上对文中所提方法进行验证,实验结果表明,该方法能够有效提升模型的重构能力,降低异常分数阈值,提高异常检测的准确率。
  • 图  1  DDGANomaly结构图

    图  2  网格数据集

    图  3  轮胎X光图像训练集正常轮胎样本

    图  4  轮胎X光图像测试集缺陷样本

    图  5  轮胎X光图像缺陷检测ROC曲线图对比图

    图  6  编码损失函数曲线图

    图  7  重构误差损失函数曲线图

    表  1  MvTec数据集AUC值实验结果比对表

    种类AutoencoderAnoGANf-AnoGANGANomalyDDGANomaly
    bottle0.4570.4910.4820.6350.711
    Cable0.5080.5260.6140.6480.649
    capsule0.5890.4120.5340.5050.548
    carpet0.7210.4720.5320.4370.533
    grid0.7180.6100.8000.8560.891
    hazelnut0.8140.6490.6220.8230.833
    leather0.8990.3420.770.5790.545
    metal_nut0.5320.3820.3960.4660.520
    pill0.3480.4160.3560.4580.564
    screw0.3280.7210.8790.9980.997
    tile0.5060.6670.7230.4570.534
    toothbrush0.4860.5390.4970.7980.864
    transistor0.6860.5610.5120.7920.823
    wood0.5150.5780.9010.8210.847
    zipper0.3460.4370.3780.6420.664
    均值0.5600.5200.5990.6610.710
    下载: 导出CSV

    表  2  轮胎X光图像AUC值实验结果对比

    模型 AUC 准确率
    Autoencoder 0.597 0.602
    AnoGAN 0.710 0.669
    f-AnoGAN 0.604 0.624
    GANomaly 0.855 0.829
    DDGANomaly 0.906 0.888
    下载: 导出CSV

    表  3  消融实验数据表

    模型AUC准确率
    GANomaly0.8550.829
    GANomaly+D0.8950.882
    GANomaly+D+w0.9060.888
    下载: 导出CSV
  • [1] 王军. 基于多尺度特征预测的异常事件检测[J]. 电子科技大学学报, 2022, 51(4): 586-591. doi:  10.12178/1001-0548.2021333

    WANG J. Abnormal event detection based on multi-scale features prediction[J]. Journal of University of Electronic Science and Technology of China, 2022, 51(4): 586-591. doi:  10.12178/1001-0548.2021333
    [2] 钟增胜, 朱纯瑶, 杨逸飞, 等. 数字货币交易所洗钱行为检测[J]. 湖南大学学报(自然科学版), 2022, 49(10): 119-129.

    ZHONG Z S, ZHU C Y, YANG Y F, et al. Money laundering detection for cryptocurrency transactions[J]. Journal of Hunan University (Natural Sciences), 2022, 49(10): 119-129.
    [3] JENNY D, DMITRIY Y, DMITRIY B, et al. Detection and analysis of atypical stock transactions with possible misuse of insider information and market manipulation: methods and models[J]. Procedia Computer Science, 2022, 213: 165-174. doi:  10.1016/j.procs.2022.11.052
    [4] SHEERAZ A, ALI K Z, MUHAMMAD M S, et al. Effective and efficient DDoS attack detection using deep learning algorithm, multi-layer perceptron[J]. Future Internet, 2023, 15(2): 76. doi:  10.3390/fi15020076
    [5] ACKLYN M, RAWAT DANDA B. Towards botnet hazard analysis with generative adversarial networks for threat detection[J]. Artificial Intelligence and Machine Learning for Multi-Domain Operations Applications III. SPIE, 2021, 11746: 201-212.
    [6] QIN C, WU R, HUANG G, et al. A novel LSTM-autoencoder and enhanced transformer-based detection method for shield machine cutterhead clogging[J]. Science China Technological Sciences, 2023, 66(2): 512-527. doi:  10.1007/s11431-022-2218-9
    [7] MIKOŁAJ O, JUYOUL K. Detection of numerical power shift anomalies in burnup modeling of a PWR reactor[J]. Sustainability, 2023, 15(4): 3373. doi:  10.3390/su15043373
    [8] EZZAT D, HASSANIEN A E, DARWISH A, et al. Multi-objective hybrid artificial intelligence approach for fault diagnosis of aerospace systems[J]. IEEE Access, 2021, 9: 41717-41730. doi:  10.1109/ACCESS.2021.3064976
    [9] NAWAZ M, NAZIR T, BAILI J, et al. CXray-EffDet: Chest disease detection and classification from X-ray Images using the EfficientDet Model[J]. Diagnostics, 2023, 13(2): 248. doi:  10.3390/diagnostics13020248
    [10] WEKKING D, PORCU M, DE SILVA P, et al. Breast MRI: Clinical indications, recommendations, and future applications in breast cancer diagnosis[J]. Current Oncology Reports, 2023, 25(4): 257-267. doi:  10.1007/s11912-023-01372-x
    [11] 冯安然, 王旭仁, 汪秋云, 等. 基于PCA和随机树的数据库异常访问检测[J]. 计算机科学, 2020, 47(9): 94-98. doi:  10.11896/jsjkx.190800056

    FENG A R, WANG X R, WANG Q Y, et al. Database anomaly access detection based on principal component analysis and random tree[J]. Computer Science, 2020, 47(9): 94-98. doi:  10.11896/jsjkx.190800056
    [12] 陈彬杰, 魏福山, 顾纯祥. 基于KNN的具有隐私保护功能的区块链异常交易检测[J]. 信息网络安全, 2022, 22(3): 78-84. doi:  10.3969/j.issn.1671-1122.2022.03.009

    CHEN B J, WEI F S, GU C X. Blockchain abnormal transaction detection with privacy-preserving based on KNN[J]. Netinfo Security, 2022, 22(3): 78-84. doi:  10.3969/j.issn.1671-1122.2022.03.009
    [13] ZHOU L C, LU T, HU X B. Detecting web application injection attacks using one-class SVM[C]//Proceedings of the IEEE 5th International Conference on Computer and Communication Engineering Technology. New York: IEEE, 2022: 275-279.
    [14] JAVAID A, NIYAZ Q, SUN W Q, et al. A deep learning approach for network intrusion detection system[C]//Proceedings of the 9th EAI International Conference on Bio-inspired Information and Communications Technologies (formerly BIONETICS). New York: ACM, 2016: 21-26.
    [15] TAN Q M, SUN Y K, XIN P F, et al. An approach on visual detecting multi-targets in the unstructured and complex scenes based on RGB-D images[C]//Proceedings of the 5th International Conference on Automation, Control and Robotics Engineering. New York: IEEE, 2020: 591-596.
    [16] GOODFELLOW I J, POUGET-ABADIE J, MIRZA M, et al. Generative adversarial networks[EB/OL]. [2023-09-21]. http://arxiv.org/abs/1406.2661v1.
    [17] SCHLEGL T, SEEBÖCK P, WALDSTEIN S M, et al. Unsupervised anomaly detection with generative adversarial networks to guide marker discovery[EB/OL]. [2023-09-21]. http://arxiv.org/abs/1703.05921v1
    [18] WANG C, ZHANG Y M, LIU C L. Anomaly detection via minimum likelihood generative adversarial networks[C]//Proceedings of the 24th International Conference on Pattern Recognition. New York: IEEE, 2018: 1121-1126.
    [19] AKÇAY S, ATAPOUR-ABARGHOUEI A, BRECKON T. GANomaly: Semi-supervised anomaly detection via adversarial training[C]// JAWAHAR C, LI H, MORI G, et al. Lecture Notes in Computer Science. Switzerland: Springer, Cham, 2018: 622-637.
    [20] AKÇAY S, ATAPOUR-ABARGHOUEI A, BRECKON T P. Skip-GANomaly: Skip connected and adversarially trained encoder-decoder anomaly detection[C]//Proceedings of the International Joint Conference on Neural Networks. New York: IEEE, 2019: 1-8.
    [21] KAPLAN M O, ALPTEKIN S E. An improved BiGAN based approach for anomaly detection[J]. Procedia Computer Science, 2020, 176: 185-194. doi:  10.1016/j.procs.2020.08.020
    [22] RADFORD A, METZ L, CHINTALA S. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks[EB/OL]. [2023-09-21]. https://arxiv.org/abs/1511.06434.
    [23] MAKHZANI A, SHLENS J, JAITLY N, et al. Adversarial autoencoders[J]. CoRR, 2015, abs/1511.05644.
    [24] VU H S, UETA D, HASHIMOTO K, et al. Anomaly detection with adversarial dual autoencoders[EB/OL]. [2023-09-21]. http://arxiv.org/abs/1902.06924v1.
    [25] 王齐, 陈功, 胡文昕, 等. 使用GANomaly网络的面瘫识别应用研究[J]. 软件工程, 2022, 25(3): 29-33.

    WANG Q, CHEN G, HU W X, et al. Application research of facial paralysis recognition based on GANomaly network[J]. Software Engineering, 2022, 25(3): 29-33.
    [26] ARJOVSKY M, CHINTALA S, BOTTOU L. Wasserstein generative adversarial networks[C]//Proceedings of the 34th International Conference on Machine Learning. New York: ACM, 2017: 214-223.
    [27] NGUYEN T D, LE T, VU H, et al. Dual discriminator generative adversarial nets[EB/OL]. [2023-09-21]. http://arxiv.org/abs/1709.03831v1.
    [28] BERGMANN P, FAUSER M, SATTLEGGER D, et al. MVTec AD—A comprehensive real-world dataset for unsupervised anomaly detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2019: 9584-9592.
  • [1] 伍凌川, 史慧芳, 邱枫, 石义官.  基于近似存在性查询的高效图像异常检测方法 . 电子科技大学学报, doi: 10.12178/1001-0548.2024032
    [2] 王永, 王淞立, 邓江洲.  基于生成对抗网络的评分可信推荐模型 . 电子科技大学学报, doi: 10.12178/1001-0548.2023116
    [3] 章坚武, 戚可寒, 章谦骅, 孙玲芬.  车辆边缘计算中基于深度学习的任务判别卸载 . 电子科技大学学报, doi: 10.12178/1001-0548.2022376
    [4] 郭峰, 陈中舒, 代久双, 吴云峰, 刘军, 张昌华.  基于动态先验特征的包覆药多类型外观缺陷深度检测框架 . 电子科技大学学报, doi: 10.12178/1001-0548.2022326
    [5] 郭磊, 林啸宇, 王勇, 陈正武, 常伟.  基于深度学习的直升机旋翼声信号检测与识别一体化算法 . 电子科技大学学报, doi: 10.12178/1001-0548.2023108
    [6] 陈丽, 许思扬, 刘芳, 冯奇, 刘承享, 徐福琛, 田淼, 刘光辉.  基于生成对抗网络的OFDM信号生成 . 电子科技大学学报, doi: 10.12178/1001-0548.2022253
    [7] 周丰丰, 孙燕杰, 范雨思.  基于miRNA组学的数据增强算法 . 电子科技大学学报, doi: 10.12178/1001-0548.2023002
    [8] 吴子锐, 杨之蒙, 蒲晓蓉, 徐杰, 曹晟, 任亚洲.  面向特征生成的无监督域适应算法 . 电子科技大学学报, doi: 10.12178/1001-0548.2021314
    [9] 邹宜金, 连应华, 黄新宇, 刘培, 王颖蕊.  基于声纹的高泛化性风机叶片异常检测方法研究 . 电子科技大学学报, doi: 10.12178/1001-0548.2021080
    [10] 李响, 严毅, 刘明辉, 刘明.  基于多条件对抗和梯度优化的生成对抗网络 . 电子科技大学学报, doi: 10.12178/1001-0548.2020415
    [11] 杨旺功, 淮永建, 张福泉.  基于Gabor及深度神经网络的葡萄种子分类 . 电子科技大学学报, doi: 10.12178/1001-0548.2019164
    [12] 何磊, 李玉霞, 彭博, 吴焕萍.  基于生成对抗网络的无人机图像道路提取 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2019.04.016
    [13] 陈俊周, 王娟, 龚勋.  基于级联生成对抗网络的人脸图像修复 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2019.06.016
    [14] 陈俊周, 汪子杰, 陈洪瀚, 左林翼.  基于级联卷积神经网络的视频动态烟雾检测 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2016.06.020
    [15] 陈姝, 梁文章.  结合特征点匹配及深度网络检测的运动跟踪 . 电子科技大学学报,
    [16] 吴亚东, 蒋宏宇, 赵思蕊, 李波.  网络安全数据3D可视化方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2015.04.020
    [17] 张雪芹, 顾春华, 吴吉义.  异常检测中支持向量机最优模型选择方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2011.04.017
    [18] 阳小龙, 张敏, 胡武生, 徐杰, 隆克平.  基于尖点突变模型的IP网络异常行为检测方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2011.06.017
    [19] 杨宏宇, 朱丹, 谢丰, 谢丽霞.  入侵异常检测研究综述 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2009.05.014
    [20] 张衡, 张毓森.  一种基于LSM的数据源在异常检测中的应用 . 电子科技大学学报,
  • 加载中
图(7) / 表(3)
计量
  • 文章访问数:  86
  • HTML全文浏览量:  39
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-06-06
  • 修回日期:  2023-09-22

基于双判别器的GANomaly异常检测方法研究

doi: 10.12178/1001-0548.2023157
    基金项目:  辽宁省教育厅面上项目(LJKMZ2022061);辽宁省自然科学基金项目(2022-KF-14-022)
    作者简介:

    刘韵婷,博士,副教授,主要从事深度学习、数据分析及无线传感器网络等方向的研究

    通讯作者: 71019976@qq.com
  • 中图分类号: TP391

摘要: 在异常检测领域中,生成对抗网络(Generative Adversarial Nets, GAN)和自编码器(Autoencoder, AE)近年来取得了较好的应用效果。然而,现有的基于GAN的异常检测模型普遍存在重构能力差的问题。针对于此,该文提出一种双判别器的GANomaly网络模型,其中,全局判别器用于提高图像的重构能力,局部判别器用于提高在空间层次的编码能力。分别在MvTec数据集和自制轮胎X光图像数据集上对文中所提方法进行验证,实验结果表明,该方法能够有效提升模型的重构能力,降低异常分数阈值,提高异常检测的准确率。

English Abstract

刘韵婷, 谭明晓, 高宇, 戴佳霖. 基于双判别器的GANomaly异常检测方法研究[J]. 电子科技大学学报. doi: 10.12178/1001-0548.2023157
引用本文: 刘韵婷, 谭明晓, 高宇, 戴佳霖. 基于双判别器的GANomaly异常检测方法研究[J]. 电子科技大学学报. doi: 10.12178/1001-0548.2023157
LIU Yunting, TAN Mingxiao, GAO Yu, DAI Jialin. Research on GANoamly Anomaly Detection Method Based on Double Discriminant[J]. Journal of University of Electronic Science and Technology of China. doi: 10.12178/1001-0548.2023157
Citation: LIU Yunting, TAN Mingxiao, GAO Yu, DAI Jialin. Research on GANoamly Anomaly Detection Method Based on Double Discriminant[J]. Journal of University of Electronic Science and Technology of China. doi: 10.12178/1001-0548.2023157
  • 异常检测[1]原本是数据挖掘中的概念,旨在查找出与预期不相符的数据,通常这些数据被称为异常点,也称畸变、例外、离群点等。异常检测在各个领域上都有非常广泛的应用,例如金融领域[2-3]、网络安全[4-5]、工业检测[6-8]、医疗诊断[9-10]等。异常检测的经典传统算法有PCA[11]、KNN[12]等,在此基础上不断进行改进,将One-Class SVM[13]等单分类方法应用到异常检测,虽取得了一定的效果,但这些传统算法的可靠性和性能都有一定的缺陷。随着科技和计算机水平的不断进步,人工智能、计算机视觉等得到了极大的发展。深度学习在异常检测方面的应用已经成为目前研究的热点,根据相关的研究表明,基于深度学习的异常检测展现出来的效果已经超过了传统方法[14]。因此,基于深度学习的图像异常检测也越来越收到大家的关注,在一些复杂场景检测[15]体现了重要的作用。

    异常检测的难点之一在于数据的高度不平衡,通常情况下,正常样本数据的比例远高于异常样本数据的比例,这往往会导致实验结果不精确。利用无监督学习相关的异常检测模型是其中一种解决方法,其基本思想是,在训练阶段用正常的样本数据进行训练,在测试阶段不符合正常样本数据特征的就被判为异常。

    目前基于GAN[16]网络的异常检测方法已经取得了非常大的突破。文献[17]提出了AnoGAN模型,该方法在训练时只用正常样本,在测试的时候,由于GAN只学习了正常样本的数据分布,因此,重构图像在保留原有图像特征的基础上去除缺陷的部分,再利用重构图像与原图像的残差确定缺陷的位置。文献[18]利用生成对抗网络和最小似然正则化来实现领域异常检测,通过增加生成器生成的异常样本,来防止异常样本收敛到正常数据分布。杜伦大学提出的无需异常样本实现异常检测的GANomaly[19]模型,该模型通过编码器对输入的图像进行编码得到输入图像的低维向量,再通过解码器和编码器得到重构图像的潜在向量,二者的差值超出异常阈值分数则被判定为异常。但在实践的过程中发现GANomaly网络模型重构图像的能力存在不足。在此基础上进行改进的skip-GANomaly[20]模型,去掉了再编码的步骤,而代替的是在自编码器中加入了跳跃连接,将浅层的特征信息与深层的特征信息进行融合。改良后的skip-GANomaly模型在某些方面取得了很好的效果,但受目标特征的尺寸大小影响比较大。还有很多关于GAN的异常检测模型,如BiGAN[21]、深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks, DCGAN)[22]、自编码器对抗网络(Autoencoder adversarial network)[23] 、基于GAN的异常检测框架-对抗性双自动编码器[24]等,这些模型普遍存在重构图像能力不足的问题。

    本文针对GANomaly模型对图像重构能力不强和异常分数阈值不够小的问题。在GANomaly模型的基础上添加了一个局部判别器,当输入正常图像进行训练时,全局判别器使原图像和重构图像的重构误差尽可能的小,使模型具有更好的图像重构能力,局部判别器使得原图像经过编码器产生的低维向量和重构图像经过编码器产生的潜在向量误差尽可能的小,使模型的异常阈值分数尽可能的小,全局判别器和局部判别器同时进行对抗学习,使得该模型的架构更加的完善。最终通过MvTec数据集和自制的轮胎X光图像数据集的相关实验证明了该网络能有效提升异常检测精度。

    • GANomaly是基于GAN改进的模型。主要采用编码器-解码器-编码器结构,可以将输入的图像通过第一个编码器映射成一个低维向量,然后通过解码器将低维的向量重构成图像,最后再通过第二个编码器得到重构图像的潜在向量。通过模型的训练,可以进一步地缩小低维向量与潜在向量之间的差别,从而学习并得到输入图像的数据分布,判别器利用从该学习数据分布获取的较大的距离度量去推断该分布中存在的异常值[25]

      该网络一共由三部分组成,第一部分是自编码器,作为该网络的生成器。网络首先读取图像$ x $到编码器1($ {G_E}({\text{a}}) $),得到低维向量$ Z $,即$ Z = {G_E}(x) $,然后通过解码器得到重构图像$x'$,即$x' = {G_D}(Z)$。第二部分是再编码器,结构与编码器1一样,主要作用是得到重构图像$ x' $的潜在向量$ Z' $,即$ Z' = {G_E}(x') $。第三部分是判别器网络D,主要作用是区分自身输入的图像是来自真实图像$ x $还是重构的图像$ x' $

      测试时,用训练好的编码器−解码器−编码器的模型。由于训练时采用正常的图像,当输入异常图像时,整个结构会尽量重构成正常图像,使得第一个编码器产生的低维向量与再编码器产生的潜在向量的差距变大,超过一定的异常阈值分数就被判定为异常。

    • 为增强GANomaly模型的重构能力,降低异常阈值分数,提高检测的精度。本文在已有的GANomaly模型的基础上引入双对抗机制,即两个判别器具有不同的功能。局部判别器使输入图像经过自编码器中的编码器生成的低维向量与重构图像再压缩生成的潜在向量更加的接近,全局判别器可以进一步减小真实图像和重构图像的重构误差。相关实验证明,双对抗机制的引入,可以减小重构误差,降低异常阈值分数,有效提高模型异常检测的精度。

      双判别器GANomaly(Dual Discriminator GANomaly, DDGANomaly)的模型结构如图1所示。改进后的模型由原来的3个部分增加到4个部分,分别为自编码器、再编码器、全局判别器以及局部判别器。其中自编码器、再编码器、全局判别器3部分的模型结构与传统的GANonaly模型结构相同。增加的局部判别器在模型结构上与全局生成器相比去除了编码器。

      与基础GANomaly模型相同,DDGANomaly模型的优化目标是判别器和生成器相互对抗的问题,与基础GANomaly模型相比不同之处在于 DDGANomaly中存在两个对抗过程.

      图  1  DDGANomaly结构图

      1)自编码器和再编码器组成的全局生成器与全局判别器进行对抗,使输入的真实图像和重构图像之间的差值实现最小化。

      2)局部判别器与再编码器构成的生成器进行 对抗。使得自编码器中编码器产生的低维向量与再编码器产生的潜在向量的差值尽可能的小。

    • 1)全局生成器损失函数

      全局生成器的损失函数包括三个,分别为特征匹配性损失$ {L_{adv}} $,重构误差损失$ {L_{con}} $和编码损失$ {L_{enc}} $,判别器的损失函数就采用传统的生成对抗网络的交叉熵损失函数。

      2)特征匹配损失

      $ {L_{adv}} $表示特征匹配的误差,通过计算输入图像和重构图像特征表示L2距离,使得$ x $$ x' $更加的接近,让生成器生成的图像更加的逼真,同时进一步优化判别器:

      $$ {L_{adv}} = \left\| {f(x)} \right. - {\left. {f(G(x))} \right\|_2} $$ (1)

      3)重构误差损失

      $ {L_{con}} $表示重构误差损失,通过该函数不断减小重构图像与原图像的差异:

      $$ {L_{con}} = \left\| x \right. - {\left. {x'} \right\|_1} $$ (2)

      4)编码损失

      $ {L_{enc}} $表示输入图像的低维向量和重构图像的潜在向量的差异,即:

      $$ {L_{enc}} = \left\| Z \right. - {\left. {Z'} \right\|_2} $$ (3)

      5)其目标函数为:

      $$ L = {w_{adv}}{L_{adv}} + {w_{enc}}{L_{enc}} + {w_{con}}{L_{con}} $$ (4)

      其中,$ {w}_{adv}、{w}_{enc}、{w}_{con} $为加权参数

      6)全局判别器损失

      判别器损失采用的就是原始GAN的交叉熵损失函数,公式如下:

      $$ \begin{split} & \mathop {\min }\limits_G \mathop {\max }\limits_D F(D,G) = {F_{x \sim {P_{data(x)}}}}[\log D(x)] \\ &\qquad + {E_{z \sim {P_{Z(Z)}}}}[\log (1 - \log D(G(Z))] \end{split} $$ (5)

      7)异常阈值分数

      利用自编码器中编码器产生的低维向量与重构图像再压缩产生的潜在向量差作为异常阈值分数,其差值越小代表模型训练的效果越好。

      其异常分数定义如下:

      $$ A(a) = \left\| {{G_E}(a)} \right. - {\left. {E(G(a))} \right\|_1} $$ (6)

      由模型的训练得到一个异常阈值分数$ \varphi $,测试图像得到的异常分数$ A(a) > \varphi $,表示该图像为异常。

    • 局部判别器的目的主要是缩小输入图像经过自编码器中的编码器产生的低维向量和再编码器产生的重构图像的潜在向量的差异。局部判别器和局部生成器的目标损失函数采用Wasserstein[26]距离损失函数,避免出现模式崩溃[27]等问题。

      具体地进行4点改进。

      1)局部判别器最后一层去掉激活函数

      Wasserstein距离损失函数,对于局部判别器的输出要求是实际的输出值。基本的GAN模型中的判别器最后一层一般是sigmod激活函数。为得到局部判别器的实际输出值,去掉sigmod激活函数。

      2)使用基于动量的优化算法RMSProp

      采用Adam优化算法可能会引起训练的不稳定,因此采用RMSProp优化算法。

      3)控制参数的范围

      每次更新判别器的参数之后将其映射不超过一个固定常数$\omega $的范围之内。

      4)替换损失函数

      将真实图像与生成器图像输入到局部判别器中,用二者输出实际的差值代替BCELoss损失。对局部判别器优化,二者的差值越大越好。对于局部生成器的优化,局部判别器对局部生成器生成的图像产生的实际输出值越大越好。

      具体的公式如式(7)和式(8)所示:

      局部生成器损失函数:

      $$ \mathop {\min }\limits_G = - {F_{x \sim {P_{data(x)}}}}[{D_w}(x)] $$ (7)

      局部判别器损失函数:

      $$ L(D){\text{ = }} - {F_{x \sim {P_{data(x)}}}}[{D_w}(x)] + {{\text{E}}_{{\text{z}} \sim {P_{Z(Z)}}}}[{D_w}(x)] $$ (8)
    • DDGANomaly模型训练算法的细节如算法1所示,此算法共有3个训练过程,分别是全局生成器优化以及两组判别器的对抗过程。

      算法1 双判别器GANomaly的训练过程

      输入: 原始样本集$X = \left\{ {{x_1}} \right\}_{i = 1}^M$

      全局和局部判别器的训练次数为T

      repeat

      for i=1 to M do

       Xi←ith batchsize

       for T=1 to T do

       通过对抗性损失、编码器损失、上下文损失更新自编码器和编码器部分:

        $ L = {w_{adv}}{L_{adv}} + {w_{enc}}{L_{enc}} + {w_{con}}{L_{con}} $

      end for

       for T=1 to T do

       通过交叉熵损失更新全局判别器:

        $ \begin{gathered} \mathop {\min }\limits_G \mathop {\max }\limits_D F(D,G) = {F_{x \sim {P_{data(x)}}}}[\log D(x)] \\ + {E_{z \sim {P_{Z(Z)}}}}[\log (1 - \log D(G(Z))] \\ \end{gathered} $

       end for

      for T =1 to T do

       通过Wasserstein距离损失函数更新局部判别器:

       $ L(D) = - {F_{x \sim {P_{data(x)}}}}[{D_w}(x)] + {{\text{E}}_{{\text{z}} \sim {P_{Z(Z)}}}}[{D_w}(x)] $

       end for

      end for

      until达到纳什均衡

      训练完成后,全局判别器无法辨别输入是生成器生成的重构图像还是真实图像,局部判别器也无法分辨出输入是来自编码器中的编码器生成的低维向量还是重构图像经过再编码器生成的潜在向量。

      测试阶段利用训练好的自编码器和再编码器组成的测试结构对待检测的样本数据进行检测。在模型的训练阶段全部选取正常样本数据,因此训练好的模型对正常样本数据具有较强的重构能力,对异常样本数据重构能力较差。将待检测的样本数据输入到测试结构中,将编码损失与训练好的异常阈值分数进行比较,如式(6)所示,如果编码损失的值超过异常阈值分数就被判别为异常样本数据,否则被判别为正常样本数据。

    • 本文准备了两个数据集,分别是MvTec[28]数据集和自制的轮胎X光图像数据集。

      1)MvTec数据集

      MvTec数据集一共有15个不同种类的缺陷,其中用于训练与验证的图片共有3 629张,用于测试的有1 725张,用于训练的只有正常的图片。测试集中包含73种不同的缺陷,例如物体表面缺陷、结构缺陷或者由于缺少某些物体组成部件而表现出来的缺陷。

      所有图像的尺寸在700×700 ~ 1 024×1 024之间,其中网格、拉链、螺丝图像为灰度单通道图像。数据集为所有的缺陷区域都给出了像素级标注区域,共计涵盖了接近1 900个标注区域。以网格的部分图片为例如图2所示。

      图  2  网格数据集

      2)自制轮胎数据集

      1)训练数据集

      训练数据集由13 200张无缺陷的轮胎X光图像构成。具体选用子午线轮胎X光图像,并经过轮胎不同位置的X光图像对比,最后确定选用结构和背景相对简单的胎侧部分的X光图像,如图3所示。

      图  3  轮胎X光图像训练集正常轮胎样本

      2)测试数据集

      测试数据集由3部分构成:正常的轮胎X光图像、含有杂质的轮胎X光图像、含有气泡的轮胎X光图像,分别有500张图片,共计1,500张图片。如图4所示。

      图  4  轮胎X光图像测试集缺陷样本

    • 1)参数设置:

      Adam;lr=0.0001;b1=0.5;b2=0.999;隐变量维度Z=100;batchsize=132;epoch=100/50.

      2)实验平台配置:

      计算机的硬件配置为 Intelr-i5、Nvidia GTX1050GPU、12G 内存。编程环境采用windows操作系统,Python3.6及Pytorch深度神经网络开发工具。

    • 本次实验的模型性能的评价方法采用受试者工作特征(Re-ceiver Operating Characteristic, ROC)曲线。ROC曲线的横轴代表负阳率,表示实际全部是异常数据被错误的判别为正常的比例,纵轴代表正阳率,表示实际上全都是正常数据,被正确的判别为正常的比例。ROC的曲线越贴近坐标轴的左上角代表检测的效果越佳。ROC曲线与横轴围成的面积代表AUC的值,该值越大,同样代表检测的效果越优秀。单一的ROC曲线对于实验结果的言验证缺乏单一性,采用AUC可以更好实验的结果。以轮胎X光图像数据集为例,原GANomaly与改进后的模型DDGANomaly的AUC对比如图5所示。

      图  5  轮胎X光图像缺陷检测ROC曲线图对比图

    • 为了论证所提的方法在MvTec数据集上的有效性,选取先进的无监异常检测模型,进行对比实验,实验结果如表1所示。

      表1可以看出,改进后的模型DDGANomaly,对MvTec数据集的15种不同类型的缺陷其AUC的均值为0.71,相比于原GANomaly模型的AUC均值提升了0.049,增加局部判别器之后,DDGANomaly模型的重构能力更强,异常阈值分数降低,检测结果更加精确。并且相比于另外三种无监督异常检测模型Autocoder、AnoGAN和f-AnoGAN的AUC均值分别提升了0.150、0.190和0.111,这是由于Autocoder、AnoGAN、f-AnoGAN这3种异常检测模型都是基于图像的检测判别,而缺陷的种类丰富多样并且一些图片的背景非常复杂,在重构图像时会不准确,导致在异常检测的精确度不高。通过实验证明了该方法是有效的。不同模型,同一种类缺陷的AUC值进行对比,Autoencoder模型的capsule、carpt、leather、metal_nut的AUC值略高于改进后的模型;AnoGAN模型的leather和tile、f-AnoGAN模型的leather、tile、wood以及GANomaly模型的leather和screw的AUC值也都略高于改进后的模型DDGANomaly,这是由于,不同缺陷种类的图像背景复杂度不同,不同模型面对同一种缺陷类型的特征提取能力有差别,这导致个别模型对某一种缺陷类型的检测精度比较高。除此之外,不同模型对应的缺陷种类的AUC值都低于改进后的DDGANoamly模型。通过实验论证,改进后的模型DDGANomaly对于异常检测具有较强的普适性。

      表 1  MvTec数据集AUC值实验结果比对表

      种类AutoencoderAnoGANf-AnoGANGANomalyDDGANomaly
      bottle0.4570.4910.4820.6350.711
      Cable0.5080.5260.6140.6480.649
      capsule0.5890.4120.5340.5050.548
      carpet0.7210.4720.5320.4370.533
      grid0.7180.6100.8000.8560.891
      hazelnut0.8140.6490.6220.8230.833
      leather0.8990.3420.770.5790.545
      metal_nut0.5320.3820.3960.4660.520
      pill0.3480.4160.3560.4580.564
      screw0.3280.7210.8790.9980.997
      tile0.5060.6670.7230.4570.534
      toothbrush0.4860.5390.4970.7980.864
      transistor0.6860.5610.5120.7920.823
      wood0.5150.5780.9010.8210.847
      zipper0.3460.4370.3780.6420.664
      均值0.5600.5200.5990.6610.710
    • 1)训练损失

      原始GANomaly模型与改进后的模型DDGANomaly的编码损失函数和重构误差损失函数分别如图6图7所示。

      图  6  编码损失函数曲线图

      图  7  重构误差损失函数曲线图

      图6的编码器损失函数曲线可知, GANomaly模型的编码损失的收敛的值为0.0245,改进后的模型DDGANomaly收敛的值为0.0234,编码器的损失下降了0.0011,降低了异常分数阈值。同样由图7的训练的重构误差损失函数曲线图可知,GANomaly的重构误差损失的收敛值为0.0366,改进后的模型DDGANomaly的收敛值为0.0354,重构误差损失下降了0.0012,增强了模型的重构能力。

      2)检测结果

      同样所提的方法在自制的轮胎X光图像数据集上的对各类缺陷的识别结果,如表2所示。

      表 2  轮胎X光图像AUC值实验结果对比

      模型 AUC 准确率
      Autoencoder 0.597 0.602
      AnoGAN 0.710 0.669
      f-AnoGAN 0.604 0.624
      GANomaly 0.855 0.829
      DDGANomaly 0.906 0.888

      表2可以看出,在轮胎X光图像数据集上的检测效果与MvTec数据集上的检测效果一致,改进的模型DDGANomaly以0.906的AUC值领先其它无监督异常检测模型, 相比原GANomaly模型的AUC值提升了0.051,相比于Autoencoder模型的AUC值提升了0.309、AnoGAN模型的AUC值提升了0.196、f-AnoGAN模型的AUC值提升了0.302。

      其中,在MvTec数据集上表现比较好的两个无监督异常检模型Autocoder、f-AnoGAN,在自制的轮胎X光图像数据集上表现不如AnoGAN模型,这是由于轮胎X光图像的背景十分复杂,图像背景和缺陷区域很难分别, Autocoder、f-AnoGAN在模型结构上都存在编码器-解码器的结构,并且最后都是通过模型重构的生成图像与输入的原始图像进行比较,辨别是否存在异常,而这样的结构在重构一些较为复杂背景的图像时,重构能力较差,导致检测精度的下降。

      3)消融实验研究

      为验证本文所提出的在GANomaly模型中增加局部判别器和引入Wasserstein距离损失函数的有效性,进行消融实验,相同实验条件下,评估不同模块对本文模型性能的影响,消融实验选择GANomaly作为基准模型,在处理后的轮胎X光图像数据集上进行实验,相关的实验参数与上述一致,实验结果如表3所示。

      GANomaly+D表示在原有GANomaly基础上添加局部判别器,增加局部判别器之后,将自编码中的编码器生成的低维向量和再编码器生成的潜在向量输入到局部判别器中,二者经过不断地对抗,缩小低维向量和潜在向量的误差,减小编码损失,进而提高模型的重构能力,降低异常阈值分数,在检测结果上,检测的精度上升了4%,检测的精度提高的较为显著。GANomaly+D+w表示在原有的GANomaly模型的基础上添加局部判别器之后,再添加Wasserstein距离损失函数,Wasserstein距离损失函数的引入,避免在训练模型时出现梯度消失的情况,从而提高模型训练的稳定性,可以使训练出来的结果更加的精确,同样在检测结果上,检测的精度提升了1.1%,检测的精度略有提升。证明了对其改进是有效的。

      表 3  消融实验数据表

      模型AUC准确率
      GANomaly0.8550.829
      GANomaly+D0.8950.882
      GANomaly+D+w0.9060.888
    • 本文提出的DDGANomaly模型,在原始的GANomaly模型的基础上添加局部的判别器,形成双判别器机制,有效解决了由于自编码器的存在而导致模型图像重构能力差以及原始GANomaly模型中异常阈值分数过高的问题。通过相关的实验验证,改进后的模型DDGANomaly能够提升异常检测的准确率。

参考文献 (28)

目录

    /

    返回文章
    返回