留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于纹理和颜色感知距离的对抗样本生成算法

徐明 蒋奔驰

徐明, 蒋奔驰. 基于纹理和颜色感知距离的对抗样本生成算法[J]. 电子科技大学学报, 2021, 50(4): 558-564. doi: 10.12178/1001-0548.2021058
引用本文: 徐明, 蒋奔驰. 基于纹理和颜色感知距离的对抗样本生成算法[J]. 电子科技大学学报, 2021, 50(4): 558-564. doi: 10.12178/1001-0548.2021058
XU Ming, JIANG Ben-chi. Adversarial Examples Generation Method Based on Texture and Perceptual Color Distance[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(4): 558-564. doi: 10.12178/1001-0548.2021058
Citation: XU Ming, JIANG Ben-chi. Adversarial Examples Generation Method Based on Texture and Perceptual Color Distance[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(4): 558-564. doi: 10.12178/1001-0548.2021058

基于纹理和颜色感知距离的对抗样本生成算法

doi: 10.12178/1001-0548.2021058
基金项目: 国家自然科学基金(61702150,61803135)
详细信息
    作者简介:

    徐明(1970-),男,教授,博导,主要从事网络安全、数字取证及多媒体安全等方面的研究. E-mail:549614989@qq.com

  • 中图分类号: TP182

Adversarial Examples Generation Method Based on Texture and Perceptual Color Distance

  • 摘要: 理想的对抗样本不仅要成功欺骗机器学习分类器,同时还应不易被人类视觉感知到差异。传统的算法仅采用Lp范数衡量对抗样本扰动的大小,往往导致视距差异与感官不匹配等问题。该文提出了一种基于纹理和颜色感知距离的对抗样本生成算法(Aho-λ),其基本原理是尽可能地将扰动嵌入原始图像的高纹理区域,且基于颜色感知距离构建损失函数,从而降低原始图像和对抗样本之间的视距差异,最后利用自适应参数调节算法加快训练的收敛速度。在相近的Lp范数和可迁移性情形下,与DDN和C&W算法相比,该算法生成的对抗样本颜色感知距离更低,而且能以更少的迭代次数更快地生成对抗样本。
  • 图  1  无感对抗样本算法流程图

    图  2  Aho-λ不同修改比率得到的对抗样本效果

    图  3  5种算法生成的对抗样本

    图  4  不同置信度下3种扰动距离的大小

    图  5  不同JPEG质量因子下对抗样本的成功率

    图  6  Bit Depth压缩下对抗样本的成功率

    表  1  图像修改比率、攻击成功率及扰动距离对比

    修改比率/%成功率/%扰动距离
    ${\overline {{L_2}} }$${\overline {{L_\infty }} }$${\overline {{C_2}} }$
    1078.30.5125.90123.31
    2080.40.4824.73120.76
    3085.30.5220.23102.65
    4092.30.6919.6675.78
    5095.10.7419.4868.42
    6096.20.8218.6590.75
    701000.7916.7856.54
    801001.0317.0367.52
    901001.1117.2582.48
    1001001.3016.8985.60
    下载: 导出CSV

    表  2  对抗样本质量对比

    方法迭代次数成功率/%扰动距离
    ${\overline {{L_2}} }$${\overline {{L_\infty }} }$${\overline {{C_2}} }$
    I-FGSM100.02.511.59317.96
    C&W1000100.01.098.20132.86
    DDN100100.01.007.84136.11
    300100.00.887.58120.12
    1000100.00.827.62111.65
    PerC-AL100100.01.3011.9869.49
    300100.01.1713.9761.21
    1000100.01.1317.0457.10
    Aho-λ100100.01.2113.8970.75
    300100.00.8116.7856.55
    1000100.00.8116.9856.52
    下载: 导出CSV

    表  3  不同神经网络模型中的迁移性

    方法GoogLeNetVgg-16ResNet-152
    k=20k=40k=20k=40k=20k=40
    I-FGSM3.45.36.511.97.59.9
    C&W1.82.83.95.94.55.1
    DDN1.02.04.56.74.35.1
    PerC-C&W2.23.94.38.15.56.5
    PerC-AL1.63.45.17.95.37.3
    Aho-λ1.22.34.07.04.55.6
    下载: 导出CSV
  • [1] SZEGEDY C, ZAREMBA W, SUTSKEVER I. Intriguing properties of neural networks[C]//The 2nd International Conference on Learning Representations. [S.l.]: 2014, 4: 3861-3864.
    [2] CARLINI N, WAGNER D. Towards evaluating the robustness of neural networks[C]//Symposium on Security and Privacy. San Jose: IEEE, 2017, 5: 39-57.
    [3] GOODFELLOW I, SHLENS J, SZEGEDY C. Explaining and harnessing adversarial examples[C]//The 3rd International Conference on Learning Representations. San Diego: [s.n.], 2015, 5: 1353-1362.
    [4] KURAKIN A, GOODFELLOW I, BENGIO S. Adversarial examples in the physical world[C]//The 5th International Conference on Learning Representations. Toulon: [s.n.], 2017, 4: 1238-1249.
    [5] TRAMER F, KURAKI A, PAPERNOT N, et al. Ensemble adversarial training: attacks and defenses[C]//The 6th International Conference on Learning Representations. Vancouver: IEEE, 2018, 5: 131-138.
    [6] MOOSAVI-DEZFOOLI S, FAWZI A, FROSSARD P. Deepfool: A simple and accurate method to fool deep neural networks[C]//Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016, 6: 2574-2582.
    [7] PAPERNOT N, MCDANIEL P, JHA S. The limitations of deep learning in adversarial settings[C]//European Symposium on Security and Privacy. [S.l.]: IEEE, 2016, 3: 372-387.
    [8] SHARIF M, BAUER L, REITER M. On the suitability of Lp-norms for creating and preventing adversarial examples[C]//2018 IEEE Conference on Computer Vision and Pattern Recognition Workshops. [S.l.]: IEEE, 2018, 6: 1605-1613.
    [9] RONY J, HAFEMANN L, OLIVEIRA L, et al. Decoupling direction and norm for efficient gradient-based L2 adversarial attacks and defenses[C]//Conference on Computer Vision and Pattern Recognition. Long Beach: IEEE, 2019, 6: 4322-4330.
    [10] GATYS L, ECKER A, BETHGE M. A neural algorithm of artistic style[EB/OL]. [2015-09-02]. https://arxiv.org/abs/1508.06576.
    [11] YOON Y, JEON H, YOO D, et al. Learning a deep convolutional network for light-field image super-resolution[C]//International Conference on Computer Vision Workshop. [S.l.]: IEEE, 2015, 12: 57-65.
    [12] SU Jia-wei, VARGAS D, SAKURAI K. One pixel attack for fooling deep neural networks[J]. Trans Evol Comput, 2019, 23(5): 828-841. doi:  10.1109/TEVC.2019.2890858
    [13] WANG Z, BOVIK A, SHEIKH H, et al. Image quality assessment: from error visibility to structural similarity[J]. Trans Image Process, 2004, 13(4): 600-612. doi:  10.1109/TIP.2003.819861
    [14] ROZSA A, RUDD E, BOULT T. Adversarial diversity and hard positive generation[C]//Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016, 6: 410-417.
    [15] KANBAK C, MOOSAVI-DEZFOOLI S, FROSSARD P. Geometric robustness of deep networks: Analysis and improvement[C]//Conference on Computer Vision and Pattern Recognition. San Diego: IEEE, 2018, 6: 4441-4449.
    [16] ENGSTROM L, TSIPRAS D, SCHMIDT L, et al. Exploring the landscape of spatial robustness[EB/OL]. [2019-09-16]. https://arxiv.org/abs/1712.02779.
    [17] HENG Wen, ZHOU Shu-chang, JIANG Ting-ting. Harmonic adversarial attack method[EB/OL]. [2018-08-08]. https://arxiv.org/abs/1807.10590.
    [18] LI Yi-jun, LIU Ming-yu, YANG Ming-hsuan, et al. A closed-form solution to photorealistic image stylization[J]. Springer Journal of Computer Vision, 2018, 5: 468-483.
    [19] PUY G, PEREZ P. A flexible convolutional solver with application to photorealistic style transfer[EB/OL]. [2018-06-13]. https://arxiv.org/abs/1806.05285.
    [20] ZHANG Han-wei, AVRITHIS Y, FURON T, et al. Smooth adversarial examples[J]. EURASIP Journal on Information Security, 2020(1): 15-24. doi:  10.1186/s13635-020-00112-z
    [21] BHATTAD A, CHONG Min-jin, LIANG Kai-zhao. Unrestricted adversarial examples via semantic manipulation[EB/OL]. [2019-03-20]. https://arxiv.org/abs/1904.06347.
    [22] LUO Bo, LIU Yan-nan, WEI Ling-xiao, et al. Towards imperceptible and robust adversarial example attacks against neural networks[C]//The 30th Innovative Applications of Artificial Intelligence. Louisiana: IEEE, 2018, 2: 1652-1659.
    [23] CROCE F, HEIN M. Sparse and imperceivable adversarial attacks[C]//International Conference on Computer Vision. Seoul: IEEE, 2019, 10: 4728-4731.
    [24] KURAKIN A, GOODFELLOW I, BENGIO S, et al. Adversarial attacks and defences competition[EB/OL]. (2018-03-31). https://arxiv.org/abs/1804.00097.
    [25] ZHAO Zheng-yu, LIU Zhuo-ran, LARSON M. Towards large yet imperceptible adversarial image perturbations with perceptual color distance[C]//Conference on Computer Vision and Pattern Recognition. Seattle: IEEE, 2020, 6: 1036-1045.
    [26] RONNIER L, CUI Gui-hua, BRYAN R. The development of the CIE 2000 colour-difference formula: CIEDE2000[J]. Color Research, 2001, 26(5): 340-350. doi:  10.1002/col.1049
    [27] SZEGEDY C, VANHOUCKE V, IOFFE S. Rethinking the inception architecture for computer vision[C]//Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016, 6: 2818-2826.
    [28] GUO C, RANA M, CISSE M, et al. Countering adversarial images using input transformations[EB/OL]. [2018-01-25]. https://arxiv.org/abs/1711.00117.
    [29] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[C]//The 3rd International Conference on Learning Representations. San Diego: IEEE, 2016, 6: 2818-2826.
    [30] HE Kai-ming, ZHANG Xiang-yu, SUN Jian. Deep residual learning for image recognition[C]//Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016, 6: 770-778.
  • [1] 吴子锐, 杨之蒙, 蒲晓蓉, 徐杰, 曹晟, 任亚洲.  面向特征生成的无监督域适应算法 . 电子科技大学学报, 2022, 51(4): 580-585, 607. doi: 10.12178/1001-0548.2021314
    [2] 刘欣刚, 江浩杨, 苏鑫, 冯晶.  基于决策边界搜索的对抗样本生成算法 . 电子科技大学学报, 2022, 51(5): 721-727. doi: 10.12178/1001-0548.2021396
    [3] 李明, 何子述.  基于输出信杂噪比的机载雷达训练样本选择算法 . 电子科技大学学报, 2021, 50(5): 676-681. doi: 10.12178/1001-0548.2021041
    [4] 何坤, 郑秀清, 谢沁岑, 王丹.  基于水平集的自适应保边平滑分割 . 电子科技大学学报, 2017, 46(4): 579-584. doi: 10.3969/j.issn.1001-0548.2017.04.017
    [5] 马义德, 袁金霞, 张红娟.  自适应彩色图像SCM去噪 . 电子科技大学学报, 2012, 41(5): 751-758.
    [6] 郭志勇, 李广军, 李强.  用于提高ADC性能的自适应Dither结构 . 电子科技大学学报, 2011, 40(3): 375-378. doi: 10.3969/j.issn.1001-0548.2011.03.009
    [7] 陈晓梅, 孟晓风, 王国华.  自适应阈值估计的MS模型仿真建模 . 电子科技大学学报, 2011, 40(1): 58-63. doi: 10.3969/j.issn.1001-0548.2011.01.011
    [8] 朱斌, 曾孝平, 曾凡鑫, 吴华.  PN码自适应门限捕获新方法 . 电子科技大学学报, 2010, 39(4): 490-494. doi: 10.3969/j.issn.1001-0548.2010.04.003
    [9] 李国军, 曾孝平, 周晓娜, 曾理, 蒋勇.  微弱高频CW信号的自适应滤波 . 电子科技大学学报, 2010, 39(2): 227-231,250. doi: 10.3969/j.issn.1001-0548.2010.02.016
    [10] 孔令讲, 罗美方.  改进的对角加载自适应脉冲压缩算法 . 电子科技大学学报, 2010, 39(6): 854-858. doi: 10.3969/j.issn.1001-0548.2010.06.011
    [11] 王朝翔, 丁炜.  自适应的Ad hoc MAC协议 . 电子科技大学学报, 2009, 38(1): 47-50.
    [12] 熊超, 王建英.  弱信号环境下的盲自适应波束形成 . 电子科技大学学报, 2007, 36(2): 182-185.
    [13] 周泽坤, 王锐, 张波.  一种自适应斜坡补偿电路 . 电子科技大学学报, 2007, 36(1): 47-49.
    [14] 孙艳争, 黄炜, 余波.  基于EMD的非线性信号自适应分析 . 电子科技大学学报, 2007, 36(1): 24-26.
    [15] 佘堃, 蒲红梅, 郑方伟, 周明天.  自适应多目独立成分分析 . 电子科技大学学报, 2007, 36(1): 11-13.
    [16] 甘刚, 陈运, 李飞.  网络对抗训练模拟系统的设计与实现 . 电子科技大学学报, 2007, 36(3): 604-607.
    [17] 邓琼, 刘晓明, 邓斌.  基于MEMS的自适应钻地引信系统设计 . 电子科技大学学报, 2006, 35(6): 932-935.
    [18] 陈玉, 王晟, 李乐民.  Ad hoc中基于主动网的自适应FEC . 电子科技大学学报, 2006, 35(5): 733-735,773.
    [19] 程红霞, 张玉兴, 吴援明.  改进的OBS长度自适应门限组装算法 . 电子科技大学学报, 2006, 35(3): 302-304,342.
    [20] 崔奉云, 王军.  基于电容近感原理的无源探测信号分析 . 电子科技大学学报, 2002, 31(6): 562-565.
  • 加载中
图(6) / 表(3)
计量
  • 文章访问数:  6431
  • HTML全文浏览量:  2426
  • PDF下载量:  42
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-03-01
  • 修回日期:  2021-05-06
  • 网络出版日期:  2021-07-23
  • 刊出日期:  2021-06-28

基于纹理和颜色感知距离的对抗样本生成算法

doi: 10.12178/1001-0548.2021058
    基金项目:  国家自然科学基金(61702150,61803135)
    作者简介:

    徐明(1970-),男,教授,博导,主要从事网络安全、数字取证及多媒体安全等方面的研究. E-mail:549614989@qq.com

  • 中图分类号: TP182

摘要: 理想的对抗样本不仅要成功欺骗机器学习分类器,同时还应不易被人类视觉感知到差异。传统的算法仅采用Lp范数衡量对抗样本扰动的大小,往往导致视距差异与感官不匹配等问题。该文提出了一种基于纹理和颜色感知距离的对抗样本生成算法(Aho-λ),其基本原理是尽可能地将扰动嵌入原始图像的高纹理区域,且基于颜色感知距离构建损失函数,从而降低原始图像和对抗样本之间的视距差异,最后利用自适应参数调节算法加快训练的收敛速度。在相近的Lp范数和可迁移性情形下,与DDN和C&W算法相比,该算法生成的对抗样本颜色感知距离更低,而且能以更少的迭代次数更快地生成对抗样本。

English Abstract

徐明, 蒋奔驰. 基于纹理和颜色感知距离的对抗样本生成算法[J]. 电子科技大学学报, 2021, 50(4): 558-564. doi: 10.12178/1001-0548.2021058
引用本文: 徐明, 蒋奔驰. 基于纹理和颜色感知距离的对抗样本生成算法[J]. 电子科技大学学报, 2021, 50(4): 558-564. doi: 10.12178/1001-0548.2021058
XU Ming, JIANG Ben-chi. Adversarial Examples Generation Method Based on Texture and Perceptual Color Distance[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(4): 558-564. doi: 10.12178/1001-0548.2021058
Citation: XU Ming, JIANG Ben-chi. Adversarial Examples Generation Method Based on Texture and Perceptual Color Distance[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(4): 558-564. doi: 10.12178/1001-0548.2021058
  • 近年来,深度学习在各个领域被广泛应用,其安全性备受关注,特别是对抗样本[1]带来了诸多潜在威胁。对抗样本是通过对原始图像添加刻意构造的微小扰动后,使特定的深度学习分类器以高置信度产生一个错误的分类输出。理想的对抗样本不仅能够欺骗机器学习分类器,且其差异应不易被人类视觉感知。

    在目前的对抗样本生成算法中,为了保证添加扰动后图像篡改痕迹的不可见性,通常研究人员采用比较公认的标准,即在RGB颜色空间内满足一定的Lp范数约束,用Lp范数衡量对抗样本中扰动的大小。如C&W[2]、FGSM[3]及变种(I-FGSM[4]、RFGSM[5])、Deepfool[6]和JSMA[7]。但范数距离与人类感官差异存在较大的偏差[8],采用范数约束优化生成的对抗样本不可避免地会在图像平滑区域出现肉眼可见的异常纹理。

    此外在基于迭代优化的对抗样本生成算法中,如C&W[2]、DDN[9]等算法的损失函数是由多个损失函数累加,通常引入超参数来表示每个损失之间的加权系数。损失函数中的超参数在图像风格转移[10]、图像超分辨率[11]及GAN等网络模型中都会涉及,通常采用遍历或者随机搜索的方式反复尝试,最终才能确定合适的超参数。

    为了解决对抗样本平滑区域易出现异常纹理和超参数确认困难的问题,本文提出了一种超参数自适应调节算法(Aho-λ)。该算法基于图像纹理和颜色感知距离,有效降低了对抗样本的视觉差异。训练过程中结合损失函数中超参数与攻击成功率和扰动距离之间的线性关系[2, 9],进行动态调节超参数,有效避免了超参数的反复尝试,降低对抗样本扰动的同时也减少了算法的迭代次数。

    • 对抗样本的设计是为了产生与原始图像接近的篡改图像,不影响人类判断的前提下使深度学习模型受到明显的改变。对抗样本问题可以描述为:

      $$\begin{split} & \min D(x{'} - x) \\ & \, \,{\rm{s.t}}.f(x{'}) = l{'} \\ & \;\;\;\;\;f(x) = l \\ & \;\;\;\;\;\;\;l{'} \ne l \\ & \;\;\;\;x \in [0,1] \end{split} $$ (1)

      在距离D的约束下,使网络分类器的标签发生改变;距离D可以分为Lp范数和非Lp范数。

    • 传统算法中,扰动大小通常用Lp范数来表示:

      $${L_p} = \sqrt[p]{{{{\sum {||{x_i}||} }^p}}}$$ (2)

      常用的Lp范数包括L0L2L范数。L0范数表示非零元素的个数,L0范数限制可修改像素的数量,如JSMA[7]通过迭代的次数来限制L>0范数。另外,L0范数广泛应用于黑盒模型中,如单像素攻击[12]仅通过修改某一个像素便可引起分类器的误判。L2范数也称欧式距离,使用在文献[1, 4, 7]中,是衡量对抗样本全局扰动大小的指标。L范数使用在文献[2, 4, 5]中,表示向量中元素的最大值,相比于L2范数,L范数侧重于图像局部的修改限制,对L范数的约束是为了防止图像某一像素点扰动过大。

      文献[1]首先提出范数约束扰动大小的方法,如式(3)所示,损失需要由超参数λ来调节,其中J是交叉墒,该文献提出了一种有效算法L-BFGS进行求解。

      $${\rm{minimize}}\;\lambda \parallel \delta {\parallel _2} - J\left( {x',\,y} \right)\;\;{\rm{s}}.{\rm{t}}.\;{{x}}' \in {[{\rm{0}},{\rm{1}}]^n}$$ (3)

      C&W算法[2]对文献[1]算法进行了改进,如式(4)所示,通过引入tanh函数解决了图像的训练约束,把像素值约束在[0,1]之间,并且交叉墒用式(9)进行替代。

      $$\begin{split} &{\rm{minimize}}||x' - x||_2^2 + \lambda f(x')\\ &{\rm{where\;}}f(x')\max (\max (\{ Z{(x')^i}:i \ne t\} -Z(x')_t)-k)\\ &{\rm{and\;}}x' = \dfrac{1}{2}(\tanh ({\rm{arctanh}}(x) + \omega ) + 1) \end{split}$$ (4)

      文献[1]和文献[2]两种算法都涉及超参数λ的选择,λ维持Lp范数和交叉墒之间的平衡,λ过大使对抗样本Lp范数过大,图像产生明显的扰动;λ过小会导致对抗样本不能产生攻击效果。也有算法避开了超参数λ的选择,如I-FGSM[4]和Deepfool[6],这些算法通过降低迭代次数来降低Lp范数。

    • 目前,还没有一个统一的标准用来描述图像的感官差异。在文献[13-14]中,SSIM[15]取代了Lp范数,其缺点是SSIM对图像微小的变化都较敏感,有时即使完全不同的图像的SSIM值却比相似图像要高[13]。还有研究用多重的Lp叠加来取代单一的范数约束[16],虽然能够获得一定的效果,但是很难从根本上降低图像扰动的可见性,反而增加了训练的复杂程度。另外,文献[17]使用谐波(Harmonic)生成无边缘的平滑扰动来降低扰动的可见性;文献[18-20]将拉普拉斯平滑项(Laplacian smoothing term)和正则项(regularization term)引入损失函数中,以此来生成平滑的对抗样本。此外,很多研究将扰动尽可能地添加在图像的高纹理区域[21-24],将纹理损失加入损失函数中降低平滑区域的噪声。文献[21]提出的C-adv方法通过改变背景的颜色和修改图像中物品的着色来获得有效的对抗样本。另外,文献[25]提出PerC-C&W和PerC-AL方法,使用CIEDE2000[26]取代了Lp范数约束,在反向传播中进行直接优化,使用这一标准作为图像质量的衡量指标,生成的对抗样本与原始图像视觉差异更小。

    • 基于纹理度筛选和颜色感知距离CIEDE2000,本文提出了对抗样本生成算法Aho-λ,能够在训练过程中自适应调节超参数,算法流程如图1所示。

      图  1  无感对抗样本算法流程图

    • 本文将CIEDE2000标准引入损失函数中,取代原先的Lp范数。CIEDE2000计算公式为:

      $$ \begin{split} &\Delta {E}_{00}=\sqrt{\left(\dfrac{\displaystyle\Delta L'}{{k}_{L}{S}_{L}}\right)^{2}+\left(\dfrac{\Delta C'}{{k}_{C}{S}_{C}}\right)^{2}+\left(\dfrac{\Delta H'}{{k}_{H}{S}_{H}}\right)^{2}+\Delta R}\\ &\qquad\qquad\Delta R={R}_{T}\left(\dfrac{\Delta C'}{{k}_{C}{S}_{C}}\right)\left(\dfrac{\Delta H'}{{k}_{H}{S}_{H}}\right)\end{split} $$ (5)

      式中,LCH分别代表了图像的亮度(lightness)、色度(chroma)、明度(hue)。参数参考文献[26]。通过文献[26]的研究证明,这一标准比范数距离更符合人类肉眼对于颜色的感知。

    • 图像纹理度是用来表述图像每个像素点位置的纹理程度大小的指标。在文献[10-11]研究中,对抗样本的扰动应尽可能添加在图像的平滑区域,文献[11]首次在对抗样本训练中引入了纹理度损失,如式(6):

      $$ D({X}^{*},X)=\sum _{i=1}^{N}{\varepsilon }_{i}\times{\rm{Sen}}\left({x}_{i}\right) $$ (6)

      式中,Sen是每个像素点的敏感度因子(为每个点和周围像素点之间的方差的倒数),如式(7):

      $$\begin{gathered} {\rm{Sen}}({x_i}) = 1/{\rm{SD}}({x_i}) \\ {\rm{SD}}({x_i}) = \sqrt {\frac{{\displaystyle\sum\limits_{{x_k} \in {S_i}} {{{({x_k} - \mu )}^2}} }}{{{n^2}}}} \\ \end{gathered} $$ (7)

      式中,n表示计算方差和均值的分块大小。

      本文选取了方差SD来表示图像纹理度,作为筛选图像扰动区域的量化指标,n取值3,并在迭代的过程直接过滤掉低纹理区域,降低计算成本。

    • 首先本文将为式(8)定义对抗样本训练的损失,

      $${\rm{minimize}}||\Delta {E_{00}}(x,\,x')|| + \lambda f(x')$$ (8)

      式中,ΔE00表示颜色感知距离;f 表示攻击目标网络的损失函数,超参数λ调节ΔE00f之间的比率,对于不同的图像λ的取值不同。

      本文设计的Aho-λ算法,能够适应不同的图像和网络模型,通过训练得到一个相对较优的参数λ来降低加入的扰动大小。算法使用的f(x)如式(9)所示,文献[2]已经实验证明了f(x)能够有效代替交叉墒,其中参数k用来描述模型中最大概率的预测项和次预测项目之间的距离大小,能够有效反映生成对抗样本的置信度。

      $$f(x') = \max (\max (\{ z{(x')_i}:i \ne t\} - z{(x')_t}), - k)$$ (9)

      Aho-λ如算法1所示,使用式(7)将所有像素点的纹理度进行计算及排序,把纹理度较低的点按照一定百分比进行过滤。依据对抗样本攻击成功与否,在迭代过程中动态调节超参数λ的大小。超参数λ值越大越能保证对抗样本攻击的成功率,但是为了有适当的感知距离且不易被肉眼察觉,对于每一张图像需要一个适合的λ值来权衡感知距离和攻击成功率之间的关系。结合每次迭代的对抗样本攻击结果,参考机器学习训练中的优化算法对λ进行自适应的调节,其中衰减率θ满足0 <θ< 1,目的是为了让λ最终稳定在某一范围内,随着迭代的不断进行,λ的变化率逐渐减小。

      算法1:自适应训练算法

        输入:

        $x$:原始图像;$t$:原始标签

        $k$:超参数;$\theta $:超参数变化率;$\eta $:学习率

        输出:

        $\hat x$:对抗样本

        初始化$\hat x \leftarrow x$

        初始化损失函数${\rm{Loss}} = ||\Delta {E_{00}}(x,\hat x)|| + \lambda f(\hat x)$

        计算图像纹理度$x'$,将高纹理区域置为1,低纹理区域置为0

        for $i \leftarrow 1$ to n do

         if $\hat x$是对抗样本 then

          $\lambda \leftarrow \lambda (1 + {\theta ^n})$  

         else

            $  \lambda \leftarrow \lambda (1 - {\theta ^n})$

         end if

         ${\rm{Loss}} = {{\rm{Loss}}_{{\rm{same}}}} + \lambda \times {{\rm{Loss}}_{{\rm{target}}}}$

         $g \leftarrow - {\nabla _{\hat x}}J({\rm{Loss}})$

         $\delta \leftarrow \eta \times g \times x'$

         $\hat x \leftarrow {\rm{clip}}(\hat x + \delta ,0,1)$

        end for

        return $\hat x$

    • 数据集与网络:选用NIPS 2017对抗样本攻防比赛[26]所采用的数据集ImageNet-Compatible dataset,共包含6000张图像,属于ImageNet 1000种标签类,Inception V3 [27]具有较高的识别率。因此,本文将Inception V3作为目标网络进行攻击产生对抗样本,最后将获取到的图像直接缩放到指定大小,图像的长宽为299*299。

      实验对比的算法:与Lp范数的I-FGSM[4]、C&W[2]和DDN[9]算法,及感官距离CIEDE2000的PerC-AL[25] 算法进行对比。比较对抗样本的攻击成功率、Lp范数和感官距离。

      实验建立与参数选择:I-FGSM每次迭代的步长设置为η=1/255,直到攻击成功后停止。C&W算法中,学习率设置为0.005,超参数λ使用[0.01,0.1,1,10,100]进行选择,生成的对抗样本中扰动最小的图像作为最终结果。PerC-C&W和PerC-AL算法的学习率为0.001,DDN的单步步长为0.01。DDN、PerC-AL和本文的Aho-λ算法,迭代次数设置为[100,300,1000]分别进行比较。

    • 本文提出的方法能够有效地对添加扰动的区域进行筛选和修改限制。如图2所示,图像第一行为不同修改比率下生成的对抗样本;第二行为对抗样本修改像素点的位置,使用255替换原来的颜色,图像中白色部分表示修改像素点对应的RGB三个颜色通道都被修改过。根据本文提出的算法,将纹理度排序并筛选出一定比率的可攻击区域,实验结果如表1所示。可以看出仅需修改图像中的少量点就能得到较高的攻击成功率,当修改区域大于70%时能保证图像100%的攻击成功率;对抗样本L2范数随着修改点的减少呈现下降的趋势,从L范数可以看出单个像素点的最大扰动随之提高。另外,当修改像素在70%时,颜色感知距离C2具有最低值56.54。因此,本文后续的实验都采用70%的像素修改作为实验参数。

      图  2  Aho-λ不同修改比率得到的对抗样本效果

      表 1  图像修改比率、攻击成功率及扰动距离对比

      修改比率/%成功率/%扰动距离
      ${\overline {{L_2}} }$${\overline {{L_\infty }} }$${\overline {{C_2}} }$
      1078.30.5125.90123.31
      2080.40.4824.73120.76
      3085.30.5220.23102.65
      4092.30.6919.6675.78
      5095.10.7419.4868.42
      6096.20.8218.6590.75
      701000.7916.7856.54
      801001.0317.0367.52
      901001.1117.2582.48
      1001001.3016.8985.60
    • 表2所示,在不考虑感官距离的DDN、C&W以及I-FGSM三种算法中,DDN算法能够获得最低的L2范数,略优于C&W算法;在I-FGSM算法中,L取决于迭代的次数,且每次迭代具有固定步长,虽然I-FGSM能够获得较低的L范数,但在L2C2上都不如其他算法优越。在结合感官距离的算法PerC-AL和Aho-λ中,本文提出的Aho-λ算法能够达到和DDN算法基本相同的L2范数,并具有比PerC-AL算法更小的颜色感知距离C2。与DDN和PerC-AL算法相比,Aho-λ算法在300次和1000次迭代过程中生成的两组对抗样本差异更小,这说明本文提出的Aho-λ算法能够更快地收敛,在300次左右就能够达到最佳的攻击效果。

      表 2  对抗样本质量对比

      方法迭代次数成功率/%扰动距离
      ${\overline {{L_2}} }$${\overline {{L_\infty }} }$${\overline {{C_2}} }$
      I-FGSM100.02.511.59317.96
      C&W1000100.01.098.20132.86
      DDN100100.01.007.84136.11
      300100.00.887.58120.12
      1000100.00.827.62111.65
      PerC-AL100100.01.3011.9869.49
      300100.01.1713.9761.21
      1000100.01.1317.0457.10
      Aho-λ100100.01.2113.8970.75
      300100.00.8116.7856.55
      1000100.00.8116.9856.52

      本文算法与其他几种算法生成的对抗样本局部细节对比如图3所示。图3a是原始图像,放大方块的选中区域后本文的算法并未出现异常纹理,与原图基本一致。其余几种方法都出现了可见的异常纹理。

      图  3  5种算法生成的对抗样本

    • 置信度k值变化会影响对抗样本的质量,能有效地保证对抗样本输出的标签与其他标签之间的差异,如式(9)所示。在不同置信度k下,本文算法Lp范数和颜色感知距离变化如图4所示,置信度k值越大,扰动距离L2LC2不断增大。

      图片的有损压缩通常也被当作是防御对抗样本攻击的有效手段。本实验选取了与文献[20, 28]相同的JPEG和Bit Depth压缩方法。在不同质量因子下,JPEG压缩后的对抗样本保持原有攻击效果的比率,如图5所示。在常用的质量因子大于70时,本文提出的算法具有一定的抗JPEG压缩能力;但当质量因子小于60时,压缩图像越来越模糊,对抗样本的攻击成功率降低。Bit Depth压缩下也表现出了近似的效果,如图6所示,原来图像颜色由8位压缩到4位以上时,对抗样本表现出较出色的抗压缩能力。同时,图5图6表明,由于置信度增加,需要在图像中嵌入扰动变大,对抗样本的鲁棒性也随之提高。

      图  4  不同置信度下3种扰动距离的大小

      图  5  不同JPEG质量因子下对抗样本的成功率

      图  6  Bit Depth压缩下对抗样本的成功率

    • 现有的许多研究表明[2, 3, 23],对于不同网络模型使用相同的对抗样本可能达到同样的攻击效果,即对抗样本具有一定的迁移性。本文选取ImageNet-Compatible dataset数据集作为实验对象,置信度k选择20和40,分别在Google net[27]、Vgg-16[29]和ResNet-152[30]网络模型上进行迁移性实验,实验结果如表3所示。表3中的数据表示在不同置信度k下,不同算法生成的对抗样本在另外两种网络模型中具有相同的分类结果的比率。另外,在所有算法中I-FGSM迁移性最好,其加入的 L2C2颜色感知距离都是最大的;Aho-λ算法虽然具有一定的迁移性,但是迁移性不高,原因可能有以下两点:首先Aho-λ算法加入的扰动是所有算法中最小的;其次可能是不同的网络模型对于图像纹理区域的改变比较敏感。因此,Aho-λ算法在不同网络模型中的判别结果一致性不高。

      表 3  不同神经网络模型中的迁移性

      方法GoogLeNetVgg-16ResNet-152
      k=20k=40k=20k=40k=20k=40
      I-FGSM3.45.36.511.97.59.9
      C&W1.82.83.95.94.55.1
      DDN1.02.04.56.74.35.1
      PerC-C&W2.23.94.38.15.56.5
      PerC-AL1.63.45.17.95.37.3
      Aho-λ1.22.34.07.04.55.6
    • 本文结合纹理度筛选与颜色感知距离CIEDE2000作为图像损失函数,设计了一种能够自适应调节超参数的算法Aho-λ,生成的图像具有更小的颜色感知距离和更快的收敛。在JPEG和Big Depth压缩下具有良好的鲁棒性,且对抗样本在多种网络模型下具备一定的迁移能力。

      使用CIEDE2000标准作为人类感知距离,在一定程度上降低了对抗样本在视觉上的可见度,但在图像平滑区域依然存在一定的可感知性,未来希望找到一种更符合人类感官的新标准引入训练损失中;同时也希望找到一种能够定量区分图像修改区域的方法,进一步完善纹理度筛选。

参考文献 (30)

目录

    /

    返回文章
    返回