基于残差注意力机制的肺结节数据增强方法

李阳; 李春璇; 徐灿飞; 方立梅

doi:10.12178/1001-0548.2022363

基于残差注意力机制的肺结节数据增强方法

doi: 10.12178/1001-0548.2022363

李阳^{1, 2},
李春璇^2, ,,
徐灿飞³,
方立梅⁴

1.
东北师范大学前沿交叉研究院　长春　130000
2.
长春工业大学计算机科学与工程学院　长春　130012
3.
浙江大学医学院附属邵逸夫医院　杭州　310000
4.
长春中医药大学附属第三临床医院　长春　130117

基金项目: 国家自然科学基金(NSFC 61806024, NSFC12226003, NSFC12171076)；吉林省科技厅重点研发计划(20210201081GX, 20200401103GX)；吉林省教育厅重点科研项目(JJKH20220685KJ, JJKH20220692KJ)；吉林省卫生厅卫生科研人才专项(2020SCZ25)

详细信息

作者简介:
李阳(1979 – )，女，博士，教授，主要从事机器学习、图像处理方面的研究

通讯作者: 李春璇，E-mail：2202003054@stu.ccut.edu.cn

中图分类号: TP391.4

Data Augmentation of Lung Nodule Based on Residual Attention Mechanism

LI Yang^{1, 2},
LI Chunxuan^{2
, ,},
XU Canfei³,
FANG Limei⁴

1.
Academy for Advanced Interdisciplinary Studies, Northeast Normal University　Changchun　130000
2.
School of Computer Science and Engineering, Changchun University of Technology　Changchun　130012
3.
Run Run Shaw Hospital, Zhejiang University School of Medicine　Hangzhou　310000
4.
The Third Affiliated Clinical Hospital of Changchun, University of Traditional Chinese Medicine　Changchun　130117

摘要: 针对带标注的肺CT图像数据匮乏而导致的深度学习模型训练困难，以及现有生成算法生成肺结节不同特征模糊、细节丢失的问题，提出了肺结节图像的数据增强RAU-GAN算法。首先，在生成器网络中嵌入残差注意力模块，该模块可以聚焦于局部不同的感兴趣区域，以实现肺结节与背景信息的独立生成，并且重新设计了注意力模块中的残差块来减少网络的深度和训练的复杂度。其次，将判别器设计为U-Net架构，可以给更新后的生成器反馈更多信息，以提高判别性能。最后，在数据集LUNA16和Deep Lesion上进行实验，结果与现有方法相比，在视觉效果和不同评价指标上均有提升，验证了生成图像包含了更丰富的细节信息。
- 数据增强 /
- Pix2Pix /
- RAU-GAN /
- 残差注意力机制 /
- U-Net判别器
Abstract: Aiming at the difficulty of deep learning model training caused by the lack of labeled lung Computed Tomography (CT) image data and the lung nodule feature model generated by existing generation algorithmsTo solve the problem of blur and detail loss, a data-enhanced RAU-GAN algorithm for pulmonary nodule images is proposed. Firstly, a residual attention module is embedded in the generator network, which can focus on different local regions of interest to achieve the independent generation of lung nodules and background information. Moreover, the residual block structure in the attention module is redesigned to to reduce the depth of the network and training complexity. Second, the discriminator is designed as U-Net architecture, which can feed back more information to the updated generator to improve the discrimination performance. Finally, experiments were conducted on data set LUNA16 and deep lesion. The results show that the visual and different evaluation indexes have improved in comparison with existing methods, which verifies that the generated images can contain richer details. images can contain richer details.
- data augmentation /
- Pix2Pix /
- RAU-GAN /
- residual Attention mechanism /
- U-Net discrimination

图 1 生成器网络模型

下载: 全尺寸图片幻灯片

图 2 残差注意力模块

下载: 全尺寸图片幻灯片

图 3 残差块模型的设计

下载: 全尺寸图片幻灯片

图 4 不同大小掩膜的选取

下载: 全尺寸图片幻灯片

图 5 DeepLesion数据集上的实验结果

下载: 全尺寸图片幻灯片

图 6 不同模型生成的肺结节图像

下载: 全尺寸图片幻灯片

表 1 不同掩膜尺寸的指标结果

掩膜大小	8×8 ×8	12×12 ×12	16×16 ×16	20×20 ×20	24×24 ×24
FID	80.3762	83.8914	86.8488	88.6572	93.4521

下载: 导出CSV

表 2 消融实验

组别	方法	Att	Att(res)	U-Net	FID	PSNR	SSIM
第一组	Pix2pix(Baseline)				86.8488	28.5944	0.9532
第二组	Pix2pix+Att	√			85.4103	28.7884	0.9533
第三组	Pix2Pix+Att(res)		√		85.4512	28.7815	0.9533
第四组	Pix2Pix+Unet			√	85.6928	28.7469	0.9534
第五组	RAU-GAN		√	√	84.3987	28.9144	0.9535

下载: 导出CSV

表 3 不同模型在Deep Lesion 数据集上的结果

方法	FID	PSNR	SSIM
Pix2pix	87.8488	28.5844	0.9529
RAU-GAN	85.5484	28.7033	0.9532

下载: 导出CSV

表 4 不同模型在数据集上的指标生成结果

方法	FID	PSNR	SSIM
Pix2Pix	86.8488	28.5944	0.9532
CycleGAN	87.3728	28.4425	0.9521
U-GAT-IT	86.8385	28.5952	0.9532
DualStyleGAN	86.0615	28.6847	0.9533
RAU-GAN	84.9875	28.9144	0.9535

下载: 导出CSV

[1]	尹周一, 王梦圆, 游伟程, 等. 2022美国癌症统计报告解读及中美癌症流行情况对比[J]. 肿瘤综合治疗电子杂志, 2022, 8(2): 54-63. YIN Z Y, WANG M Y, YOU W C, et al. Interpretation of the 2022 American Cancer Statistics Report and comparison of cancer prevalence in China and the United States[J]. Electronic Journal of Integrative Oncology Therapy, 2022, 8(2): 54-63.
[2]	YUN S, HAN D, OH S J, et al Cutmix: Regularization strategy to train strong classifiers with localizable features[EB/OL]. [2022-4-11]. https://arxiv.org/abs/1905.04899v1.
[3]	WANG H, HAO W, ZHILI S. Improved mosaic: Algorithms for more complex images[J]. Journal of Physics:Conference Series, 2020, 1684(1): 012094. doi: 10.1088/1742-6596/1684/1/012094
[4]	GOODLEFELLOW I, POUGET-ABADIE J, MIRZA M, et al. Generative adversarial networks[J]. Communications of the ACM, 2020, 63(11): 139-144. doi: 10.1145/3422622
[5]	LIANG J, YANG X, HUANG Y, et al. Sketch guided and progressive growing GAN for realistic and editable ultrasound image synthesis[J]. Medical Image Analysis, 2022, 79: 102461. doi: 10.1016/j.media.2022.102461
[6]	DAR S U, YURT M, KARACAN L, et al. Image synthesis in multi-contrast MRI with conditional generative adversarial networks[J]. IEEE Transactions on Medical Imaging, 2019, 38(10): 2375-2388. doi: 10.1109/TMI.2019.2901750
[7]	SHI H, LU J, ZHOU Q. A novel data augmentation method using style-based GAN for robust pulmonary nodule segmentation[C]//2020 Chinese Control And Decision Conference (CCDC). Hefei: IEEE, 2020: 2486-2491.
[8]	李阳, 高轼奇. 基于数据增强及注意力机制的肺结节检测系统[J]. 北京邮电大学学报, 2022, 45(4): 25-30. LI Y, GAO S Q. Lung nodule detection system based on data augmentation and attention mechanism[J]. Journal of Beijing University of Posts and Telecommunications, 2022, 45(4): 25-30.
[9]	MIRSKY Y, MAHLER T, SHELEF I, et al. CT-GAN: Malicious tampering of 3D medical imagery using deep learning[C]//28th USENIX Security Symposium. Santa Clara: [s.n.], 2019: 461-478.
[10]	ZHANG H, GOODFELLOW I, METAXAS D, et al. Self-Attention generative adversarial networks[C]//International Conference on Machine Learning. [S.l.]: PMLR, 2019: 7354-7363.
[11]	EMAMI H, ALIABADI M M, Dong M, et al. SPA-GAN: Spatial attention gan for image-to-image translation[J]. IEEE Transactions on Multimedia, 2020, 23: 391-401.
[12]	WENG W, ZHU X. INet: Convolutional networks for biomedical image segmentation[J]. IEEE Access, 2021, PP(99): 16591-16603.
[13]	SCHNFELD E, SCHIELE B, KHOREVA A. A U-Net based discriminator for generative adversarial networks[C] //Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE, 2020: 8204-8213.
[14]	ZHAO W, ZHAO Y, FENG L, et al. Attention enhanced serial U-net++ network for removing unevenly distributed haze[J]. Electronics, 2021, 10(22): 2868. doi: 10.3390/electronics10222868
[15]	GUI J, SUN Z, WEN Y, et al. A Review on generative adversarial networks: Algorithms, theory, and applications[J]. IEEE Transactions on Knowledge and Data Engineering, 2021, 35(4): 3313-3332.
[16]	ISOLA P, ZHU J Y, ZHOU T, et al. Image-to-image translation with conditional adversarial networks[C]//IEEE Conference on Computer Vision & Pattern Recognition. Honolulu: IEEE, 2017: 5967-5976.
[17]	FEI W, JIANG M, CHEN Q, et al. Residual attention network for image classification[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu: IEEE, 2017: 6450-6458.
[18]	SETIO A, TRAVERSO A, De Bel T, et al. Validation, comparison, and combination of algorithms for automatic detection of pulmonary nodules in computed tomography images: the LUNA16 challenge[J]. Medical Image Analysis, 2016, 42: 1-13.
[19]	HEUSEL M, RAMSAUER H, UNTERTHINER T, et al. GANs Trained by a two time-scale update rule converge to a local nash equilibrium[EB/OL]. [2022-5-10]. https://arxiv.org/pdf/1706.08500.pdf.
[20]	TONG Y B, ZHANG Q S, QI Y P. Image quality assessing by combining PSNR with SSIM[J]. Journal of Image and Graphics, 2006, 11(2): 1758-1763.
[21]	ZHOU W, BOVIK A C, SHEIKH H R, et al. Image quality assessment: From error visibility to structural similarity[J]. IEEE Trans Image Process, 2004, 13(4): 600-612. doi: 10.1109/TIP.2003.819861
[22]	YAN K, WANG X, LU L, et al. Deep Lesion: Automated mining of large-scale lesion annotations and universal lesion detection with deep learning[J]. Journal of Medical Imaging, 2018, 5(3): 036501.
[23]	KIM J, KIM M, KANG H, et al. U-gat-it: Unsupervised generative attentional networks with adaptive layer-instance normalization for image-to-image translation[EB/OL]. [2022-5-12]. https://arxiv.org/abs/1907.10830v2.
[24]	YANG S, JIANG L, LIU Z, et al. Pastiche master: Exemplar-based high-resolution portrait style transfer[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2022: 7693-7702.

[1]	王奇, 钱伟中, 雷航, 王旭鹏. 基于关键特征增强机制的3D人脸识别 . 电子科技大学学报, 2024, 53(2): 252-258. doi: 10.12178/1001-0548.2023012
[2]	陈欣, 李闯, 金凡. 量子自注意力神经网络的时间序列预测 . 电子科技大学学报, 2024, 53(1): 110-118. doi: 10.12178/1001-0548.2022340
[3]	崔少国, 独潇, 张宜浩. 基于兴趣注意力网络的会话推荐算法 . 电子科技大学学报, 2024, 53(1): 67-75. doi: 10.12178/1001-0548.2022307
[4]	张凌浩, 梁晖辉, 邓东, 刘洋洋, 唐超, 常政威, 桂盛霖. 面向无线传感器网络的多因素安全增强认证协议 . 电子科技大学学报, 2023, 52(5): 699-708. doi: 10.12178/1001-0548.2022238
[5]	赵云龙, 田生祥, 李岩, 罗龙, 齐鹏文. 基于注意力模型和Soft-NMS的输电线路小目标检测方法 . 电子科技大学学报, 2023, 52(6): 906-914. doi: 10.12178/1001-0548.2022290
[6]	齐鹏文, 李渊, 李岩, 罗龙, 赵云龙. 基于注意力模型的输电线路隐患检测 . 电子科技大学学报, 2023, 52(2): 240-246. doi: 10.12178/1001-0548.2022063
[7]	周丰丰, 孙燕杰, 范雨思. 基于miRNA组学的数据增强算法 . 电子科技大学学报, 2023, 52(2): 182-187. doi: 10.12178/1001-0548.2023002
[8]	陈永, 蒋丰源, 詹芝贤. 多尺度残差注意力的高速铁路OFDM信道估计 . 电子科技大学学报, 2023, 52(4): 512-522. doi: 10.12178/1001-0548.2022205
[9]	郭磊, 王邱龙, 薛伟, 郭济. 基于注意力机制的光线昏暗条件下口罩佩戴检测 . 电子科技大学学报, 2022, 51(1): 123-129. doi: 10.12178/1001-0548.2021222
[10]	张凤荔, 王雪婷, 王瑞锦, 汤启友, 韩英军. 融合动态图表示和自注意力机制的级联预测模型 . 电子科技大学学报, 2022, 51(1): 83-90. doi: 10.12178/1001-0548.2021100
[11]	郭磊, 王邱龙, 薛伟, 郭济. 基于改进YOLOv5的小目标检测算法 . 电子科技大学学报, 2022, 51(2): 251-258. doi: 10.12178/1001-0548.2021235
[12]	储岳中, 汪佳庆, 张学锋, 刘恒. 基于改进深度残差网络的图像分类算法 . 电子科技大学学报, 2021, 50(2): 243-248. doi: 10.12178/1001-0548.2020314
[13]	顾勤, 周涛. 数据要素流通的分账机制研究 . 电子科技大学学报, 2021, 50(3): 446-449. doi: 10.12178/1001-0548.2021005
[14]	张腾月, 文红, 唐杰, 宋欢欢. 随机移动终端协同干扰下的安全传输增强机制 . 电子科技大学学报, 2021, 50(6): 877-882. doi: 10.12178/1001-0548.2020336
[15]	李学明, 岳贡, 陈光伟. 基于多模态注意力机制的图像理解描述新方法 . 电子科技大学学报, 2020, 49(6): 867-874. doi: 10.12178/1001-0548.2019228
[16]	邓钰, 雷航, 李晓瑜, 林奕欧. 用于目标情感分类的多跳注意力深度模型 . 电子科技大学学报, 2019, 48(5): 759-766. doi: 10.3969/j.issn.1001-0548.2019.05.016
[17]	帕丽旦·木合塔尔, 买买提阿依甫, 杨文忠, 吾守尔·斯拉木. 基于BiRNN的维吾尔语情感韵律短语注意力模型 . 电子科技大学学报, 2019, 48(1): 88-95. doi: 10.3969/j.issn.1001-0548.2019.01.015
[18]	任立勇, 雷明, 张磊. P2P应用层数据流量优化 . 电子科技大学学报, 2011, 40(1): 111-115. doi: 10.3969/j.issn.1001-0548.2011.01.021
[19]	伏飞, 刘晶, 齐望东, 沈洋. 一种基于IEEE 802.11 PSM的增强节能机制 . 电子科技大学学报, 2006, 35(6): 883-886.
[20]	罗光春, 卢显良, 张骏, 李炯. 基于多传感器数据融合的入侵检测机制 . 电子科技大学学报, 2004, 33(1): 71-74.

点击查看大图

图(6) / 表(4)

计量

文章访问数: 3897
HTML全文浏览量: 965
PDF下载量: 19
被引次数: 0

全文HTML

癌症已成为人口死亡的主要原因之一，而肺癌的发病率和致死率均较高^[1]。早期肺癌在胸部计算机断层扫描(computed tomography, CT)上的表现为肺结节，对肺结节的早期检测可以提高肺癌患者的存活率。计算机辅助检测(computer aided detection, CAD)技术能够辅助医生进行医学检测，减少了医生工作量的同时也提高了诊断的准确性。近年来深度学习在肺CAD诊断方面得到广泛应用。然而深度学习模型的训练必须依赖大量数据，实际中由于人工标注成本昂贵导致获取大量带标注的肺CT影像非常困难，数据增强技术为数据的扩充提供了可能。

数据增强是一种数据扩充技术，传统数据增强方法有旋转、平移、裁剪、缩放、噪声扰动等。这些方法被广泛应用于扩充训练集^[2-3]，然而传统数据增强方法的输出过度依赖于原始数据，深度模型利用扩充数据来训练模型容易出现过拟合问题。近年来，许多研究使用生成式对抗网络(generative adversarial networks, GAN)进行数据扩充。GAN通过两个网络的对抗博弈过程来学习真实样本的数据分布^[4]，与传统数据增强方法对比，本质上提高了样本特征的多样性。

目前GAN衍生出一系列的变体模型，改进的变体模型逐步从自然场景的应用跨越到医学图像的应用^[5-6]。在肺结节的生成任务中，文献[7]为了提高分割网络训练模型性能、增加训练数据，提出基于Style-GAN的新型数据增强方法合成肺结节，先从整体中提取样式和语义标签，然后用随机选择的样式为每个语义标签合成增强的CT图像。文献[8]为提高检测网络的性能，对肺结节数据集进行增强，提出一种基于计算机断层扫描的生成式对抗网络的数据增强方法，可以在指定位置添加肺结节，并引入DropBlock来解决过拟合的问题。

文献[9]提出一种基于Conditional GAN(CGAN)的肺结节图像生成算法CT-GAN，该网络能学习图像到图像的映射关系，通过篡改原始的CT图像数据，得到近似真实的医学图像数据，从而扩充正样本数据。

在GAN的增强任务中，引入注意力模块可以达到更优的生成效果。在生成式对抗网络的生成任务中最常用的注意力模块是自注意力机制和通道注意力机制。SAGAN^[10]在生成器和判别器中都添加了自注意力模块，在每一层都考虑了全局信息，在提高感受野和减小参数量之间找到了一个很好的平衡，生成与全局相关性比较高的图片。文献[11]在CycleGAN的判别器中添加了空间注意力，将注意力图反馈到生成器，来协助生成器可以关注到图像中有区分度的区域，由此带来了模型性能的持续提升。

U-Net^[12]被应用在医学图像的初衷是为了解决医学图像分割的问题，其U形结构启发了生成算法。文献[13]提出了U-Net的判别器架构，鼓励U-Net判别器更多关注真实图像与伪图像之间的语义和结构变化，使生成器能生成图片保持全局和局部真实感。文献[14]提出一种端到端注意力增强的串行 U-Net++ 网络，串行U-Net++模块提取不同分辨率的特征并在不同的尺度上重建图像。该模块直接将浅层的原始信息传递给更深层次，使更深层次专注于残差学习，而重用浅层上下文信息。

传统的GAN网络生成图像效果有限，训练不稳定且训练过程容易模式崩溃^[15]。直接用GAN生成肺结节，容易存在病灶模糊和背景噪点多的问题，为解决以上问题，本文提出利用改进的Pix2Pix^[16]模块生成肺结节图像，主要贡献如下。

1）生成器中添加设计后的残差注意力模块^[17]。目的是在图像的生成中不但关注到肺结节的生成，同时也关注到复杂的背景信息。对不同的信息进行特征筛选，自适应地学习肺结节图像保证图像不同特征细节的生成。

2）设计残差块结构。残差注意力模块的添加使整个生成网络层数扩展到很深，重新设计后的残差块减少了网络深度和训练的复杂度，同时更好地适应生成网络。

3）设计U-Net判别器代替Pix2Pix中的马尔可夫判别器。由于U-Net的编码器和解码器对应不同模块之间的跳跃链接，输出层的通道就包含了不同级别的信息，可以反馈给生成器更详细的信息。

3. 结束语

本文针对带标签的肺 CT 数据集匮乏的问题，提出了基于残差注意力机制和U-Net框架进行的生成算法。该模块生成器通过引入残差注意力机制，堆叠的注意力模块对不同特征信息赋予高的权重，有效地生成细节信息。此外，通过对残差块进行重新设计来降低生成网络模型的复杂度，避免了网络梯度消失的问题。对于判别器网络，通过对U-Net网络结构进行重新设计来进一步提高判别性能。本文使用FID、PSNR和SSIM作为评价指标，来保证生成结果的相似性和生成质量，生成结果的唯一性和差异性也需保证，以避免后续深度模型训练过拟合的问题，因此未来可进一步探讨相关的图像评价指标来保证生成图像的真实性和唯一性。此外，如果不进行CT影像裁剪，生成的结果往往效果不佳，同时，实验生成结果表明，结节越大生成效果越好，因此如何将当前基于生成式对抗网络的模型更好地扩展到大背景下精细地生成小目标，也是下一步的研究重点。

参考文献 (24)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于残差注意力机制的肺结节数据增强方法

doi: 10.12178/1001-0548.2022363

作者简介:
李阳(1979 – )，女，博士，教授，主要从事机器学习、图像处理方面的研究

通讯作者: 李春璇，E-mail：2202003054@stu.ccut.edu.cn

Data Augmentation of Lung Nodule Based on Residual Attention Mechanism

计量

基于残差注意力机制的肺结节数据增强方法

doi: 10.12178/1001-0548.2022363

1. 东北师范大学前沿交叉研究院　长春　130000

2. 长春工业大学计算机科学与工程学院　长春　130012

3. 浙江大学医学院附属邵逸夫医院　杭州　310000

4. 长春中医药大学附属第三临床医院　长春　130117

作者简介:
李阳(1979 – )，女，博士，教授，主要从事机器学习、图像处理方面的研究

通讯作者: 李春璇，E-mail：2202003054@stu.ccut.edu.cn

English Abstract

Data Augmentation of Lung Nodule Based on Residual Attention Mechanism

全文HTML

1.1. Pix2Pix算法原理

1.2. RAU-GAN网络设计

1.2.1. 生成器网络

1.2.2. 残差块注意力机制

1.3. U-Net判别器

2.1. 数据集

2.2. 实验细节

2.3. 评价指标

2.4. 实验结果和分析

2.4.1. 掩膜大小的选定

2.4.2. 消融实验

2.4.3. 在DeepLesion数据集上的实验结果

2.4.4. 不同模型实验结果及分析

目录

期刊在线

编辑办公

友情链接

留言板

基于残差注意力机制的肺结节数据增强方法

doi: 10.12178/1001-0548.2022363

作者简介: 李阳(1979 – )，女，博士，教授，主要从事机器学习、图像处理方面的研究

通讯作者: 李春璇，E-mail：2202003054@stu.ccut.edu.cn

Data Augmentation of Lung Nodule Based on Residual Attention Mechanism

计量

出版历程

基于残差注意力机制的肺结节数据增强方法

doi: 10.12178/1001-0548.2022363

1. 东北师范大学前沿交叉研究院 长春 130000 2. 长春工业大学计算机科学与工程学院 长春 130012 3. 浙江大学医学院附属邵逸夫医院 杭州 310000 4. 长春中医药大学附属第三临床医院 长春 130117

作者简介: 李阳(1979 – )，女，博士，教授，主要从事机器学习、图像处理方面的研究

通讯作者: 李春璇，E-mail：2202003054@stu.ccut.edu.cn

English Abstract

Data Augmentation of Lung Nodule Based on Residual Attention Mechanism

全文HTML

1.1. Pix2Pix算法原理

1.2. RAU-GAN网络设计

1.2.1. 生成器网络

1.2.2. 残差块注意力机制

1.3. U-Net判别器

2.1. 数据集

2.2. 实验细节

2.3. 评价指标

2.4. 实验结果和分析

2.4.1. 掩膜大小的选定

2.4.2. 消融实验

2.4.3. 在DeepLesion数据集上的实验结果

2.4.4. 不同模型实验结果及分析

目录

期刊在线

编辑办公

友情链接

作者简介:
李阳(1979 – )，女，博士，教授，主要从事机器学习、图像处理方面的研究

1. 东北师范大学前沿交叉研究院　长春　130000

2. 长春工业大学计算机科学与工程学院　长春　130012

3. 浙江大学医学院附属邵逸夫医院　杭州　310000

4. 长春中医药大学附属第三临床医院　长春　130117

作者简介:
李阳(1979 – )，女，博士，教授，主要从事机器学习、图像处理方面的研究