基于相似图像配准的图像修复算法

何凯; 刘坤; 沈成南; 李宸

doi:10.12178/1001-0548.2020327

基于相似图像配准的图像修复算法

doi: 10.12178/1001-0548.2020327

天津大学电气自动化与信息工程学院　天津南开区　300072

基金项目: 国家自然科学基金(61271326)；天津市自然科学基金(14JCQNJC01500)

详细信息

作者简介:
何凯(1972- )，男，博士，副教授，主要从事图像处理、计算机视觉方面的研究. E-mail： hekai@tju.edu.cn

中图分类号: TP391.41

Image Inpainting Approach Using Similar Image Registration

School of Electrical and Information Engineering, Tianjin University　Nankai Tianjin　300072

摘要: 传统基于纹理合成的图像修复算法只能从破损图像中提取有用信息，不能修复复杂结构；基于深度学习的修复算法训练时间长，纹理合成效果不理想。为解决上述问题，该文提出了一种基于相似图像配准的图像修复算法。首先提出一种破损图像的相似度计算方法，利用图像的深度学习特征，在数据库中寻找与之最为相近的图像，为修复过程提供更多的有效信息；然后对破损图像和相似图像进行配准，利用单应性变换实现图像空间位置的自动粗纠正；最后使用改进的最佳匹配块搜索方法和匹配准则来改善纹理合成效果，实现图像的最终修复。仿真实验结果表明，该方法可以获得较多的有用信息，产生良好的纹理合成效果，克服了传统算法和深度学习方法的缺点，即使对于具有复杂纹理信息和结构的破损图像，也能够得到良好的修复效果。
- 深度学习 /
- 特征匹配 /
- 图像修复 /
- 相似图像 /
- 纹理合成
Abstract: The traditional texture synthesis image inpainting approaches can only extract useful information from the damaged image, but cannot deal with the complex structures. In the meanwhile, the deep-learning-based ones usually have long training time and unsatisfactory texture synthesis effects. To solve the problems, this paper proposes an image inpainting approach based on similar image registration. First, a similarity calculation method of damaged image is proposed by using the deep learning features of images, thus the most similar image of the damaged ones in dataset can be found to provide more useful information for the image inpainting process. Second, this paper matches the damaged image with its similar ones and use the homography transform to realize the automatic rough correction of image space position. At last, the texture synthesis effects are improved by using the improved optimal patch searching method and the relative matching criteria, then the image inpainting is performed. Simulation results demonstrate that the approach can obtain more useful information, yield perfect texture synthesis effect, and overcome the shortcomings of the traditional deep-learning-based and texture synthesis approaches. Besides that, the proposed approach can also obtain ideal inpainting effects even for the damaged images with complex textural information and structures.
- deep learning /
- feature matching /
- image inpainting /
- similar image /
- texture synthesis
图 1 相似图像搜索过程示意图

下载: 全尺寸图片幻灯片

图 2 匹配块搜索范围示意图

下载: 全尺寸图片幻灯片

图 3 本文算法的修复效果

下载: 全尺寸图片幻灯片

图 4 不同算法修复效果对比

下载: 全尺寸图片幻灯片

表 1 不同破损区域大小算法性能对比

破损区域大小 100×100以内 100×100～200×200 200×200～300×300

PSNR/dB 18.64 17.37 15.52

下载: 导出CSV

表 2 不同算法性能对比

性能 Kumar CA GC 本文

PSNR/dB 15.44 15.76 16.23 17.55
PSNR提升率/% 13.7 11.4 8.1 −
训练时间/s − 75600 50400 21600
运算时间/s 952.7 5.2 4.3 64.1

下载: 导出CSV

[1]	CRIMINISI A, PEREZ P, TOYAMA K. Region filling and object removal by exemplar-based image inpainting[J]. IEEE Transactions on Image Processing, 2004, 13(9): 1200-1212. doi: 10.1109/TIP.2004.833105
[2]	LI K, WEI Y, YANG Z, et al. Image inpainting algorithm based on TV model and evolutionary algorithm[J]. Soft Computing: A Fusion of Foundations, Methodologies and Applications, 2016, 20(3): 885-893.
[3]	KUMAR V, MUKHERJEE J, MANDAL S D. Image inpainting through metric labeling via guided patch mixing[J]. Transactions on Image Processing, 2016, 25(11): 5212-5226. doi: 10.1109/TIP.2016.2605919
[4]	SIADATI S Z, YAGHMAEE F, MAHDAVI P. A new exemplar-based image inpainting algorithm using image structure tensors[C]//Iranian Conference on Electrical Engineering (ICEE). Shiraz, Iran: IEEE, 2016: 995-1001.
[5]	NEWSON A, ALMANSA A, GOUSSEAU Y. Non-local patch-based image inpainting[J]. Image Processing on Line, 2017, 7: 373-385. doi: 10.5201/ipol.2017.189
[6]	何凯, 牛俊慧, 沈成南, 等. 基于SSIM的自适应样本块图像修复算法[J]. 天津大学学报(自然科学与工程技术版), 2018, 51(7): 763-767. HE Kai, NIU Jun-hui, SHEN Cheng-nan, et al. Image inpainting algorithm with adaptive patch using SSIM[J]. Journal of Tianjin University: Science and Technology, 2018, 51(7): 763-767.
[7]	KOMODAKIS N, TZIRITAS G. Image completion using efficient belief propagation via priority scheduling and dynamic pruning[J]. IEEE Transactions on Image Processing, 2007, 16(11): 2649-2661. doi: 10.1109/TIP.2007.906269
[8]	MEUR L, EBDELLI M, GUILLEMOT C. Hierarchical super resolution-based inpainting[J]. IEEE Transactions on Image Processing, 2013, 22(10): 3779-3790. doi: 10.1109/TIP.2013.2261308
[9]	RUZIC T, PIZURICA A. Context-aware patch-based image inpainting using Markov random field modeling[J]. IEEE Transactions on Image Processing, 2015, 24(1): 444-456. doi: 10.1109/TIP.2014.2372479
[10]	ZEILER M D, FERGUS R. Visualizing and understanding convolutional networks[C]//Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: Springer, 2014: 818-833.
[11]	GOODFELLOW I, POUGET-ABADIE J, MIRZA M, et al. Generative adversarial nets[J]. Advances in Neural Information Processing Systems, 2014(4): 2672-2680.
[12]	PATHAK D, KRAHENBUHL P, DONAHUE J, et al. Context encoders: Feature learning by inpainting[C]// IEEE Conference on Computer Vision and Pattern Recognition. Lasvegas, USA: IEEE, 2016: 2536-2544.
[13]	IIZUKA S, SIMO-SERRA E, ISHIKAWA H. Globally and locally consistent image completion[J]. ACM Transactions on Graphics, 2017, 36(4): 1-14.
[14]	YU J, LIN Z, YANG J, et al. Generative image inpainting with contextual attention[C]//IEEE Computer Vision and Pattern Recognition. Salt Lake City, USA: IEEE, 2018: 5505-5514.
[15]	YU J, LIN Z, YANG J, et al. Free-form image inpainting with gated convolution[C]//Proceedings of the IEEE International Conference on Computer Vision. California, USA: IEEE, 2019: 4471-4480.
[16]	陈俊周, 王娟, 龚勋. 基于级联生成对抗网络的人脸图像修复[J]. 电子科技大学学报, 2019, 48(6): 910-917. CHEN Jun-zhou, WANG Juan, GONG Xun. Face image inpainting using cascaded generative adversarial networks[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(6): 910-917.
[17]	SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [C]//International Conference on Learning Representations. San Diego, USA: ICLR, 2015:1-14.
[18]	MOREL J M, YU G. ASIFT: A new framework for fully affine invariant image comparison[J]. Journal on Imaging Sciences, 2009, 2(2): 438-469. doi: 10.1137/080732730
[19]	MOISAN L, MOULON P, MONASSE P. Automatic homographic registration of a pair of images, with a contrario elimination of outliers[J]. Image Processing on Line, 2012, 2: 56-73. doi: 10.5201/ipol.2012.mmm-oh
[20]	ZHOU W, BOVIK A C, SHEIKH H R, et al. Image quality assessment: From error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612. doi: 10.1109/TIP.2003.819861

[1]	王奇, 钱伟中, 雷航, 王旭鹏. 基于关键特征增强机制的3D人脸识别 . 电子科技大学学报, 2024, 53(2): 252-258. doi: 10.12178/1001-0548.2023012
[2]	章坚武, 戚可寒, 章谦骅, 孙玲芬. 车辆边缘计算中基于深度学习的任务判别卸载 . 电子科技大学学报, 2024, 53(1): 29-39. doi: 10.12178/1001-0548.2022376
[3]	郭磊, 林啸宇, 王勇, 陈正武, 常伟. 基于深度学习的直升机旋翼声信号检测与识别一体化算法 . 电子科技大学学报, 2023, 52(6): 925-931. doi: 10.12178/1001-0548.2023108
[4]	蒲晓蓉, 陈佳俊, 高励, 赵越, 罗纪翔, 刘军池, 任亚洲. MRI图像降噪技术综述 . 电子科技大学学报, 2023, 52(4): 568-577. doi: 10.12178/1001-0548.2022248
[5]	郭峰, 陈中舒, 代久双, 吴云峰, 刘军, 张昌华. 基于动态先验特征的包覆药多类型外观缺陷深度检测框架 . 电子科技大学学报, 2023, 52(6): 872-879. doi: 10.12178/1001-0548.2022326
[6]	李晨亮, 吴鸿涛. 基于梯度相似性的自动作文评分多主题联合预训练方法 . 电子科技大学学报, 2022, 51(4): 558-564. doi: 10.12178/1001-0548.2022061
[7]	罗欣, 陈艳阳, 耿昊天, 许文波, 张民. 基于深度强化学习的文本实体关系抽取方法 . 电子科技大学学报, 2022, 51(1): 91-99. doi: 10.12178/1001-0548.2021162
[8]	李林, 范明钰, 郝江涛. 基于对抗攻击的图像隐写策略搜索 . 电子科技大学学报, 2022, 51(2): 259-263. doi: 10.12178/1001-0548.2021335
[9]	赵夫群, 戴翀, 耿国华. 基于特征融合的文物碎片模型检索 . 电子科技大学学报, 2021, 50(2): 225-230. doi: 10.12178/1001-0548.2020281
[10]	杨旺功, 淮永建, 张福泉. 基于Gabor及深度神经网络的葡萄种子分类 . 电子科技大学学报, 2020, 49(1): 131-138. doi: 10.12178/1001-0548.2019164
[11]	邹昆, 王伟灿, 董帅, 李文生. 基于堆叠沙漏网络的量体特征点定位 . 电子科技大学学报, 2020, 49(5): 709-717. doi: 10.12178/1001-0548.2019122
[12]	吴涢晖, 赵子天, 陈晓雷, 邹士亚. 大气低频声信号识别深度学习方法研究 . 电子科技大学学报, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
[13]	曹占涛, 杨国武, 陈琴, 吴尽昭, 李晓瑜. 基于修正标签分布的乳腺超声图像分类 . 电子科技大学学报, 2020, 49(4): 597-602. doi: 10.12178/1001-0548.2020001
[14]	邓钰, 雷航, 李晓瑜, 林奕欧. 用于目标情感分类的多跳注意力深度模型 . 电子科技大学学报, 2019, 48(5): 759-766. doi: 10.3969/j.issn.1001-0548.2019.05.016
[15]	邵杰, 黄茜, 曹坤涛. 基于深度学习的人体解析研究综述 . 电子科技大学学报, 2019, 48(5): 644-654. doi: 10.3969/j.issn.1001-0548.2019.05.001
[16]	周雪, 曹爽, 何香静, 邹见效. 基于特征点匹配对平面相似度的图像拼接 . 电子科技大学学报, 2017, 46(6): 877-882. doi: 10.3969/j.issn.1001-0548.2017.06.015
[17]	林奕欧, 雷航, 李晓瑜, 吴佳. 自然语言处理中的深度学习：方法及应用 . 电子科技大学学报, 2017, 46(6): 913-919. doi: 10.3969/j.issn.1001-0548.2017.06.021
[18]	李彦冬, 雷航, 郝宗波, 唐雪飞. 基于多尺度显著区域特征学习的场景识别 . 电子科技大学学报, 2017, 46(3): 600-605. doi: 10.3969/j.issn.1001-0548.2017.03.020
[19]	陈姝, 梁文章. 结合特征点匹配及深度网络检测的运动跟踪 . 电子科技大学学报, 2016, 45(2): 246-251.
[20]	翟东海, 段维夏, 鱼江. 基于双十字TV模型的图像修复算法 . 电子科技大学学报, 2014, 43(3): 432-436. doi: 10.3969/j.issn.1001-0548.2014.03.020

点击查看大图

图(4) / 表(2)

计量

文章访问数: 5018
HTML全文浏览量: 1600
PDF下载量: 86
被引次数: 0

全文HTML

图像修复是为了补全图像的破损区域或信息缺失区域，进而得到理想的视觉效果。目前修复损坏的图像方法可以大致分为3种：1)基于偏微分方程的修复方法；2)基于图像样本块的纹理合成算法；3)基于神经网络的图像修复算法。其中，基于偏微分方程方法仅适用于小区域图像修复，如附加文字、噪声、划痕去除等，目前已基本成熟。传统基于样本块的纹理合成算法只能从破损图像中提取有用信息，信息来源有限，无法修复复杂的结构和纹理信息。而基于深度学习的图像修复算法虽然可以获得更多的有用信息，但训练时间长，纹理合成效果往往不够理想。

为解决上述问题，本文提出一种破损图像的相似度计算方法，通过在数据库中寻找相似图像来为图像修复提供更多的有用信息。使用基于图像配准的方法实现破损图像与其相似图像的粗略对齐。最后，通过改进最佳匹配块搜索方法和匹配准则来提高纹理合成效果。仿真实验结果证明了本算法的有效性。

1. 大区域图像修复算法

文献[1]提出了基于图像样本块的经典纹理合成修复算法，利用图像待修复区域周围的纹理结构信息，计算优先权和相似度，从中提取特征对破损区域进行修复，可以获得比较理想的图像修复效果。在此基础上，研究者提出了许多改进算法，例如：文献[2]重新定义了优先级计算函数，可自适应确定样本块大小；文献[3]生成了5个具有不同初始化的图像，通过适当混合可产生更好的修复结果；文献[4]使用图像结构张量来检测图像的基本结构，并重新制定优先级函数；文献[5]提出了一种改进的补丁距离，可以改善纹理补丁的比较，并解决了初始化和金字塔等级数选择的关键问题；文献[6]通过添加梯度信息，利用样本块的结构、对比度和亮度来确定最优样本块大小。

此外，文献[7]通过优化离散马尔可夫随机场，保证结构和纹理信息的正确传播，同时提出了优先级置信度传播(p-BP)；文献[8]提出首先在输入图像的粗糙版本上执行修复，然后使用分层的超分辨率算法来恢复丢失区域的详细信息；文献[9]根据图像的上下文将图像分为可变大小的块，可以限制候选块的搜索范围。

近年来，卷积神经网络(convolutional neural networks, CNN)^[10]和生成对抗性网络(generative adversarial networks, GAN)^[11]技术的快速发展，为图像修复领域提供了新的方法和方向。文献[12]首次提出用编码器－解码器结构结合卷积神经网络和GAN进行图像修复；文献[13]将图像修复描述为一个图像生成问题，基于上下文编码器，使用一个经过对抗性损失训练的卷积神经网络进行处理；文献[14]采用一种全卷积神经网络，利用全局鉴别器和局部鉴别器进行预测，并提出了一种上下文注意力机制；文献[15]提出采用门控卷积和频谱归一化鉴别器，以及一个基于补丁的GAN损失函数进行修复；文献[16]利用级联生成对抗网络来修复人脸图像，可以获得更高质量的修复效果。

在目前大区域图像修复算法中，基于样本块的纹理合成算法，以及基于MRF的置信度传播算法，都是从图像已知区域中获取相关信息，不能实现复杂场景结构及相关纹理的自动修复，效果不佳。而基于深度学习的修复方法，能有效地利用图像的语义信息，可从图像库中获得更加丰富的图像信息，有效提高修复质量。但当图像缺失区域较大，图像内容比较丰富时，容易出现如图像模糊、纹理失真、边界伪影等问题。