2. 武汉大学 资源与环境科学学院, 武汉 430079;
3. 地球空间信息技术协同创新中心, 武汉 430079
2. School of Resource and Environmental Sciences, Wuhan University, Wuhan 430079, China;
3. Collaborative Innovation Center of Geospatial Technology, Wuhan 430079, China
开放科学(资源服务)标志码(OSID):
图像分辨率是度量图像质量最为重要的指标之一,图像分辨率越高,能够观察到的细节越多[1]。由于医学图像处理[2]、遥感卫星侦察[3]、视频监控应用[4]及其他许多领域的实际需要,人们对图像质量的要求越来越高。然而,由于获取图像时的外部条件和图像系统的限制,在图像的成像、传输、存储过程中,会产生模糊、畸形和噪声等降质情况。通过改进光学技术和图像传感器来提升分辨率,需要花费较高的经济成本,而且图像质量的提高也存在极限[1]。图像超分辨率重建通过对多幅具有互补信息的低分辨率图像进行处理,重构出一幅或多幅高分辨率图像[5],可以有效克服现有图像系统的固有分辨率限制,提升图像应用能力[6]。
根据输入低分辨率图像的数量,超分辨率重建方法分为单幅超分辨率重建和多幅超分辨率重建两大类。多幅超分辨率重建技术由TSAI等[7]于1984年提出,其利用多幅具有亚像素位移的图像提高空间分辨率的频率域。之后,一些学者在此基础上进行了改进和发展[8-10]。目前,国内外学者已经构建了多个空域处理的框架[11-13],其中,基于最大后验估计(MAP)的方法引入正则化理论[13-15],能够有效、灵活地在解空间添加先验约束条件[16],成为当前研究的主流框架模型。然而,在很多实际应用中,利用有限数量的先验参数模型很难获得大量自然图像的各种特征,同时,由于缺乏足够数量的低分辨率退化图像,重建过程中所能够利用的帧间互补信息有限,多幅超分辨率重建技术存在缺少高频细节信息的缺点。
单幅超分辨率重建可以分为基于插值的方法[17]、基于重建的方法[18]和基于学习的方法[19]。目前,基于学习的方法在单幅超分辨率重建的研究上取得了很大的成功,DONG等[20]构建了三层卷积神经网络SRCNN,并构造一个端到端的重建网络,但这种浅层的深度网络结构,重建的结果完全依赖于学习的特征,缺乏高频细节。为获得更好的超分性能,KIM等[21]在SRCNN的基础上,在CNN训练中加入了残差和递归结构,以便在单幅超分辨率重建中可以有效训练深层神经网络结构。针对基于学习超分辨率重建存在边缘信息丢失、易产生视觉伪影等问题,谢珍珠等[22]提出基于边缘增强的深层网络结构用于图像的超分辨率重建。然而,这些方法的结果依赖于训练数据与测试数据的相似性,结果并不可信,而且仅使用外部先验可能会产生一些伪影。
综上所述,将多幅超分和单幅超分相结合是进一步提高超分辨率性能的有效途径[23-24]。本文提出一种结合内外部梯度先验的图像超分辨率重建方法。集成深度学习方法的外部梯度先验和
在超分辨率重建过程中,低分辨率观测图像可以看作是由高分辨率场景经过一系列的降质过程(包括几何运动、光学模糊、降采样以及附加噪声等)产生[5]。现实环境中的低分辨率序列图像在获取过程中经历的模糊程度大致相同,可以得到如下图像观测模型:
$ {g_k} = \mathit{\boldsymbol{DB}}{\mathit{\boldsymbol{M}}_k}z + {n_k} $ | (1) |
其中:
基于图像观测模型,由于低分辨率图像中包含的信息不足以求解高分辨率图像,超分辨率重建被证明是一个不适定反问题[25]。而正则化项包含高分解的先验信息,可以补偿丢失的高频细节,因此,有必要在模型中引入特定的正则化项以获得稳定解。本文采用基于最大后验估计(MAP)的超分辨率重建方法,对上述病态问题进行有效的正则化约束,转化成如下能量泛函最优化问题,通过最小化目标函数来获得最优的高分图像:
$ \widehat{z}=\underset{z}{\mathrm{a}\mathrm{r}\mathrm{g}\mathrm{m}\mathrm{i}\mathrm{n}}\left\{\sum\limits _{k=1}^{m}{‖{g}_{k}-\mathit{\boldsymbol{D}}\mathit{\boldsymbol{B}}{\mathit{\boldsymbol{M}}}_{k}z‖}_{2}^{2}+\lambda U\left(z\right)\right\} $ | (2) |
其中:
本文基于最大后验估计框架,提出一种结合内外部梯度先验的图像超分辨率重建方法。通过联合利用外部梯度先验和内部梯度先验的互补优势,借助高分梯度信息来重建高分辨率图像。模型表达式如式(3)所示:
$ \widehat{z}=\underset{z}{\mathrm{a}\mathrm{r}\mathrm{g}\mathrm{m}\mathrm{i}\mathrm{n}}\left\{\sum\limits _{k=1}^{m}{‖{g}_{k}-\mathit{\boldsymbol{D}}\mathit{\boldsymbol{B}}{\mathit{\boldsymbol{M}}}_{k}z‖}_{2}^{2}+\lambda {G}_{\mathrm{e}\mathrm{x}\mathrm{t}\mathrm{e}\mathrm{r}\mathrm{n}\mathrm{a}\mathrm{l}}(\nabla z)+\\ \;\;\;\;\;\beta {G}_{\mathrm{i}\mathrm{n}\mathrm{t}\mathrm{e}\mathrm{r}\mathrm{n}\mathrm{a}\mathrm{l}}(\nabla z)\right\} $ | (3) |
其中:
![]() |
Download:
|
图 1 本文方法重建流程 Fig. 1 Reconstruction procedure of the proposed method |
梯度域在一定程度上有效地反映了自然图像的高频细节和边缘信息,对于外部梯度先验,可以用式(4)表示:
$ {G_{{\rm{external}}}}(\nabla z) = \lambda \left\| {\nabla z - \nabla {\mathit{\boldsymbol{z}}_e}} \right\|_2^2 $ | (4) |
其中:
$ {G}_{\mathrm{e}\mathrm{x}\mathrm{t}\mathrm{e}\mathrm{r}\mathrm{n}\mathrm{a}\mathrm{l}}(\nabla z)={\lambda }_{1}{‖{\nabla }_{x}z-{\nabla }_{x}{z}_{e}‖}_{2}^{2}+{\lambda }_{2}{‖{\nabla }_{y}z-{\nabla }_{y}{z}_{e}‖}_{2}^{2} $ | (5) |
利用深度网络估计的初步高分辨率图像的梯度,分别在水平和垂直方向进行梯度约束,
![]() |
Download:
|
图 2 基于深度递归残差网络的超分辨率重建 Fig. 2 Super-resolution reconstruction based on deep recursive residual network |
在本文的深度递归残差网络中,使用291幅图像构造训练数据集,其中91幅图像来自YANG等[27]提出的稀疏编码超分辨率重建方法,200幅图像来自BSD数据集[28]。为丰富图像训练集,更好地提取图像特征,提高数据集的泛化能力,对291幅图像的训练数据集进行数据增强,主要包括图像的翻转和旋转,其中图像旋转的角度为
在MAP图像超分辨率重建模型中,常用的先验模型有拉普拉斯先验、TV先验、马尔科夫随机场先验等,但由于亮度先验是基于独立像素而不是相邻像素的差值,在图像恢复中引入了严重的噪声和伪影,而梯度先验是基于相邻像素之间的差异,使得恢复后的图像具有较少的伪影[29]。本文为有效保留纹理细节信息,提高重建图像质量,在多幅图像超分辨率重建中采用了亮度和梯度联合约束先验,构建的
$ {G}_{\mathrm{i}\mathrm{n}\mathrm{t}\mathrm{e}\mathrm{r}\mathrm{n}\mathrm{a}\mathrm{l}}(\nabla z)=\beta ({‖z‖}_{0}+{‖\nabla z‖}_{0}) $ | (6) |
利用光流估计方法[30]获得运动位移参数
$ \widehat{z}=\underset{z}{\mathrm{a}\mathrm{r}\mathrm{g}\mathrm{m}\mathrm{i}\mathrm{n}}\left\{\begin{array}{l}\sum\limits _{k}^{K}{‖{g}_{k}-{W}_{k}z‖}_{2}^{2}+\lambda {‖\nabla z-\nabla {\mathit{\boldsymbol{z}}}_{e}‖}_{2}^{2}+\\ \beta ({‖z‖}_{0}+{‖\nabla z‖}_{0})\end{array}\right\} $ | (7) |
重建模型中存在
$ \begin{array}{l}\widehat{z}=\underset{z}{\mathrm{a}\mathrm{r}\mathrm{g}\mathrm{m}\mathrm{i}\mathrm{n}}\left\{\begin{array}{l}\sum\limits _{k}^{m}{‖{g}_{k}-{W}_{k}z‖}_{2}^{2}+\lambda {‖\nabla z-\nabla {\mathit{\boldsymbol{z}}}_{e}‖}_{2}^{2}+\\ \beta ({‖u‖}_{0}+{‖v‖}_{0})\end{array}\right\} \\ \mathrm{s}.\mathrm{t}. u=z, v=\nabla z\end{array} $ | (8) |
利用增广拉格朗日的方法,将式(8)转为无约束的优化问题:
$ \widehat{z}=\underset{z}{\mathrm{a}\mathrm{r}\mathrm{g}\mathrm{m}\mathrm{i}\mathrm{n}}\left\{\begin{array}{l}\sum\limits _{k}^{K}{‖{g}_{k}-{W}_{k}z‖}_{2}^{2}+\lambda {‖\nabla z-\nabla {\mathit{\boldsymbol{z}}}_{e}‖}_{2}^{2}+\\ \frac{\alpha }{2}{‖z-u‖}_{2}^{2}+\frac{\mu }{2}{‖\nabla z-v‖}_{2}^{2}+\\ \beta ({‖u‖}_{0}+{‖v‖}_{0})\end{array}\right\} $ | (9) |
其中:
本文针对的实验对象是自然图像,将通过模拟实验来验证本文所采用方法对于自然图像信息重建的有效性,并分别用双三次内插法、自适应自回归(ASAR)方法[32]、深度递归残差网络(DRRN)方法[26]、亮度-梯度联合约束(L0RIG)方法[33]和本文方法对实验图像进行重建实验,比较分析本文方法的重建效果。实验以多帧序列图像中的参考图像作为DRRN的输入图像,输出得到初步的高分辨率图像
![]() |
Download:
|
图 3 内外部梯度联合约束超分辨率重建模型 Fig. 3 External and internal gradient joint constraint super-resolution reconstruction model |
实验中的图像如图 4所示。对于每一幅原高分辨率图像,根据式(1)的图像观测模型,可以得到4幅具有0.5个像素位移的模拟图像。模糊函数采用支持域为7×7、方差为1的高斯模糊;通过隔像素取平均的方法对降质图像进行降采样,采样因子设为2;最后每组图像得到4幅低分辨率图像,在实验中将使用这5组图像进行实验。为评估重建图像的质量,采用峰值信噪比(Peak Signal to Noise Ratio,PSNR)和结构相似性(Structure Similarity,SSIM)指数作为的评价标准,PSNR和SSIM值越大,表示重建结果越理想。
![]() |
Download:
|
图 4 超分辨率模拟实验图像 Fig. 4 Super-resolution simulation experiment image |
在模拟序列图像实验中,将本文联合重建方法与三次内插法、ASAR方法[32]、DRRN方法[26]、L0RIG方法[33]处理的结果进行对比分析。以图 4中的图像作为模拟实验数据,图 5和图 6给出了不同超分辨率方法的重建结果,矩形显示了重建图像的放大区域,以比较不同方法的定性性能,表 1为定量评价指标PSNR和SSIM的结果。在视觉效果上,相比其他4种对比方法,本文方法能够提供更多的高频细节信息,有效减少噪声和伪影。而ASAR方法[32]的重建结果性能最差,缺少对高频信息的恢复。DRRN方法[26]的重建结果噪声去除性能最好,但有些边缘被过度平滑,在图 5(c)中,将Lean图像重建结果中选择的区域放大后的图像显示,DRRN方法[26]由于振环伪影效应导致Lean图像的眼睛区域存在错误重建。L0RIG方法[33]的结果中明显存在多处不理想的边缘伪影,虽然能够恢复一些丢失的细节,但不能抑制图像上的噪声。从图 5显示的放大区域可以清晰辨别内外梯度先验联合约束的方法,在超分辨率过程中对图像细节信息的恢复能力要远胜于其他几种超分辨率重建方法,能够获得更好的定量指标。
![]() |
Download:
|
图 5 Lena在不同方法下的重建结果对比 Fig. 5 Comparison of reconstruction results of Lena under different methods |
![]() |
Download:
|
图 6 Parrot在不同方法下的重建结果对比 Fig. 6 Comparison of reconstruction results of Parrot under different methods |
![]() |
下载CSV 表 1 不同重建方法的定量结果比较 Table 1 Quantitative results comparison for different reconstruction methods |
表 1给出了实验中具体的PSNR和SSIM评价指标结果,根据PSNR和SSIM两种客观评价指标,在对Monarch图像的实验中,ASAR方法[32]的PSNR值为22.581 dB,DRRN方法[26]的PSNR值为23.706 dB,L0RIG方法[33]的PSNR值为24.037 dB,本文方法的PSNR值为25.763 dB。定量结果表明了本文方法有效提高了超分辨率重建性能,通过结合深度学习的外部梯度先验和
本文展示了两组真实实验,文本和磁盘的真实图像灰度序列是多维信号处理研究组(MDSP)基准数据集[34]的一部分。在真实实验中,无法用PSNR和SSIM等指标定量地比较不同超分辨率方法的重建结果,本文采用主观评价的方法对图像质量进行评价。将序列图像的中间帧作为本次重构的参考图像帧,将图 7(a)和图 8(a)选为参考图像。图 7(b)和图 8(b)为双三次内插结果,图 7(c)和图 8(c)为ASAR方法[32]重建结果,图 7(d)和图 8(d)为DRRN方法[26]重建结果,图 7(e)和图 8(e)为L0RIG方法[33]重建结果,图 7(f)和图 8(f)为本文方法重建结果。
![]() |
Download:
|
图 7 Text在不同方法下的真实图像重建结果对比 Fig. 7 Comparison real image reconstruction results of Text under different methods |
![]() |
Download:
|
图 8 Disk在不同方法下的真实图像重建结果对比 Fig. 8 Real image reconstruction results of Disk under different methods |
为了更好地进行视觉比较,将图 7和图 8中部分方框区域分别进行放大显示,该方法还能较好地保留真实图像中的细节信息,表明超分辨图像具有较好的视觉质量。从对比结果可以看出,本文算法和亮度-梯度联合方法都能得到比三次卷积内插结果质量更好的高分辨率图像,同时,本文算法在视觉上明显优于ASAR方法[32]和DRRN方法[26],重建结果有效的减少图像中存在的模糊和噪声,增强图像的细节信息,能更清晰地重建出图像上的文字等细节。
3 结束语本文提出一种基于内外部梯度先验联合约束的图像超分辨率重建方法,利用深度学习的外部梯度先验和
[1] |
FAN C, WU C, LI G, et al. Projections onto convex sets super-resolution reconstruction based on point spread function estimation of low-resolution remote sensing images[J]. Sensors, 2017, 17(2): 362. DOI:10.3390/s17020362 |
[2] |
ISAAC J S, KULKARNI R. Super resolution techniques for medical image processing[C]//Proceedings of 2015 International Conference on Technologies for Sustainable Development. Washing D.C., USA: IEEE Press, 2015: 1-6.
|
[3] |
POULIOT D, LATIFOVIC R, PASHER J, et al. Landsat super-resolution enhancement using convolution neural networks and sentinel-2 for training[J]. Remote Sensing, 2018, 10(3): 394. DOI:10.3390/rs10030394 |
[4] |
ZHANG L, ZHANG H, SHEN H, et al. A super-resolution reconstruction algorithm for surveillance images[J]. Signal Processing, 2010, 90(3): 848-859. DOI:10.1016/j.sigpro.2009.09.002 |
[5] |
苏秉华, 金伟其, 牛丽红, 等. 超分辨率图像复原及其进展[J]. 光学技术, 2001, 27(1): 6-9. SU B H, JIN W Q, NIU L H, et al. Super-resolution image restoration and progress[J]. Optical Technology, 2001, 27(1): 6-9. (in Chinese) |
[6] |
NGUYEN K, FOOKES C, SRIDHARAN S, et al. Super-resolution for biometrics: a comprehensive survey[J]. Pattern Recognition, 2018, 78: 23-42. DOI:10.1016/j.patcog.2018.01.002 |
[7] |
TSAI R Y. Multi-frame image restoration and registration[J]. Visual and Image Processing, 1984, 1: 317-339. |
[8] |
MAISELI B J, ALLY N, GAO H. A noise-suppressing and edge-preserving multi-frame super-resolution image reconstruction method[J]. Signal Processing Image Communication, 2015, 34: 1-13. DOI:10.1016/j.image.2015.03.001 |
[9] |
ZHANG H, ZHANG L, SHEN H. A super-resolution reconstruction algorithm for hyperspectral images[J]. Signal Processing, 2012, 92(9): 2082-2096. DOI:10.1016/j.sigpro.2012.01.020 |
[10] |
HE Y, YAP K H, CHEN L, et al. A nonlinear least square technique for simultaneous image registration and super-resolution[J]. IEEE Transactions on Image Processing, 2007, 16(11): 2830-2841. DOI:10.1109/TIP.2007.908074 |
[11] |
SHAH N R, ZAKHOR A. Resolution enhancement of color video sequences[J]. IEEE Transactions on Image Processing, 1999, 8(6): 879-885. DOI:10.1109/83.766865 |
[12] |
IRANI M, PELEG S. Improving resolution by image registration[J]. Graphical Models and Image Processing, 1991, 53(3): 231-239. DOI:10.1016/1049-9652(91)90045-L |
[13] |
LIANG F, XU Y, ZHANG M, et al. A POCS algorithm based on text features for the reconstruction of document images at super-resolution[J]. Symmetry, 2016, 8(10): 102. DOI:10.3390/sym8100102 |
[14] |
SCHULTZ R R, STEVENSON R L. Extraction of high-resolution frames from video sequences[J]. IEEE Transactions on TImage Processing, 1996, 5(6): 996-1011. DOI:10.1109/83.503915 |
[15] |
SHEN H, ZHANG L, HUANG B, et al. A MAP approach for joint motion estimation, segmentation, and super resolution[J]. IEEE Transactions on Image processing, 2007, 16(2): 479-490. DOI:10.1109/TIP.2006.888334 |
[16] |
YUE L, SHEN H, LI J, et al. Image super-resolution: the techniques, applications, and future[J]. Signal Processing, 2016, 128: 389-408. DOI:10.1016/j.sigpro.2016.05.002 |
[17] |
ZHANG L, WU X. An edge-guided image interpolation algorithm via directional filtering and data fusion[J]. IEEE Transactions on Image Processing, 2006, 15(8): 2226-2238. DOI:10.1109/TIP.2006.877407 |
[18] |
SUN J, XU Z, SHUM H Y. Image super-resolution using gradient profile prior[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Washington D.C., USA: IEEE Press, 2008: 1-8.
|
[19] |
DONG C, LOY C C, HE K M, et al. Learning a deep convolutional network for image super-resolution[C]//Proceedings of European Conference on Computer Vision. Berlin, Germany: Springer, 2014: 184-199.
|
[20] |
DONG C, LOY C C, HE K, et al. Image super-resolution using deep convolutional networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 38(2): 295-307. DOI:10.1109/TPAMI.2015.2439281 |
[21] |
KIM J, LEE J K, LEE K M. Accurate image super-resolution using very deep convolutional networks[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Washington D.C., USA: IEEE Press, 2016: 1646-1654.
|
[22] |
谢珍珠, 吴从中, 詹曙. 边缘增强深层网络的图像超分辨率重建[J]. 中国图象图形学报, 2018, 23(1): 114-122. XIE Z, WU C Z, ZHAN S. Image super-resolution reconstruction via deep network based on edge-enhancement[J]. Journal of Image and Graphics, 2018, 23(1): 114-122. (in Chinese) |
[23] |
张慧, 常莉红, 马旭, 等. 一种基于曲波变换与引导滤波增强的图像融合方法[J]. 吉林大学学报(理学版), 2020, 58(1): 113-119. ZHANG H, CHENG L H, MA X, et al. An Image Fusion Method Based on Curvelet Transform and Guided Filter Enhancement[J]. Journal of Jilin University(Science Edition), 2020, 58(1): 113-119. (in Chinese) |
[24] |
KAPPELER A, YOO S, DAI Q, et al. Video super-resolution with convolutional neural networks[J]. IEEE Transactions on Computational Imaging, 2016, 2(2): 109-122. DOI:10.1109/TCI.2016.2532323 |
[25] |
PROTTER M, ELAD M. Super resolution with probabilistic motion estimation[J]. IEEE Transactions on Image Processing, 2009, 18(8): 1899-1904. DOI:10.1109/TIP.2009.2022440 |
[26] |
TAI Y, YANG J, LIU X. Image super-resolution via deep recursive residual network[C]//Proceedings of IEEE Conference on Computer Vision & Pattern Recognition. Washington D.C., USA: IEEE Press, 2017: 346-358.
|
[27] |
YANG J, WRIGHT J, HUANG T, et al. Image super-resolution as sparse representation of raw image patches[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Washington D.C., USA: IEEE Press, 2008: 1-8.
|
[28] |
MARTIN D, FOWLKES C, TAL D, et al. A database of human segmented natural images and its application to evaluating segmentation algorithms and measuring ecological statistics[C]//Proceedings of the 8th IEEE International Conference on Computer Vision. Washington D.C., USA: IEEE Press, 2001: 579-588.
|
[29] |
PAN J, HU Z, SU Z, et al. L0-regularized intensity and gradient prior for deblurring text images and beyond[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(2): 342-355. DOI:10.1109/TPAMI.2016.2551244 |
[30] |
XU L, JIA J, MATSUSHITA Y. Motion detail preserving optical flow estimation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(9): 1744-1757. DOI:10.1109/TPAMI.2011.236 |
[31] |
BOYD S, PARIKH N, CHU E, et al. Distributed optimization and statistical learning via the alternating direction method of multipliers[J]. Foundations and Trends in Machine Learning, 2011, 3(1): 1-122. |
[32] |
LI K, ZHU Y, YANG J, et al. Video super-resolution using an adaptive superpixel-guided auto-regressive model[J]. Pattern Recognition, 2006, 51: 59-71. |
[33] |
孙京, 袁强强, 李冀玮, 等. 亮度-梯度联合约束的车牌图像超分辨率重建[J]. 中国图象图形学报, 2018, 23(6): 802-813. SUN J, YUAN Q Q, LI J W, et al. License plate image super-resolution based on intensity-gradient prior combination[J]. Journal of Image and Graphics, 2018, 23(6): 802-813. (in Chinese) |
[34] |
MDSP SR datasets[EB/OL]. [2020-09-01]. http://users.soe.ucsc.edu/~milanfar/software/sr-datasets.html.
|