2. 中北大学 生物医学成像与影像大数据山西省重点实验室,太原 030051;
3. 中北大学 军民融合协同创新研究院, 太原 030051
2. Shanxi Province Key Laboratory for Biomedical Imaging and Big Data, North University of China, Taiyuan 030051, China;
3. Institute for Civ-Mil Integration and Collaborative Innovation, North University of China, Taiyuan 030051, China
开放科学(资源服务)标志码(OSID):
计算机断层扫描(Computed Tomography,CT)成像技术是现代临床医疗影像学诊断的常用手段。然而,常规X射线CT扫描的放射性较高,会对人体造成一定的危害。低剂量CT(Low-Dose CT,LDCT)[1]通过降低X射线管电压或管电流,以减弱放射性造成的伤害,但同时也降低成像质量。如何改善LDCT的成像质量成为医学影像处理的研究热点。
目前,改善LDCT图像质量的研究方法主要分为投影域去噪算法、改进重建算法和图像域去噪算法[2]。其中图像域去噪算法是基于稀疏表示的K-SVD(K-Singular Value Decomposition)算法[3-4],在去除轻度噪声伪影方面取得了良好的效果,但是基于质量退化严重的LDCT图像学习到的字典原子中包含较多的噪声原子,无法有效地去除噪声[5]。针对上述问题,文献[6]提出分类字典的概念,通过对字典原子进行区分,提升K-SVD算法的去噪性能。文献[7]提出一种基于正则化方法的K-SVD算法,通过在字典原子更新时引入正则项,改善去噪效果。文献[8]提出一种深层字典学习算法,能够更好地保留图像边缘和细节信息,但在去除噪声伪影方面表现一般。文献[9]提出一种基于卷积神经网络的LDCT图像去噪方法,通过学习LDCT图像与其噪声图像之间的映射关系,从而改进去噪效果。然而,LDCT图像与正常剂量的CT图像难以对应。
为改善LDCT图像质量,本文将改进的VGG[10-12]网络与深层字典相结合,提出一种LDCT图像去噪算法。构建适合字典原子分类的VGG网络模型,并将其应用于学习到深层字典的第一层字典原子中,同时根据分类结果将稀疏矩阵中噪声原子对应的元素设置为零,从而降低噪声原子对图像去噪效果的影响。
1 K-SVD算法K-SVD算法是在最优方向算法(MOD)[13]的基础上提出的。MOD算法的目标函数如式(1)所示:
$ \mathrm{m}\mathrm{i}\mathrm{n}\sum \limits_{i}\left|\right|{x}_{i}|{|}_{0}\mathrm{s}.\mathrm{t}.\left|\right|Y-D\boldsymbol{X}|{|}_{\mathrm{F}}^{2}\le \varepsilon $ | (1) |
其中:D为字典原子;Y为样本数据集;
MOD算法通过实现表征误差最小化来更新字典,即在公式两端对D求偏导。整个字典的更新过程如式(2)所示:
$ {D}^{n+1}=Y({\boldsymbol{X}}^{n}{)}^{\mathrm{T}}\times ({\boldsymbol{X}}^{n}({\boldsymbol{X}}^{n}{)}^{\mathrm{T}}{)}^{-1} $ | (2) |
该运算需要对矩阵求逆,会耗费大量的计算资源。K-SVD算法每次只更新一个字典原子和对应的稀疏编码向量,直至更新完所有的字典原子。本文假设图像
1)稀疏编码阶段
稀疏编码阶段可以描述为求解模型,其过程如式(3)所示:
$ X=\mathrm{a}\mathrm{r}\mathrm{g}\;\mathrm{ }\mathrm{m}\mathrm{i}\mathrm{n}\mathrm{ }\left|\right|y-D\boldsymbol{X}|{|}_{\mathrm{F}}^{2} \mathrm{s}.\mathrm{t}.\left|\right|\boldsymbol{X}|{|}_{0}\le {T}_{0} $ | (3) |
其中:
2)字典学习阶段
字典学习阶段主要是根据稀疏矩阵
$ \left|\right|Y-D\boldsymbol{X}|{|}_{\mathrm{F}}^{2}=\sum \limits_{i=1}^{L}\left|\right|{Y}_{i}-D{X}_{i}|{|}_{F} $ | (4) |
$ \underset{D}{\mathrm{m}\mathrm{i}\mathrm{n}}\left|\right|Y-D\boldsymbol{X}|{|}_{\mathrm{F}}^{2}\mathrm{s}.\mathrm{t}.|\left|{X}_{i}\right|{|}_{0}\le 0 $ | (5) |
其中:
深度学习[16]已发展出众多网络模型,其中适用于图像识别与分类的卷积神经网络是一种专门用来处理具有相似网格结构数据的神经网络[17-18]。VGG-16网络结构如图 1所示。
![]() |
Download:
|
图 1 VGG-16网络结构 Fig. 1 Structure of VGG-16 network |
VGG网络是轻量级卷积神经网络中分类性能表现较优的网络模型之一。与AlexNet[19]网络相比,VGG网络最主要的特点是采用多个堆叠的
本文在VGG-16网络的基础上,通过去掉池化层和部分全连接层,并引入直连通道[20]构建区分噪声原子和信息原子的网络模型,如图 2所示。
![]() |
Download:
|
图 2 改进的VGG网络结构 Fig. 2 Structure of improved VGG network |
该模型主要包含5个卷积段、1个全连接层以及2个标签的Softmax层。5个卷积段总共包含13个卷积层,卷积核尺寸均为
SNIGDHA等通过将字典学习和深度学习的概念相结合,基于K-SVD算法提出了深层字典学习的概念。但是,单层字典的收敛条件并不适用于深层字典,并且在学习深层字典时,需要求解的参数增多,由于训练数据有限,会导致过拟合现象。为此,深层字典采用贪婪方式[21]学习字典,并将第1层学习到的特征作为第2层的输入。字典的求解可以是稠密或者稀疏的,稠密求解模型如式(6)所示:
$ \underset{D, X}{\mathrm{m}\mathrm{i}\mathrm{n}}\left|\right|Y-D\boldsymbol{X}|{|}_{2}^{2} $ | (6) |
其中:
$ {\boldsymbol{X}}_{k}\leftarrow \underset{X}{\mathrm{m}\mathrm{i}\mathrm{n}}\left|\right|Y-{D}_{k-1}\boldsymbol{X}|{|}_{2}^{2} $ |
$ {D}_{k}\leftarrow \underset{D}{\mathrm{m}\mathrm{i}\mathrm{n}}\left|\right|Y-D{\boldsymbol{X}}_{k}|{|}_{2}^{2} $ | (7) |
其中:
$ \underset{D, Z}{\mathrm{m}\mathrm{i}\mathrm{n}}\left|\right|Y-D\boldsymbol{X}|{|}_{2}^{2}+\lambda |\left|\boldsymbol{X}\right|{|}_{1} $ | (8) |
式(8)也可以通过交替最小化来求解,如式(9)所示:
$ {\boldsymbol{X}}_{k}\leftarrow \underset{X}{\mathrm{m}\mathrm{i}\mathrm{n}}\left|\right|Y-{D}_{k-1}\boldsymbol{X}|{|}_{2}^{2}+\lambda |\left|\boldsymbol{X}\right|{|}_{1} $ |
$ {D}_{k}\leftarrow \underset{D}{\mathrm{m}\mathrm{i}\mathrm{n}}\left|\right|Y-D{\boldsymbol{X}}_{k}|{|}_{2}^{2} $ | (9) |
若字典层数为N层,求解如式(10)~式(13)所示:
$ Y={D}_{1}{\boldsymbol{X}}_{1} $ | (10) |
$ {\boldsymbol{X}}_{1}={D}_{2}{\boldsymbol{X}}_{2} $ | (11) |
$ {\boldsymbol{X}}_{2}={D}_{3}{\boldsymbol{X}}_{3} $ | (12) |
︙
$ {\boldsymbol{X}}_{N-1}={D}_{N}{\boldsymbol{X}}_{N} $ | (13) |
此时
$ Y={D}_{1}{D}_{2}\cdots {D}_{N}{\boldsymbol{X}}_{N} $ | (14) |
其中:
深层字典通过学习多层字典来提取数据的特征,但对于LDCT图像而言,深层字典无法区分图像中的结构信息和噪声信息。因此,深层字典学习到的字典原子中仍含有较多的噪声原子,导致深层字典在处理LDCT图像时,虽然能够较好地保留图像的结构信息,但是无法有效抑制噪声对LDCT图像质量的影响。
3.2 改进的深层字典学习算法尽管深层字典可以学习到更多的图像细节信息,但深层字典的去噪能力较差,而LDCT图像通常噪声强度较高。为提高深层字典的去噪性能和改善LDCT图像质量,本文通过改进的VGG网络对深层字典学习算法进行相应的改进,算法结构如图 3所示。
![]() |
Download:
|
图 3 改进的深层字典学习算法结构 Fig. 3 Structure of improved deep dictionary learning algorithm |
本文所提的算法采用3层结构。第1层采用稀疏求解,字典大小设置为
![]() |
Download:
|
图 4 区分字典原子示意图 Fig. 4 Schematic diagram of distinguishing dictionary atomic |
![]() |
Download:
|
图 5 稀疏矩阵中噪声原子所对应元素置零示意图 Fig. 5 Schematic diagram of zeroing elements corresponding to noise atoms in sparse matrix |
这个过程如式(15)所示:
$ Y={D}_{1}{\boldsymbol{X}}_{1}\to Y={D}_{1}{\boldsymbol{X}}_{1}^{\text{'}} $ | (15) |
为保留图像中更多结构和边缘信息,字典的第2层和第3层均采用稠密求解,字典大小分别设置为
$ {\boldsymbol{X}}_{1}^{\text{'}}={D}_{2}{\boldsymbol{X}}_{2} $ | (16) |
$ {\boldsymbol{X}}_{2}={D}_{3}{\boldsymbol{X}}_{3} $ | (17) |
去噪图像
$ Y={D}_{1}{D}_{2}{D}_{3}{\boldsymbol{X}}_{3} $ | (18) |
本文算法主要分为以下7个步骤:
1)输入原始LDCT图像
2)利用式(7)得到字典
3)利用改进的VGG网络将字典
4)将稀疏矩阵
5)利用式(16)得到字典
6)利用式(17)得到字典
7)利用式(18)输出去噪图像
本文采用的数据集是原始LDCT仿真图像,通过K-SVD算法学习字典原子图像块,字典大小设置为
本文实验将
图 6为在迭代训练100次时,改进VGG网络模型在训练集和验证集上的损失值和准确率的变化,最终在字典原子数据集上的准确率达到97.7%。
![]() |
Download:
|
图 6 在训练集和验证集上改进VGG网络的损失值和准确率变化 Fig. 6 Change of loss value and accuracy rate of improved VGG network on training set and validation set |
图 7从直观上给出了改进的VGG网络模型对字典原子的分类结果,如图中箭头所示,只有个别字典原子分类错误。
![]() |
Download:
|
图 7 改进VGG网络对字典原子分类结果 Fig. 7 Classification result of improved VGG network to the dictionary atomic |
图 8为不同算法的去噪结果图及局部放大图。从图中可以看出,传统的K-SVD算法在处理LDCT图像时,仍残留较多的噪声伪影,同时损失了边缘和细节信息。正则化K-SVD算法虽然提高了去噪性能,但与传统K-SVD算法相似,损失了较多的细节和边缘信息。传统的深层字典学习算法能够保留较多的细节信息,但仍含有明显的噪声伪影。本文算法在提高去噪性能的同时保留了更多的边缘和细节信息。因此,本文算法在视觉效果上明显优于其他同类算法。
![]() |
Download:
|
图 8 不同算法的去噪结果及局部放大图 Fig. 8 Denoising results of different algorithms and local enlargement images |
表 1为不同算法处理LDCT图像后的评价指标对比。从表中可以看出,本文算法在结构相似性、峰值信噪比和平均绝对误差方面均优于其他同类对比算法。
![]() |
下载CSV 表 1 不同算法处理LDCT图像后的评价指标 Table 1 Evaluation indexes of LDCT images processed with different algorithms |
表 2为本文算法在稀疏度为1,字典原子图像块大小为
![]() |
下载CSV 表 2 不同字典大小对实验结果的影响 Table 2 Influence of different dictionary sizes on experimental results |
为提高LDCT图像质量,本文提出一种基于VGG网络和深层字典的去噪算法,通过改进的VGG网络将深层字典的第一层字典原子区分为信息原子和噪声原子,并将稀疏矩阵中噪声原子所对应的元素置零,从而弥补深层字典学习算法去噪能力的不足。实验结果表明,相比K-SVD、正则化K-SVD和深层字典学习算法,本文算法在提高图像去噪能力的同时保留了较多的边缘和细节信息。后续将通过自适应选取字典大小的最优解,进一步提高算法的去噪效果。
[1] |
沈晓波, 聂生东. 低剂量CT技术发展及其临床应用[J]. 中国医学物理学杂志, 2016, 33(3): 238-242, 247. SHEN X B, NIE S D. Development and clinical application of low-dose CT[J]. Chinese Journal of Medical Physics, 2016, 33(3): 238-242, 247. (in Chinese) |
[2] |
罗立民, 胡轶宁, 陈阳. 低剂量CT成像的研究现状与展望[J]. 数据采集与处理, 2015, 30(1): 24-34. LUO L M, HU Y N, CHEN Y. Research status and prospect of low-dose CT imaging[J]. Data Acquisition and Processing, 2015, 30(1): 24-34. (in Chinese) |
[3] |
YUNN, QIU T S, LIU W H. Medical image fusion based on sparse representation with KSVD[J]. Chinese Journal of Biomedical Engineering, 2019, 28(4): 168-172. |
[4] |
李传朋, 秦品乐, 张晋京. 基于深度卷积神经网络的图像去噪研究[J]. 计算机工程, 2017, 43(3): 253-260. LI C P, QIN P L, ZHANG J J. Research on image denoising based on deep convolutional neural network[J]. Computer Engineering, 2017, 43(3): 253-260. (in Chinese) |
[5] |
杨爱萍, 田玉针, 何宇清, 等. 基于改进K-SVD和非局部正则化的图像去噪[J]. 计算机工程, 2015, 41(5): 249-253. YANG A P, TIAN Y Z, HE Y Q, et al. Image denoising based on improved K-SVD and non-local regularization[J]. Computer Engineering, 2015, 41(5): 249-253. (in Chinese) |
[6] |
CHEN Y, SHI L Y, FENG Q J, et al. Artifact suppressed dictionary learning for low-dose CT image processing[J]. IEEE Transactions on Medical Imaging, 2014, 33(12): 2271-2292. DOI:10.1109/TMI.2014.2336860 |
[7] |
刘坚桥, 唐加山. 基于正则化模型的K-SVD算法及其应用[J]. 软件导刊, 2018, 17(8): 114-117. LIU J Q, TANG J S. K-SVD algorithm based on regularization model and its application[J]. Software Guide, 2018, 17(8): 114-117. (in Chinese) |
[8] |
TARIYAL S, MAJUMDAR A, SINGH R, et al. Greedy deep dictionary learning[J]. IEEE Access, 2016, 4(11): 10096-10109. |
[9] |
章云港, 易本顺, 吴晨玥, 等. 基于卷积神经网络的低剂量CT图像去噪方法[J]. 光学学报, 2018, 38(4): 123-129. ZHANG Y G, YI B S, WU C Y, et al. A low-dose CT image denoising method based on convolutional neural network[J]. Acta Optica Sinica, 2018, 38(4): 123-129. (in Chinese) |
[10] |
QIAO L B, ZHANG B F, LU X C, et al. Adaptive linearized alternating direction method of multipliers for non-convex compositely regularized optimization problems[J]. Tsinghua Science and Technology, 2017, 22(3): 328-341. DOI:10.23919/TST.2017.7914204 |
[11] |
LI Z B, LI F, ZHU L, et al. Vegetable recognition and classification based on improved VGG deep learning network model[J]. International Journal of Computational Intelligence Systems, 2020, 13(1): 559-564. DOI:10.2991/ijcis.d.200425.001 |
[12] |
XU J C, WANG S M, ZHOU Z J, et al. Automatic CT image segmentation of maxillary sinus based on VGG network and improved V-Net[J]. International Journal of Computer Assisted Radiology and Surgery, 2020, 15(9): 1457-1465. DOI:10.1007/s11548-020-02228-6 |
[13] |
沈萍萍, 余勤. 基于离散余弦变换的非局部均值图像去噪算法[J]. 计算机工程与设计, 2017, 38(1): 183-186. SHEN P P, YU Q. Non-local mean image denoising algorithm based on discrete cosine transform[J]. Computer Engineering and Design, 2017, 38(1): 183-186. (in Chinese) |
[14] |
WANG R, ZHANG J L, REN S L, et al. A reducing iteration orthogonal matching pursuit algorithm for compressive sensing[J]. Tsinghua Science and Technology, 2016, 21(1): 71-79. DOI:10.1109/TST.2016.7399284 |
[15] |
王科平, 杨赞亚, 恩德. 基于分类冗余字典稀疏表示的图像压缩方法[J]. 计算机工程, 2017, 43(9): 281-287. WANG K P, YANG Z Y, EN D. Image compression method based on sparse representation of classified redundant dictionary[J]. Computer Engineering, 2017, 43(9): 281-287. (in Chinese) |
[16] |
张顺, 龚怡宏, 王进军. 深度卷积神经网络的发展及其在计算机视觉领域的应用[J]. 计算机学报, 2019, 42(3): 453-482. ZHANG S, GONG Y H, WANG J J. The development of deep convolutional neural network and its application in the field of computer vision[J]. Chinese Journal of Computers, 2019, 42(3): 453-482. (in Chinese) |
[17] |
桂江生, 麻陈飞, 包晓安, 等. 递归深度混合关注网络的细粒度图像分类方法[J]. 计算机工程, 2018, 45(5): 205-209. GUI J S, MA C F, BAO X A, et al. Fine-grained image classification method for recurrent deep hybrid attention network[J]. Computer Engineering, 2018, 45(5): 205-209. (in Chinese) |
[18] |
周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6): 1229-1251. ZHOU F Y, JIN L P, DONG J. A review of research on convolutional neural networks[J]. Chinese Journal of Computers, 2017, 40(6): 1229-1251. (in Chinese) |
[19] |
段友祥, 李钰, 孙歧峰, 等. 改进的Alexnet模型及在油井示功图分类中的应用[J]. 计算机应用与软件, 2018, 35(7): 226-230, 272. DUAN Y X, LI Y, SUN Q F, et al. Improved Alexnet model and its application in oil well indicator diagram classification[J]. Computer Application and Software, 2018, 35(7): 226-230, 272. (in Chinese) |
[20] |
ASSAD M B, KICZALES R. Deep biomedical image classfication using diagonal bilinear interpolation and resuial network[J]. International Journal of Interligent Network, 2020, 1(1): 148-156. |
[21] |
陈晨. 贪婪算法在稀疏学习中的应用[D]. 武汉: 湖北大学, 2016. CHEN C. Application of greedy algorithm in sparse learning[D]. Wuhan: Hubei University, 2016. (in Chinese) |
[22] |
WU J F, DAI F, HU G, et al. Low dose CT reconstruction via L1 norm dictionary learning using alternating minimization algorithm and balancing principle[J]. Journal of X-ray Science and Technology, 2018, 26(4): 1-20. |