«上一篇 下一篇»
  计算机工程  2019, Vol. 45 Issue (7): 273-281  DOI: 10.19678/j.issn.1000-3428.0052534
0

引用本文  

陈扬洋, 钱鹏江, 赵开发, 等. 基于mDixon序列下腹部MRI数据的sCT生成方法[J]. 计算机工程, 2019, 45(7), 273-281. DOI: 10.19678/j.issn.1000-3428.0052534.
CHEN Yangyang, QIAN Pengjiang, ZHAO Kaifa, et al. sCT Generation Method for Abdominal MRI Data Based on mDixon Sequence[J]. Computer Engineering, 2019, 45(7), 273-281. DOI: 10.19678/j.issn.1000-3428.0052534.

基金项目

国家自然科学基金(61772241,61702225);中央高校基本科研业务费专项资金(JUSRP51614A)

作者简介

陈扬洋(1994-), 男, 硕士研究生, 主研方向为医学图像处理、模式识别;
钱鹏江, 教授、博士, E-mail:qianpjiang@jiangnan.edu.cn;
赵开发, 硕士研究生;
苏冠豪, 博士

文章历史

收稿日期:2018-09-03
修回日期:2018-10-08
基于mDixon序列下腹部MRI数据的sCT生成方法
陈扬洋1 , 钱鹏江1 , 赵开发1 , 苏冠豪2     
1. 江南大学 数字媒体学院, 江苏 无锡 214122;
2. 凯斯西储大学 凯斯西储大学附属医院放射科和影像研究中心, 美国 克利夫兰 44106
摘要:为通过磁共振成像(MRI)数据生成合成计算机断层扫描(sCT),根据mDixon序列的下腹部MRI数据,提出迁移模糊聚类(TFCM)与支持向量机相结合的方法。借助病人MRI源数据提供的高级历史知识,利用TFCM对下腹部MRI数据进行处理,采用有监督学习方法对聚类结果投票,完成图像组织分割,并对分割的组织区域赋予相应的CT值来生成sCT。实验结果证明,该方法可以将下腹部MRI数据分割成脂肪、空气、骨头和软组织4类,并准确生成sCT,其预测值绝对误差最小仅为81 HU,相较于FCM方法,分类结果更优。
关键词磁共振成像    合成计算机断层扫描    下腹部    mDixon序列    迁移模糊聚类    有监督学习    
sCT Generation Method for Abdominal MRI Data Based on mDixon Sequence
CHEN Yangyang1 , QIAN Pengjiang1 , ZHAO Kaifa1 , SU Kuanhao2     
1. School of Digital Media, Jiangnan University, Wuxi, Jiangsu 214122, China;
2. Department of Radiology and Case Center for Imaging Research, University Hospitals, Case Western Reserve University, Cleveland 44106, USA
Abstract: In order to generate Synthetic Computed Tomography (sCT) from Magnetic Resonance Imaging (MRI) data, this paper proposes the TFCM-SVM method for the abdominal MRI data based on mDixon seguence.With the advanced historical knowledge provided by the MRI source data of patients, this method uses Transfer Fuzzy Clustering Means (TFCM) to process abdominal MRI data.The supervised learning method is used to perform the final segmentation with voting strategies on the clustering result.Finally, the corresponding CT values are assigned to the segmented tissues to generate sCT.Experimental results show that the method can reliably partition abdominal MRI data into the four groups regarding fat, bone, air, and soft tissue, and robustly generate sCT.The Mean Absolute Prediction Deviation(MAPD) of the prediction value is only 81 HU, which is significantly improved compared with the FCM method.
Key words: Magnetic Resonance Imaging(MRI)    Synthetic Computed Tomography(sCT)    abdomen    mDixon sequence    Transfer Fuzzy Clustering Means(TFCM)    supervised learning    
0 概述

磁共振成像(Magnetic Resonance Imaging, MRI)[1]中的骨骼和空气在光子衰减方面处于极端状态, 除非使用特殊的超短回波时间(Ultra-short Echo Time, UTE)[2]扫描序列或者零回波时间(Zero Echo Time, ZTE)[3]脉冲序列, 否则两者都具有非常低的磁共振(Magnetic Resonance, MR)信号。UTE扫描序列图像质量低、视野不足、扫描时间长, 而ZTE脉冲序列技术上较难实现, 并且在许多临床环境中扫描仪不适合使用, 因此使用这些方法来区分骨骼和空气需要极大代价。尽管mDixon序列对于骨头和空气具有很低的MR信号, 但是相较于UTE和ZTE, mDixon扫描序列的MRI更容易获取, 并且具有更高的图像精度, 是一种常用的MRI扫描序列。

目前已有基于机器学习和模式识别技术的组织分割法, 在mDixon序列MRI的基础上, 将体素分为4种成分(骨头、空气、脂肪和软组织)来生成合成计算机断层扫描(Synthetic Computed Tomography, sCT)[4]而不需要UTE或ZTE数据[5-11]。由于不同的组织和器官特性的差异, 这类方法通常集中在特定的身体部分以实现sCT, 例如, 脑部[5-6]或盆腔[7-8]。这些方法将图像体素分为不同的组织类别, 并使用分类结果生成sCT。此外, 为了使用常见的MRI序列生成sCT, 研究人员提出使用T1加权图像进行脑和骨盆合成CT[9-10]。还有研究人员使用深层卷积神经网络方法处理T1加权图像来生成脑部sCT[11]。尽管这些方法能够产生精确的脑和骨盆sCT, 但是其并不适用于腹部, 这是因为腹部解剖结构复杂且易发生形变, 存在大量不准确的信息。

本文提出迁移模糊聚类(Transfer Fuzzy Clustering Means, TFCM)[12]和支持向量机(Support Vector Machine, SVM)[13]相结合的方法TFCM-SVM, 对MRI进行分割, 并对分割后的结果赋予对应的CT值生成sCT。

1 医学影像知识

目前MRI、CT[4]和正电子发射断层扫描(Positron Emission Tomography, PET)[14]等医学成像系统已成为临床常规诊断的标准工具。PET和CT的结合体, 即PET/CT[15], 也已经成功应用于医学科研和临床诊断。PET/CT结合了PET提供代谢信息和病灶信息的功能和CT提供病灶的精确解剖定位功能, 充分发挥了PET和CT各自优势, 又有效地弥补了两者的不足。此外CT图像还用于PET图像的衰减校正[4], 提高核医学图像的成像精度。通过PET/CT扫描获得的全身各方位较清晰的断层图像, 具有灵敏、准确、特异及定位精确高等特点, 可以一目了然地了解全身整体状况, 达到早期发现病灶和诊断疾病的目的。近年来关于PET/MRI[16]的融合成像技术成为医学影像领域的新研究热点之一。因为MRI对人体无任何放射损伤, 较之PET/CT, PET/MRI对人体的损伤可以大幅度减低; PET/MRI能提供更高的密度分辨率, 尤其适合软组织成像, 并可以实现任意方位的扫描。

PET/CT和PET/MRI两大现有医学混合成像系统都存在一个共同过程, 即信号衰减校正, 这是其图像重建的关键步骤之一。不同于CT, MRI反映质子弛豫时间和密度的分布, 无法直接得到人体组织衰减图, 因此无法直接应用于PET成像衰减校正。这是因为PET的核素在人体内衰变将释放出成对的方向相反能量相等(511 keV)的高能光子, 该光子信号经过人体组织时会部分被组织吸收或散射而发生信号衰减, 且由于人体各部组织的密度差异, 因而只有对组织衰减进行补偿才能得到可用于定量分析的成像。PET/CT系统利用CT扫描获得组织衰减图, 由此可转换为511 keV的光子线性衰减系数(Linear Attenuation Coefficient, LAC)。当前基于MRI的PET组织衰减校正技术还处于发展和提高阶段, 尚无成熟可靠的标准方法, 现有的方法主要包括组织分割法[17]、基于地图集方法[18]、基于模板法[19]和基于发射数据重建法[20]等。其中, 基于地图集法速度和鲁棒性均相对较差, 受解剖结构的个体差异影响也较大; 基于模板法对解剖结构个体差异、病理差异及器官移动等因素较敏感; 基于发射数据重建法使用的交替迭代算法较复杂, 导致成像速度慢、运算时间长; 而组织分割方法具有相对速度快、鲁棒性好、解剖结构个体差异性小等优势, 是目前公认相对可靠的衰减校正途径。这也正是本文研究的切入点, 通过合适的手段将MRI划分成诸如空气、脂肪、软组织、骨头等不同成分, 然后赋予其不同的LAC[21]生成sCT, 以此来实现配准的PET成像的衰减校正工作。

2 相关工作 2.1 迁移模糊聚类

模糊C均值(Fuzzy C-Means, FCM)算法是典型的模糊聚类算法, 它将数据集中的数据样本分成C个互不相交的簇, 同一簇内的样本相似度最大, 不同簇内的样本相似度最小。如今, FCM算法被广泛地应用于各个领域, 例如:图像分割[22], 图像压缩[23], 多目标追踪[24], 基因表达分析[25]等。

TFCM是将迁移学习的思想加入到了FCM中, 它可以从源域中提取历史知识, 在目标域信息不充分或者目标域信息被其他信息干扰的情况下, 借助历史知识, 将目标域数据聚成可靠的C类, 其相关的符号和参数如表 1所示。

下载CSV 表 1 TFCM符号

基于表 1中描述的符号, TFCM可以表述为:

$ \begin{array}{l} \min \left( {{J_{{\rm{TFCM}}}}\left( {{\mathit{\boldsymbol{U}}_{\rm{T}}}, {\mathit{\boldsymbol{V}}_{\rm{T}}}} \right) = } \right.\\ \;\;\;\;\;\left. {\sum\limits_{i = 1}^{{N_{\rm{T}}}} {\sum\limits_{j = 1}^{{C_{\rm{T}}}} {\mu _{ij, {\rm{T}}}^m} } {{\left\| {{\mathit{\boldsymbol{x}}_{i, {\rm{T}}}} - {\mathit{\boldsymbol{v}}_{j, {\rm{T}}}}} \right\|}^2} + \lambda \mathop \sum \limits_{j = 1}^{{C_{\rm{T}}}} {{\left\| {{\mathit{\boldsymbol{v}}_{j, {\rm{T}}}} - {\mathit{\boldsymbol{v}}_{j, {\rm{S}}}}} \right\|}^2}} \right)\\ {\rm{s}}{\rm{.t}}{\rm{.}}\mathit{i} \in \left[ {1, {N_{\rm{T}}}} \right], j \in \left[ {1, {C_{\rm{T}}}} \right], \\ {\mu _{ij, {\rm{T}}}} \in [0, 1], \sum\limits_{j = 1}^{{c_{\rm{T}}}} {{\mu _{ij, {\rm{T}}}}} = 1 \end{array} $ (1)

式(1)由2个部分组成:第1部分是将目标域划分成CT类, 第2部分是从源域中借鉴历史知识VS=${\left[{{\mathit{\boldsymbol{v}}_{1, {\rm{S}}}}, {\mathit{\boldsymbol{v}}_{2, {\rm{S}}}}, \cdots, {\mathit{\boldsymbol{v}}_{{C_{\rm{T}}}, {\rm{S}}}}} \right]^{\rm{T}}}$。参数λ决定着借鉴的程度, λ越大, 表示目标域从源域借鉴越多的历史知识, 即VT越向VS靠拢; 相反地, λ越小意味着目标域从源域借鉴的历史知识越少。在这里, 源域类中心和目标域类中心的数目相同。

利用拉格朗日优化, vj, Tμij, T的迭代过程如下:

$ {\mathit{\boldsymbol{v}}_{j, {\rm{T}}}} = \frac{{\sum\limits_{i = 1}^{{N_{\rm{T}}}} {\mu _{ij, {\rm{T}}}^m} {\mathit{\boldsymbol{x}}_{i, {\rm{T}}}} + \lambda {\mathit{\boldsymbol{v}}_{j, {\rm{s}}}}}}{{\sum\limits_{i = 1}^{{N_{\rm{T}}}} {\mu _{ij, {\rm{T}}}^m} + \lambda }} $ (2)
$ {\mu _{ij, {\rm{T}}}} = \frac{1}{{\mathop \sum \limits_{l = 1}^{{C_{\rm{T}}}} {{\left( {\frac{{{{\left\| {{\mathit{\boldsymbol{x}}_{i, {\rm{T}}}} - {\mathit{\boldsymbol{v}}_{j, {\rm{T}}}}} \right\|}^2}}}{{{{\left\| {{\mathit{\boldsymbol{x}}_{i, {\rm{T}}}} - {\mathit{\boldsymbol{v}}_{l, {\rm{T}}}}} \right\|}^2}}}} \right)}^{\frac{1}{{m - 1}}}}}} $ (3)
2.2 支持向量机

SVM是机器学习算法中常用的一种分类算法, 具有小样本学习能力强、模型泛化能力好等特性。SVM最早用于解决线性可分数据的二分类问题, 其基本原理是:寻找一个满足数据分类要求的最优超平面, 这个超平面在确保分类精度的情况下, 超平面与2类样本点距离最大。

X={xi$\mathbb{R}$d, i=1, 2, …, l}表示训练集, l表示训练集样本数, d表示数据维度。yi∈{+1, -1}(i=1, 2, …, l)表示在X中第i个样本的类标。令f(·)表示决策函数, HK表示与一个Mercer核K相关的再生核Hilbert空间(RKHS)。则SVM表达为以下形式:

$ \mathop {\min }\limits_{f \in {H_k}} \left( {\frac{1}{l}\sum\limits_{i = 1}^l {{{\left( {1 - {y_i}f\left( {{\mathit{\boldsymbol{x}}_i}} \right)} \right)}_ + }} + \gamma \left\| f \right\|_K^2} \right) $ (4)

其中, ()+表示Hinge损失函数, (1-yf(x))+=max(0, 1-yf(x)), γ>0为正则化系数。

根据表示定理, 式(4)的解如下:

$ {f^*}(\mathit{\boldsymbol{x}}) = \sum\limits_{i = 1}^l {\alpha _i^*} K\left( {\mathit{\boldsymbol{x}}, {\mathit{\boldsymbol{x}}_i}} \right) $ (5)

引入偏移项b到式(5)中, 式(4)改写为:

$ \begin{array}{l} \mathop {\min }\limits_{\alpha \in {{\mathbb{R}}^l}, {\xi _i} \in \mathbb{R}} \left( {\frac{1}{l}\sum\limits_{i = 1}^l {{\xi _i}} + \gamma {\mathit{\boldsymbol{\alpha }}^{\rm{T}}}\mathit{\boldsymbol{K\alpha }}} \right)\\ {\rm{s}}{\rm{.t}}{\rm{.}}{y_i}\left( {\sum\limits_{j = 1}^l {{\alpha _j}} K\left( {{\mathit{\boldsymbol{x}}_i}, {\mathit{\boldsymbol{x}}_j}} \right) + b} \right) \ge 1 - {\xi _i}, i = 1, 2, \cdots , l, \\ {\xi _i} \ge 0, i = 1, 2, \cdots , l \end{array} $ (6)

其中, K表示l×l的矩阵, K(·)表示核函数, Kij=K(xi, xj)。

基于Karush-Kuhn-Tucker (KKT)条件, 可得到式(6)的对偶形式:

$ \begin{array}{l} \mathop {\max }\limits_{\beta \in {{\mathbb{R}}^l}} \left( {\frac{1}{l}\sum\limits_{i = 1}^l {{\beta _i}} - \frac{1}{2}{\mathit{\boldsymbol{\beta }}^{\rm{T}}}\mathit{\boldsymbol{Q\beta }}} \right)\\ {\rm{s}}{\rm{.t}}{\rm{.}}\sum\limits_{i = 1}^l {{\beta _i}} {y_i} = 0, 0 \le {\beta _i} \le \frac{1}{l}, i = 1, 2, \cdots , l \end{array} $ (7)

其中, β=[β1, β2, …, βl]T$\mathbb{R}$l是拉格朗日乘数, Q=Y(K/(2γ))Y, Y=diag(y1, y2, …, yl)。

通过优化式(7)中的β*, 可以得到式(6)的解:

α*=*/(2γ)

3 TFCM-SVM方法

TFCM-SVM方法包括4个阶段:

1) 获得迁移学习所需的高级历史知识。

2) 使用TFCM对MRI进行初步分割, 同时对每一个体素进行预标记。

3) 训练分类器。

4) 完成最终分割, 基于分割结果, 对不同组织赋予CT值并生成sCT。

3.1 TFCM-SVM方法流程

TFCM-SVM是一个严格的方法组合机制。本节对TFCM-SVM每一个阶段的具体内容进行详细介绍, 其工作流程如图 1所示。

Download:
图 1 TFCM-SVM方法的整体工作流程

阶段1  从MRI数据中获取骨头、空气、脂肪和软组织4类的历史类中心构成高级历史知识。高级历史知识决定了对MRI进行初步分割和对体素预标记的准确程度。在这一阶段, 真实CT具有非常重要的作用。根据文献[26], 骨头在CT中的数值最大, 采用阈值分割从真实的CT中获取骨头(CT > 300 HU, HU为CT单位, 下文所有数值忽略该单位)位置信息。利用该位置信息, 在MRI图像中提取骨头的数据, 并平均所有病人的骨头数据, 即可以得到骨头的类中心。

mDixon扫描序列数据具有以下性质:脂肪组织可以比较容易地被分离; 空气类的MR信号最低即空气类的数值最小。根据文献[27], 对除去骨头数据的剩下MRI数据用FCM算法聚3类(脂肪、空气和软组织)。脂肪的类中心可以通过比较对应特征最大值确定。空气的数值在mDixon序列中最小, 将整体的数据进行归一化后, 若数据的每一个维度都小于1×10-5, 则该数据为空气数据。另一类的类中心作为软组织的类中心。对所有病人的MRI数据进行处理, 得到每个病人3类成分的类中心。平均所有病人的类中心, 得到最终的历史类中心即高级历史知识。

阶段2  用TFCM对MRI进行初步分割并对每一个体素进行预标记。在获得高级历史知识的过程中, 骨头和空气的类中心都是通过先验知识得到, 对于目标MRI数据, 它们所表达的信息并不充分, 即目标域信息不充分, 且直接使用传统FCM算法甚至无法得到mDixon序列较易区分的脂肪组织。因此用TFCM算法解决这个问题。

首先通过TFCM算法, 借助历史知识将MRI进行初步分割, 可以较好地分割出空气、脂肪和部分软组织, 但仍有部分软组织与骨头难以准确分割。将这些混合的数据作为测试样本传递到下一阶段, 用于训练SVM分类器。借助真实CT的骨头信息, 将误分的骨头和软组织进行区分, 并准确标记每类样本, 以用于训练分类器, 对MRI图像进行更精确的分割。在训练集和测试集中, 加入每个体素的位置信息, 丰富数据集特征, 从而更好地训练分类器。

阶段3  训练分类器。训练得到的最优分类器用于测试数据的分类, 分类效果决定了整个TFCM-SVM算法的最终结果。在数据预处理的过程中, 已尽可能确保标记样本的准确性, 但是由于下腹部的数据受制于本身组织结构的复杂性和难以配准的特性, 分类器往往不能达到理想的效果。仅仅依赖某个单一分类器, 难以对整体的测试数据有良好的分类结果, 并且单一分类器的泛化性能也非常有限。

本文针对每个病人的数据集训练一个分类器。从训练数据中随机抽取少量的数据, 用SVM算法对这少量的数据训练分类器。通过5折交叉验证, 确定当前训练数据集下的参数设置, 即正则化系数l和高斯核窗宽σ

阶段4  阶段3得到的分类器, 完成对MRI的最终分割, 生成sCT。这一阶段包括4个部分:测试数据的抽样, 预测后投票, 最终分割以及生成sCT。

为了适用医学MRI大数据的快速分割, 对测试数据进行简单抽样。利用阶段3得到的n个分类器对抽样后的测试数据进行预测, 得到n个预测结果, 并对该结果进行投票, 得到当前抽样数据下的划分结果。然后利用KNN算法对整体测试数据分类, 得到骨头和软组织, 结合阶段2的初步分类结果, 将MRI图像分割成了脂肪、空气、软组织和骨头4类。最后对每一类成分赋予相应的CT值生成sCT。根据文献[25], 脂肪、空气、软组织和骨头对应的CT值分别是-98、-700、32和538。

3.2 TFCM-SVM方法实现

TFCM-SVM方法利用得到的历史类中心和分类器, 对于新的MRI数据进行分割, 进而生成sCT, 算法设计如下:

输入  历史类中心, 分类器, 下腹部MRI数据

输出  sCT

步骤1  利用TFCM算法将下腹部MRI数据划分4类, 得到相应隶属度矩阵。

步骤2  利用最大概率法对隶属度矩阵进行硬划分处理。

步骤3  通过隶属度矩阵得到脂肪、空气、软组织和骨头初步划分的结果。

步骤4  步骤3得到的软组织和骨头的初步划分MRI数据作为测试数据。

步骤5  对测试样本进行随机抽样。

步骤6  利用预训练好的分类器对测试样本进行预测, 每个分类器得到一个预测结果。

步骤7  对预测后的结果进行投票。

步骤8  KNN分类得到整体测试集预测结果, 即骨头和软组织的最终划分结果。

步骤9  将步骤3中得到的脂肪和空气与步骤8中得到的骨头和软组织进行整合, 即对MRI的整体划分结果。

步骤10  对划分结果赋CT值生成sCT。

4 实验与结果分析

本文通过实验验证TFCM-SVM的性能, 实验均采用以下硬件配置与编程环境:Windows 7系统, CPU i5-4590, 12 GB内存, 编程环境Maltab 2016a。

4.1 实验数据

实验所用的数据是由美国凯斯西储大学Raymond F.Muzic, Jr教授团队提供的10个志愿者MRI扫描数据, 如表 2所示。数据的特征为MRI图像mDxion序列, 即[fat, OP, IP, water], 测试集特征依次是[fat, OP, IP, water, x, y, z], 其中xyz表示3D MRI每个体素的位置信息。

下载CSV 表 2 实验数据

表 2中, 每个病人的图像数据量为512×512×Z, 总数据集表示去掉背景后的总体数据。测试集表示总体数据在经过初步分割后, 骨头和软组织的混合数据。

4.2 评价指标

为了有统一的评价标准和评价结果, 本文采用以下评价指标进行分析讨论:

1) 预测值绝对误差(Mean Absolute Prediction Deviation, MAPD), 其定义如下:

$ MAPD = \sum\limits_{j = 1}^N {\frac{1}{N}} \left| {{y_i} - m\left( {{x_j}} \right)} \right| $ (8)

2) 均方根误差(Root Mean Squared Error, RMSE), 其定义如下:

$ RMSE = \sqrt {\frac{{\sum\limits_{j = 1}^N {\left| {{y_i} - m\left( {{x_j}} \right)} \right|} }}{N}} $ (9)

其中, N表示实验中MRI医学图像的数据量, yi表示真实CT值, m(xj)表示像素点处预测的CT值。2种指标的数值越接近0, 表明算法的性能越好。

4.3 参数设置和参数选择

TFCM-SVM整个过程涉及到多个参数, 为了验证结果的准确可靠, 实验对每个参数进行网格寻优, 统计10次运行结果。为了增强方法的实用性, 将一系列参数固定, 参数由所有病人10次运行结果的均值确定。参数设置如下:

1) TFCM正则化系数λ:λ∈{10, 50, 100, 200, 500, 800, 1 000, 2 000, 5 000, 10 000}。图 2为MAPD随TFCM正则化系数变化的曲线。

Download:
图 2 MAPD随TFCM正则化系数变化曲线

图 2可以看出, 随着λ越大, MAPD的值越小。λ越大, 表示目标域从源域借鉴越多的历史知识, 也就是越向历史类中心靠拢。因此, 在实验中需要找到一个平衡, 既要从高级历史知识中借鉴相关知识, 同时要保持数据本身类中心的特点。综合分析后采用λ=500。一般来说, 迁移场景应用到具体场景中, MAPD应该随正则化系数变化出现波动。但在本文实验中, 却是越往历史类中心靠近, 指标结果越好。出现这一现象的原因是本文所用的历史类中心是利用先验知识获得的, 目标域数据相对于高级历史知识是有缺陷的, 越靠近历史知识就越能对各个成分进行有效的划分。这个曲线也从侧面证明了所选取的历史类中心是真实有效的。

2) 训练样本抽样数st:st∈{1 000, 1 500, 2 000, 2 500, 3 000, 3 500, 4 000, 4 500, 5 000, 5 500}。图 3为MAPD随训练样本抽样数变化的曲线。

Download:
图 3 MAPD随训练样本抽样数变化的曲线

图 3可以看出, 在寻优范围内最优的参数是st=5 000。训练样本量越大, 所包含的信息量越大, 就越能训练出准确的分类器。在图 3中, 当st>5 000, MAPD指标上升是由于抽样数增加, 训练样本中包含的不准确样本数也在增加, 因此分类器的分类效果降低。

3) SVM分类器正则化系数l和高斯核窗口宽度σ:l∈{2-6, 2-3, 2-1, 2, 22, 23, 24, 25, 26}, σ∈{2-6τ, 2-3τ, 2-τ, 2τ, 22τ, 23τ, 24τ, 25τ, 26τ}, 其中τ表示训练样本间的平均距离。最终参数由5折交叉验证确定。

4) 在投票过程中, 测试样本抽样数sv和KNN算法k值:sv∈{10 000, 15 000, 20 000, 25 000, 30 000, 35 000, 40 000, 45 000, 50 000}, k∈{1, 3, 5, 7, 9, 11}。表 3是测试样本抽样数sv和KNN分类中k值对所有病人的10次运行结果所取的均值。由于这2个参数是同时进行选择的, 在统计结果中, MAPD值是取这2个参数平均结果的最小值。本文共计算了54组数据, 表 4为其中一部分结果。最终抽样数sv固定为10 000, k值固定为11。

下载CSV 表 3 不同ksv的MAPD结果
下载CSV 表 4 3种算法实验结果及评价指标
4.4 算法对比

本文采用FCM、TFCM作为对比算法进行实验验证。相比于FCM, TFCM对于医疗图像的分割, 在提高准确率的同时, 能够对实验样本进行预标记。算法重复运行10次, 取10次结果的平均值和均方差来进行统计, 实验结果如表 4所示。本文算法以TFCM为初步分割算法, 对MRI图像的4个成分进行划分。因此, 以病人2为例, 图 4仅显示FCM和TFCM分割结果。

Download:
图 4 FCM和TFCM对整体数据划分结果

表 4图 4可以看出, TFCM不仅指标结果更加突出, 还能得到较为理想的分割结果。观察由FCM分割结果, 存在大量的误分类, 尤其是骨头和空气, 被分成了一类。这也证明了mDixon扫描序列对于骨头和空气的扫描信号相似, 因此直接聚类会将骨头和空气聚到一起。另外, 由于组织结构复杂, 数据量庞大, 对于软组织和脂肪也存在明显的误分。观察TFCM分割结果, 在借鉴高级历史知识时, 得到的脂肪和空气结果较为准确, 但是在骨头中也明显地误分进了软组织结构。针对这一问题, 借助真实CT的骨头信息, 将误分的骨头和软组织进行区分, 并准确标记每类样本用于训练分类器。误分的骨头和软组织即为测试数据。

4.5 最终分割

本文利用训练好的分类器对测试样本分别进行预测, 对预测后的结果进行投票。本文采用leave-one-out策略选择分类器, 即一个病人作为测试样本, 其他9个训练好的分类器对该样本进行预测。对于测试集(骨头和软组织的混合数据)的分割结果如图 5所示。

Download:
图 5 TFCM与TFCM-SVM结果对比

图 5可以看出, 投票后骨头和软组织明显被分割开。但是也能看出两者含有一些杂质, 这是因为训练数据包含了一些不正确或不匹配的信息。这些信息是由于复杂、可变形的解剖结构导致不完善的CT和MRI配准所造成的。

对分割后的组织赋予不同的CT值生成相应的sCT, 其中, 对骨头、空气、脂肪以及软组织的赋值分别是563、-700、-98、32, 结果如图 6所示。

Download:
图 6 真实CT和合成CT
4.6 鲁棒性分析

在算法层面上, TFCM和SVM鲁棒性均较好。本文的TFCM-SVM对于同一个测试样本, 用多个分类器进行预测, 最后采取投票的策略, 保证了算法的鲁棒性。本文分别对10个病人运行10次算法, 其MAPD指标如图 7所示。

Download:
图 7 鲁棒性测试结果

图 7可以看出, 每个病人的10次指标结果都是一条相对平滑的曲线, 因此证明了TFCM-SVM具有较好的鲁棒性。

5 结束语

下腹部组织结构复杂, 人工对下腹部MRI进行标记耗时耗力, 本文提出TFCM-SVM方法, 借助源域数据提供的高级历史知识, 利用无监督方法TFCM对数据进行初步分割及预标记, 在得到历史类中心和分类器SVM的情况下, 将mDixon序列下的MRI数据分成脂肪、空气、骨头和软组织4类, 并生成相对应的sCT。实验结果表明, 该方法具有较好的鲁棒性和实用性。但是, 由于下腹部组织结构复杂, 难以实现配准而导致相关MRI数据包含不准确的信息, 目前的结果还存在误分的情况。下一步将从实验数据中找到准确且信息量大的样本来进行分类器的训练, 以提高分类精度。

参考文献
[1]
COLLINS D J, PADHANI A R. Dynamic magnetic resonance imaging of tumor perfusion[J]. IEEE Engineering in Medicine and Biology Magazine, 2004, 23(5): 65-83. DOI:10.1109/MEMB.2004.1360410 (1)
[2]
DU Jiang, CARL M, BYDDER M, et al. Qualitative and quantitative ultrashort echo time imaging of cortical bone[J]. Journal of Magnetic Resonance, 2010, 207(2): 304-311. DOI:10.1016/j.jmr.2010.09.013 (1)
[3]
LI Cheng, MAGLAND J F, SEIFERT A C, et al. Correction of excitation profile in zero echo time imaging using quadratic phase-modulated RF pulse excitation and iterative reconstruction[J]. IEEE Transactions on Medical Imaging, 2014, 33(4): 961-969. DOI:10.1109/TMI.2014.2300500 (1)
[4]
CHANG L T. A method for attenuation correction in radionuclide computed tomography[J]. IEEE Transactions on Nuclear Science, 1978, 25(1): 638-643. DOI:10.1109/TNS.1978.4329385 (3)
[5]
HSU S H, CAO Yue, HUANG Ke, et al. Investigation of a method for generating synthetic CT models from MRI scans of the head and neck for radiation therapy[J]. Physics in Medicine and Biology, 2013, 58(23): 8419. DOI:10.1088/0031-9155/58/23/8419 (2)
[6]
SU Kuanhao, HU Lingzhi, STEHNING C, et al. Generation of brain pseudo-CTs using an undersampled, single-acquisition UTE-mDixon pulse sequence and unsupervised clustering[J]. Medical Physics, 2015, 42(8): 4974-4986. DOI:10.1118/1.4926756 (1)
[7]
JOHANSSON A, KARLSSON M, NYHOLM T. CT substitute derived from MRI sequences with ultrashort echo time[J]. Medical Physics, 2011, 38(5): 2708-2714. DOI:10.1118/1.3578928 (1)
[8]
JOHANSSON A, KARLSSON M, YU Jun, et al. Voxel-wise uncertainty in CT substitute derived from MRI[J]. Medical Physics, 2012, 39(6): 3283-3290. (1)
[9]
ANDREASEN D, VAN LEEMPUT K, EDMUNDJ M. A patch-based pseudo-CT approach for MRI-only radiotherapy in the pelvis[J]. Medical Physics, 2016, 43(8): 4742-4752. (1)
[10]
ANDREASEN D, VAN LEEMPUT K, HANSEN R H, et al. Patch-based generation of a pseudo CT from conventional MRI sequences for MRI-only radiotherapy of the brain[J]. Medical Physics, 2015, 42(4): 1596-1605. DOI:10.1118/1.4914158 (1)
[11]
HAN Xiao. MR-based synthetic CT generation using a deep convolutional neural network method[J]. Medical Physics, 2017, 44(4): 1408-1419. DOI:10.1002/mp.12155 (2)
[12]
QIAN Pengjiang, SUN Shouwei, JIANG Yizhang, et al. Cross-domain, soft-partition clustering with diversity measure and knowledge reference[J]. Pattern Recognition, 2016, 50: 155-177. DOI:10.1016/j.patcog.2015.08.009 (1)
[13]
SUYKENS J A K, VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293-300. DOI:10.1023/A:1018628609742 (1)
[14]
DEPIERRO A R. On the relation between the ISRA and EM algorithm for positron emission tomography[J]. IEEE Transactions on Medical Imaging, 1993, 12(2): 328-333. DOI:10.1109/42.232263 (1)
[15]
THIELEMANS K, MANJESHWAR R M, TAO Xiaodong, et al.Lesion detectability in motion compensated image reconstruction of respiratory gated PET/CT[C]//Proceedings of 2006 IEEE Nuclear Science Symposium Conference Record.Washington D.C., USA: IEEE Press, 2006: 3278-3282. (1)
[16]
SCHLYER D, VASKA P, TOMASI D, et al.A simultaneous PET/MRI scanner based on RatCAP in small animals[C]//Proceedings of IEEE Nuclear Science Symposium Conference Record.Washington D.C., USA: IEEE Press, 2007: 3256-3259. (1)
[17]
KIM J H, LEE J S, SONG I C, et al. Comparison of segmentation-based attenuation correction methods for PET/MRI:evaluation of bone and liver standardized uptake value with oncologic PET/CT data[J]. Journal of Nuclear Medicine Official Publication Society of Nuclear Medicine, 2012, 53(12): 1878-1882. (1)
[18]
HOFMANN M, BEZRUKOV I, MANTLIKF, et al. MRI-based attenuation correction for whole-body PET/MRI:quantitative evaluation of segmentation-and atlas-based methods[J]. Journal of Nuclear Medicine, 2011, 52(9): 1392-1399. DOI:10.2967/jnumed.110.078949 (1)
[19]
KOPS E R, HERZOG H.Template based attenuation correction for PET in MR-PET scanners[C]//Proceedings of Nuclear Science Symposium Conference Record.Washington D.C., USA: IEEE Press, 2008: 3786-3789. (1)
[20]
王海鹏, 樊馨, 贠明凯, 等. PET/MRI衰减校正技术研究进展[J]. 中国医学影像技术, 2014(2): 295-299. (1)
[21]
CHEN R C, LONGO R, RIGON L, et al. Measurement of the linear attenuation coefficients of breast tissues by synchrotron radiation computed tomography[J]. Physics in Medicine and Biology, 2010, 55(17): 4993. DOI:10.1088/0031-9155/55/17/008 (1)
[22]
BOOPATHI G, AROCKIASAMY S. Image compression:an approach using wavelet transform and modified FCM[J]. International Journal of Computer Applications, 2011, 28(2): 7-12. DOI:10.5120/ijca (1)
[23]
CHEN Songcan, ZHANG Daoqiang. Robust image segmentation using FCM with spatial constraints based on new kernel-induced distance measure[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2004, 34(4): 1907-1916. DOI:10.1109/TSMCB.2004.831165 (1)
[24]
FAN Lin, WANG Huanzhao, WANG Hai.A solution of multi-target tracking based on fcm algorithm in wsn[C]//Proceedings of the 4th Annual IEEE International Conference on Pervasive Computing and Communications Workshops.Washington D.C., USA: IEEE Press, 2006: 290-294. (1)
[25]
ANUSUYA S, BHANU N U, KASTHURI E. Yeast gene expression analysis using K means and FCM[J]. International Journal of Pharma and Bio Sciences, 2015, 6(3): B395-B400. (2)
[26]
SCHNEIDER W, BORTFELD T, SCHLEGEL W. Correlation between CT numbers and tissue parameters needed for Monte Carlo simulations of clinical dose distributions[J]. Physics in Medicine and Biology, 2000, 45(2): 459. DOI:10.1088/0031-9155/45/2/314 (1)
[27]
孙寿伟, 钱鹏江, 胡凌志, 等. 迁移模糊聚类在医学PET/MRI快速衰减校正中的应用[J]. 计算机工程与科学, 2016, 38(4): 775-784. DOI:10.3969/j.issn.1007-130X.2016.04.024 (1)
下载CSV 表 1 TFCM符号
Download:
图 1 TFCM-SVM方法的整体工作流程
下载CSV 表 2 实验数据
Download:
图 2 MAPD随TFCM正则化系数变化曲线
Download:
图 3 MAPD随训练样本抽样数变化的曲线
下载CSV 表 3 不同ksv的MAPD结果
下载CSV 表 4 3种算法实验结果及评价指标
Download:
图 4 FCM和TFCM对整体数据划分结果
Download:
图 5 TFCM与TFCM-SVM结果对比
Download:
图 6 真实CT和合成CT
Download:
图 7 鲁棒性测试结果
基于mDixon序列下腹部MRI数据的sCT生成方法
陈扬洋 , 钱鹏江 , 赵开发 , 苏冠豪