|
发布时间: 2021-09-16 |
计算机断层扫描图像 |
|
|
收稿日期: 2021-04-06; 修回日期: 2021-05-07; 预印本日期: 2021-05-15
基金项目: 国家重点研究发展计划项目(2018ZX10723203-001-002);北京市自然科学基金项目(5182018, 4161004);北京市科技计划项目(Z171100000117001, Z161100000216143)
作者简介:
陈弘扬, 1997年生, 男, 硕士研究生, 主要研究方向为医学影像处理。E-mail: hxlh50k@gmail.com
高敬阳, 通信作者, 女, 教授, 主要研究方向为基于深度学习的医学影像分析、基于机器学习的基因组学大数据分析。E-mail: gaojy@mail.buct.edu.cn 赵地, 通信作者, 男, 副研究员, 主要研究方向为深度学习、类脑计算、脑科学。E-mail: zhaodi@escience.cn 吴忌, 男, 硕士研究生, 主要研究方向为肝脏切除手术的安全评估。E-mail: 1968232851@qq.com 陈金军, 男, 主任医师, 教授, 主要研究方向为内科学(传染病)。E-mail: chjj@smu.edu.cn 全显跃, 男, 主任医师, 教授, 主要研究方向为腹部影像学。E-mail: quanxianyue2014@163.com 李欣明, 男, 医师, 主要研究方向为腹部影像学。E-mail: lixinmingsmu@163.com 薛峰, 女, 教授, 主要研究方向为儿童肝移植。E-mail: fengxue6879@163.com 周沐瑶, 女, 硕士研究生, 主要研究方向为腹部影像学。E-mail: 276916872@qq.com 柏冰冰, 女, 硕士研究生, 主要研究方向为腹部影像学。E-mail: 1753419164@qq.com *通信作者: 高敬阳 gaojy@mail.buct.edu.cn, 赵地 zhaodi@escience.cn
中图法分类号: TP391.7
文献标识码: A
文章编号: 1006-8961(2021)09-2121-14
|
摘要
目的 肝纤维化是众多慢性肝脏疾病的常见表现,如不及时治疗可发展为肝硬化甚至引发肝癌。肝纤维化的准确评估对临床治疗和预后评估等至关重要。目前,肝纤维化的诊断通过肝穿活检判断,有创且有并发症危险。为此,基于影像学的无创诊断方法越来越受到关注。本文提出一种基于通道注意力与空间注意力机制改进的用于肝纤维化区域的自动化分割U-Net(liver fibrosis region segmentation network based on spatial and channel attention mechanisms,LFSCA-UNet)。方法 依据Attention U-Net的改进方式,围绕U-Net的跳跃连接结构进行基于注意力的改进,在AG(attention gate)的基础上,加入以ECA(efficient channel attention)模块为实现方式的通道注意力机制,依据加入ECA的位置,LFSCA-UNet分为A、B、C共3个子型。结果 在肝数据集上与其他实验网络进行评估对比,本文提出的LFSCA-UNet网络结构平均Dice系数达到了93.33%,相比原始U-Net的Dice系数提高了0.539 6%。结论 本文方法将空间注意力机制与通道注意力机制进行结合,有效提高了肝纤维化区域的分割精度,对空间注意力模块使用通道注意力模块优化输入和输出,增加了网络的稳定性,提升了网络的整体效果。
关键词
肝纤维化; 图像分割; 空间注意力机制; 通道注意力机制; U-Net
Abstract
Objective Liver fibrosis is a common manifestation of many chronic liver diseases. It can develop into cirrhosis and even lead to liver cancer if not treated in time. The early diagnosis of liver fibrosis helps prevent the occurrence of severe liver disease. Studies have shown that timely and correct treatment can reverse liver fibrosis and even cirrhosis. Therefore, the accurate assessment of liver fibrosis is essential to the clinical treatment and prognosis assessment of liver fibrosis. At present, the diagnosis of liver fibrosis in the medical field is evaluated through liver biopsy, which is generally a safe procedure but invasive. The complications of liver biopsy are rare but potentially lethal, so noninvasive diagnosis methods based on imaging have attracted considerable interest. Method This paper proposes a network for the segmentation of liver fibrosis regions, called LFSCA-UNet(liver fibrosis region segmentation network based on spatial and channel attention mechanisms-UNet). It has improved the U-Net with two different attention mechanisms. U-Net is a convolutional neural network used for image semantic segmentation. Attention U-Net is an improved version of U-Net, it adds a group of attention gate modules into each skip connection of the original U-Net. The attention gate modules in attention U-Net is a spatial attention mechanism. LFSCA-UNet adds a channel attention mechanism to each skip connection structure. In this study, the efficient channel attention(ECA), which is a channel attention mechanism based on the squeeze and excitation network, was used in implementing the added mechanism. The core idea of the squeeze and excitation network is to allow networks to automatically learn dependencies between channels. This network changes a conventional convolution layer to a convolution layer with a squeeze and excitation block, which can be divided into two parts: squeeze and excitation. The squeezing part uses global pooling to obtain a feature vector of a current convolutional layer feature map, whereas the excitation part uses two fully connected layers with different numbers. The first drop of the dimension and the second upgraded, and finally, the weight of each channel is obtained after sigmoid activation, which is multiplied by the original feature map as the input of the subsequent layer of the network. The efficient channel attention block is an improvement of the squeeze and excitation block, which removes the part of reducing dimension and uses 1 d convolution instead of the fully connected layer. It has better performance and fewer parameters. The CT(computed tomography) images used in this study was obtained from 88 patients with liver fibrosis and provided by the Department of Liver Surgery, Renji Hospital, Shanghai Jiao Tong University School of Medicine. One Nvidia Tesla P100 graphics cards with 16 GB memory were used in training networks, and Python 3.8.5 and PyTorch 1.7.1 were used. Result This paper horizontally compared five different experimental networks according to five different indicators, namely, Dice coefficient, Jaccard index, precision, recall (sensitivity), and specificity. LFSCA-UNet gets the highest result of mean Dice coefficient (0.933 3), better than the original U-Net (0.539 6%). Conclusion This paper verifies that the combination of spatial attention and channel attention mechanisms can effectively improve the segmentation result of liver fibrosis. For the spatial attention module, using the channel attention module in optimizing inputs can increase network stability and optimizing outputs can improve the overall effect of the network.
Key words
liver fibrosis; image segmentation; spatial attention mechanism; channel attention mechanism; U-Net
0 引言
肝纤维化是慢性肝脏疾病的常见表现(赵万明,2019)。轻度肝纤维化可能会随肝脏损伤的持续发展而成为严重的肝硬化或并发肝功能异常,严重情况下会引发肝癌(Mallat和Lotersztajn,2013)。临床研究表明,肝纤维化是一个可逆过程(刘冠辰和刘鹏飞,2021),对早期轻度肝纤维化进行准确诊断并采取有效措施是降低严重肝疾病发病风险的有效手段之一(Ellis和Mann,2012)。
肝纤维化的诊断主要是通过肝穿刺对活体组织进行病理学诊断,但因为有创及易导致并发症,故接受度较低(李秋菊等,2018; West和Card,2010),因此医学界致力于研究用于肝纤维化的无创性检查评估系统(曾民德等,2002)。计算机断层成像(computed tomography,CT)临床应用较广(刘沛瑶等,2019;史景璐,2021),可以发现一些仅有血液动力学改变的早期病变,且属于无创检查方法,对肝纤维化诊断提供了重要帮助(刘宏等,2012)。推广使用计算机辅助的医学影像分析能够实现对病人肝纤维化区域的定量、无创分析(Choi等,2018),能够快速初步确定病情,对避免肝活检带来的损伤以及减轻医生工作压力具有积极作用(陈弘扬等,2021)。
语义分割是计算机视觉的一个重要研究方向,随着技术的发展衍生出许多基于全卷积结构的语义分割网络(Cai等,2020)。U-Net(Ronneberger等,2015)是一种用于2维图像的语义分割算法,已成为医疗影像领域大多数语义分割任务的基准线。Attention U-Net(Oktay等,2018)是一种改进的U-Net,在原始U-Net的跳跃连接部分加入AG(attention gate)结构,通过下一级的特征图对上一级的特征图进行注意力激活。
本文以U-Net为基础,在Attention U-Net新增的AG附近的跳跃连接结构中加入基于通道注意力ECA(efficient channel attention,ECA)模块,提出一种基于通道注意力与空间注意力机制改进的用于肝纤维化区域的自动化分割U-Net(liver fibrosis region segmentation network based on spatial and channel attention mechanisms,LFSCA-UNet)。
1 方法
1.1 U-Net
U-Net是一种基于编码器—解码器结构的卷积神经网络模型,结构形状类似字母U。相较于普通的全卷积网络(fully convolutional networks,FCN),U-Net有两个特点:1)下采样—上采样的U型结构,每个下采样模块(编码器)通过最大池化实现;每个上采样模块(解码器)通过反卷积或双线性插值等方法实现。本文提到的U-Net及其改进网络的上采样模块均通过反卷积实现。2)在同级别的特征图之间使用跳跃连接,使整个网络可以利用编码器生成不同尺度的特征信息。一个标准的U-Net包括4次下采样与4次上采样过程。
1.2 Attention U-Net
Attention U-Net在U-Net的基础上增加AG结构,如图 1所示。AG结构位于每个跳跃连接的末端,接受下一级的特征图作为门控信号用于优化上级特征图,具体为
$ \begin{aligned} A G(\boldsymbol{x}, \boldsymbol{g})=\sigma &\left( { C o n v } _ { 2 \mathrm { d } } ^ { 1 \times 1 } \left( { R e L } U \left({Conv}_{2 \mathrm{~d}}^{1 \times 1}(U p(\boldsymbol{g})) \times\right.\right.\right.\\ &\left.\left.\left.{Conv}_{2 \mathrm{~d}}^{1 \times 1}(\boldsymbol{x})\right)\right)\right) \times \boldsymbol{x} \end{aligned} $ | (1) |
式中,
1.3 ECA-block
SE-NET(squeeze-and-excitation networks)由Momenta公司在2017年提出,核心思想是使网络自动学习通道间的依赖关系。Hu等人(2018)将常规的卷积层改为带有SE-block的卷积,如图 2所示,SE-block与传统卷积是并行的,每个SE-block分为压缩(squeeze)和激发(excitation)两部分,如图 2(a)所示,其中
$ k=\left|\frac{\log _{2} C+b}{\gamma}\right|_{\text {odd }}, \gamma=2, b=1 $ | (2) |
式中,
$ E C A(\boldsymbol{x})=\sigma\left({Conv}_{1 \mathrm{~d}}^{1 \times 1}({GAP}(\boldsymbol{x}))\right) \times \boldsymbol{x} $ | (3) |
式中,
1.4 LFSCA-UNet
LFSCA-UNet的结构如图 3所示,图中
1.5 LFSCA-UNet 3种子型的设计逻辑
AG结构能够进行空间注意,理论上可以去除空间维度上的冗余信息。但相比于复杂多变的自然影像,医疗影像结构固定、语义简单。因此若仅在跳跃连接中加入AG结构,当编码器在空间域上生成的冗余信息较少时,AG不一定能够提升网络的效果。针对医疗影像尤其是肝脏CT图像中肝纤维化区域边界形状不规则、不同病人肝脏差异大以及纤维化区域与肿瘤病灶区域边界模糊等特点,在网络跳跃连接结构中加入ECA模块,能够为网络增加通道注意的能力。ECA与AG结构共同作用于跳跃连接结构,允许网络同时进行空间注意和通道注意。
AG和ECA是在不同维度上,利用输入张量求出一个权重矩阵与输入张量相乘,从而起到注意力的作用。式(1)和式(3)可分别写为
$ A G(\boldsymbol{X}) =\boldsymbol{X} \odot \boldsymbol{W}_{\mathrm{s}} $ | (4) |
$ E C A(\boldsymbol{X}) =\boldsymbol{X} \odot \boldsymbol{W}_{\mathrm{c}} $ | (5) |
式中,⊙表示矩阵的逐项积(又名哈达玛积或舒尔积);
本文提出3种针对跳跃连接的优化方式,分为
$ A(\boldsymbol{X})=\boldsymbol{X} \odot \boldsymbol{W}_{\mathrm{c}} \odot \boldsymbol{W}_{\mathrm{s}} $ | (6) |
$ B(\boldsymbol{X})=\boldsymbol{X} \odot \boldsymbol{W}_{\mathrm{s}} \odot \boldsymbol{W}_{\mathrm{c}} $ | (7) |
$ C(\boldsymbol{X})=\boldsymbol{X} \odot \boldsymbol{W}_{\mathrm{c1}} \odot \boldsymbol{W}_{\mathrm{s}} \odot \boldsymbol{W}_{\mathrm{c} 2} $ | (8) |
式中,每个权重矩阵都是由与其进行逐项积运算的矩阵通过神经网络计算得出,所以不能适用乘法交换律或结合律。权重矩阵计算方式参考式(1)和式(3)。式(6)中编码器生成的特征张量
依据3种不同的跳跃连接方式,本文提出3种LFSCA-UNet。LFSCA-UNet A优化AG的输入;LFSCA-UNet B优化AG的输出;LFSCA-UNet C优化AG的输入输出。同时,借助梯度类别激活映射图(gradient-weighted class activation mapping,Grad-CAM)算法(Selvaraju等,2017)生成的类激活热力图对不同结构的特点进行可视化分析。
2 实验
2.1 数据预处理
2.1.1 数据集
实验使用的数据集及标注采用上海交通大学医学院附属仁济医院肝脏外科提供的肝纤维化病人数据集(简称肝数据集),共88位肝纤维化病人、每位病人约10幅CT切片,共877幅CT图像,均为dcm格式。mask标签为专业医师使用labelme手工标注肝纤维化区域的json格式文件。肝数据集的图像大小均为512×512像素,原数据格式为灰度分级较高的dcm格式,需要通过python中的pydicom库读取其图像信息。图 4展示了从肝数据集读取的原数据图像及医师标注的肝纤维化区域的可视化结果。
2.1.2 DICOM图像处理
医学数字成像和通信(digital imaging and communications in medicine,DICOM)是一组用于医学影像的通用标准协议,保存的文件后缀为.dcm。CT值用于衡量人体组织对X射线的吸收率,单位是Hu(Hounsfield),范围是[-1 024, 3 071],设定水的吸收率为0 Hu。dcm文件保存的是图像的灰度值,与CT值不一定相等。读取dcm文件时,还需读取两个tag信息,(0028| 1052): rescale intercept和(0028|1053): rescale slope, 分别代表像素值转换到CT值时的偏移量和比例。CT图像的CT值的计算公式为
$ v_{\mathrm{CT}}=v_{\text {pixel }} \times s+i $ | (9) |
式中,
2.2 实验流程
为验证LFSCA-UNet的有效性,使用U-Net、Attention U-Net、LFSCA-UNet A、LFSCA-UNet B和LFSCA-UNet C等5种网络作为实验对象,训练过程中采用的损失函数为Dice损失函数,计算为
$ L_{\text {Dice }}(\boldsymbol{y}, \boldsymbol{p})=1-2 \times \frac{|\boldsymbol{y} \cap \boldsymbol{p}|+{\varepsilon}}{|\boldsymbol{y}|+|\boldsymbol{p}|+\varepsilon} $ | (10) |
式中,
在肝数据集上对每种网络进行3次独立重复实验。对所有样本随机取出10 % 作为测试集(test),后续不再变动,剩余样本按9 ∶ 1分为训练集(train)和验证集(val)。为保证网络性能得到充分验证及实验结果具有普遍性,每次实验的数据集采取固定不同种子的随机抽样方式划分,并取每个网络3次实验中在测试集上的评估指标均值和方差作为该网络的最终性能指标。
实验采用的GPU为1张Nvidia Tesla P100显卡,显存16 GB,batch size = 4,通过tensorboard记录训练日志,epochs均设定为5,使用RMSProp作为优化器。实验代码基于PyTorch 1.7.1实现,源码网址为https://github.com/HXLH50K/LFSCA-UNet。
2.3 评价指标
使用Dice系数、雅卡尔指数/交并比、精确率、召回率/敏感度和特异度等指标多角度评价LFSCA-UNet的性能。设真实的掩膜为
Dice系数(Dice coefficient)(Dice,1945)是一种用于计算两个样本集合相似度的度量函数。在评价图像分割结果时,将图像视为像素点的集合,则
$ \begin{aligned} &{Dice}(\boldsymbol{y}, \boldsymbol{p})=2 \times \frac{|\boldsymbol{y} \cap \boldsymbol{p}|}{|\boldsymbol{y}|+|\boldsymbol{p}|}=\\ &\ \ \frac{2 \times|\boldsymbol{T P}|}{|\boldsymbol{T P}|+|\boldsymbol{F P}|+|\boldsymbol{T P}|+|\boldsymbol{F} \boldsymbol{N}|} \end{aligned} $ | (11) |
Dice的取值范围是[0, 1],越大表示
雅卡尔指数(Jaccard index)(Levandowsky和Winter,1971),又称为并交比(intersection over union,IOU)或雅卡尔相似系数(Jaccard similarity coefficient),与Dice系数类似,也是用于比较集合相似度的度量函数。定义为两个集合交集大小与并集大小之间的比例。在评价图像分割结果时,将图像视为像素点的集合。则
$ \begin{aligned} &IOU(\boldsymbol{y}, \boldsymbol{p})=\frac{|\boldsymbol{y} \cap \boldsymbol{p}|}{|\boldsymbol{y} \cup \boldsymbol{p}|}= \\ \ \ &\frac{|\boldsymbol{T} \boldsymbol{P}|}{|\boldsymbol{T P}|+|\boldsymbol{F P}|+|\boldsymbol{F N}|} \end{aligned} $ | (12) |
Jaccard指数与Dice系数的计算公式非常相似,但Dice系数更多用于医疗影像领域的结果评估。
精确率(precision)是指判断为阳性的样本中真阳性的比例,计算为
$ P(\boldsymbol{y}, \boldsymbol{p})=\frac{|\boldsymbol{y} \cap \boldsymbol{p}|}{|\boldsymbol{p}|}=\frac{|\boldsymbol{T} \boldsymbol{P}|}{|\boldsymbol{T P}|+|\boldsymbol{F P}|} $ | (13) |
式中,精确率
召回率(recall)也称为灵敏度(sensitivity),为真阳性率,是指实际为阳性的样本中,判断为阳性的比例,计算为
$ R(\boldsymbol{y}, \boldsymbol{p})=\frac{|\boldsymbol{y} \cap \boldsymbol{p}|}{|\boldsymbol{y}|}=\frac{|\boldsymbol{T} \boldsymbol{P}|}{|\boldsymbol{T P}|+|\boldsymbol{F N}|} $ | (14) |
式中,召回率
特异度(specificity)为真阴性率,指预测为阴性的样本中,实际为阴性的比例,计算为
$ S(\boldsymbol{y}, \boldsymbol{p})=\frac{1-|\boldsymbol{y} \cup \boldsymbol{p}|}{1-|\boldsymbol{y}|}=\frac{|\boldsymbol{T N}|}{|\boldsymbol{T N}|+|\boldsymbol{F P}|} $ | (15) |
式中,特异度
2.4 实验结果
LFSCA-UNet等5种神经网络在肝数据集上的Dice系数、Jaccard指数(IOU)、精确率、召回率(灵敏度)和特异度等评价指标的实验结果如表 1-表 5所示。
表 1
不同实验网络在肝数据集上的Dice系数对比
Table 1
Comparison of Dice coefficient on the liver dataset among different experimental networks
方法 | Dice系数(方差/10-3) | |||
第1次实验 | 第2次实验 | 第3次实验 | 平均 | |
U-Net | 0.925 3(1.538) | 0.931 5(1.122) | 0.926 8(1.569) | 0.927 9(1.410) |
Attention U-Net | 0.926 1(1.532) | 0.926 4(1.518) | 0.925 6(1.564) | 0.926 0(1.538) |
LFSCA-UNet A | 0.919 8(1.775) | 0.921 5(1.598) | 0.928 8(1.384) | 0.923 4(1.586) |
LFSCA-UNet B | 0.937 0(0.993) | 0.852 6(7.518) | 0.930 7(1.302) | 0.906 8(3.271) |
LFSCA-UNet C | 0.931 4(1.326) | 0.930 3(1.447) | 0.938 1(1.051) | 0.933 3(1.275) |
注:加粗字体表示各列最优结果。 |
表 2
不同实验网络在肝数据集上的交并比(Jaccard指数)对比
Table 2
Comparison of IOU or Jaccard index on the liver dataset among different experimental networks
方法 | IOU(方差/10-3) | |||
第1次实验 | 第2次实验 | 第3次实验 | 平均 | |
U-Net | 0.863 3(4.120) | 0.873 5(3.180) | 0.866 0(4.223) | 0.867 6(3.841) |
Attention U-Net | 0.864 7(4.148) | 0.865 2(4.106) | 0.863 8(4.182) | 0.864 6(4.146) |
LFSCA-UNet A | 0.854 2(4.578) | 0.856 8(4.277) | 0.869 1(3.752) | 0.860 0(4.202) |
LFSCA-UNet B | 0.883 0(2.856) | 0.751 9(14.21) | 0.872 5(3.587) | 0.835 8(6.883) |
LFSCA-UNet C | 0.873 7(3.661) | 0.871 8(3.937) | 0.885 1(3.027) | 0.876 9(3.541) |
注:加粗字体表示各列最优结果。 |
表 3
不同实验网络在肝数据集上的精确率对比
Table 3
Comparison of precision on the liver dataset among different experimental networks
方法 | 精确率(方差/10-3) | |||
第1次实验 | 第2次实验 | 第3次实验 | 平均 | |
U-Net | 0.904 4(3.921) | 0.924 2(2.980) | 0.912 4(3.811) | 0.913 7(3.571) |
Attention U-Net | 0.916 4(3.704) | 0.915 7(3.834) | 0.916 5(3.639) | 0.916 2(3.726) |
LFSCA-UNet A | 0.897 0(4.020) | 0.911 4(3.764) | 0.911 8(3.653) | 0.906 7(3.812) |
LFSCA-UNet B | 0.926 7(2.748) | 0.862 8(10.02) | 0.916 8(3.173) | 0.902 1(5.314) |
LFSCA-UNet C | 0.920 4(3.304) | 0.913 8(3.585) | 0.933 4(2.464) | 0.922 6(3.118) |
注:加粗字体表示各列最优结果。 |
表 4
不同实验网络在肝数据集上的召回率(敏感度)对比
Table 4
Comparison of recall or sensitivity on the liver dataset among different experimental networks
方法 | 召回率(方差/10-3) | |||
第1次实验 | 第2次实验 | 第3次实验 | 平均 | |
U-Net | 0.951 4(2.118) | 0.942 5(2.133) | 0.946 2(2.569) | 0.946 7(2.273) |
Attention U-Net | 0.941 2(3.190) | 0.942 3(2.856) | 0.939 1(2.642) | 0.940 9(2.900) |
LFSCA-UNet A | 0.948 7(3.096) | 0.936 3(2.836) | 0.950 4(2.021) | 0.945 2(2.651) |
LFSCA-UNet B | 0.950 7(1.739) | 0.856 9(10.33) | 0.948 4(1.934) | 0.918 7(5.647) |
LFSCA-UNet C | 0.946 7(2.372) | 0.951 0(1.975) | 0.945 7(1.895) | 0.947 8(2.080) |
注:加粗字体表示各列最优结果。 |
表 5
不同实验网络在肝数据集上的特异度对比
Table 5
Comparison of specificity on the liver dataset among different experimental networks
方法 | 特异度(方差/10-5) | |||
第1次实验 | 第2次实验 | 第3次实验 | 平均 | |
U-Net | 0.988 8(7.532) | 0.991 3(5.868) | 0.989 7(7.603) | 0.989 9(7.001) |
Attention U-Net | 0.990 1(7.457) | 0.990 2(7.078) | 0.990 4(6.826) | 0.990 2(7.120) |
LFSCA-UNet A | 0.987 6(8.908) | 0.989 7(7.589) | 0.989 7(6.839) | 0.989 0(7.778) |
LFSCA-UNet B | 0.991 5(5.338) | 0.984 3(16.87) | 0.990 5(5.635) | 0.988 8(9.282) |
LFSCA-UNet C | 0.990 8(6.247) | 0.990 0(6.523) | 0.992 6(4.193) | 0.991 1(5.654) |
注:加粗字体表示各列最优结果。 |
从表 1可以看出,LFSCA-UNet C在3次独立实验的平均Dice最高,达到0.933 3,且平均方差最低。LFSCA-UNet A、Attention U-Net和U-Net这3者表现接近。LFSCA-UNet B在第1次实验中表现最好,但在第2次实验中表现最差,且与其他4种网络差距较大,因此在平均结果上表现最差。从表 2可以看出,在以IOU指标对各网络评估时,结论与以Dice系数评估时相同,因为二者存在正相关性。
从表 3-表 5可以看出,在以精确率、召回率和特异度指标对各网络评估时,LFSCA-UNet C均取得了最高的平均结果,分别为0.922 6、0.947 8和0.991 1。精确率对各网络评估的整体结果与表 1—表 2类似,各网络的特异度得分表现与精确度类似,均接近上限1。各网络的召回率在第1次与第3次实验中的得分接近。
图 6是以Dice系数、IOU、精确率、召回率(灵敏度)和特异度等指标作为评价标准时,依据每个单独的样本在3次独立实验中的得分均值绘制的箱形图,箱形图中方框代表四分位间距,方框中的水平线是中位数,上下边缘代表四分位间距的1.5倍,×代表平均值,离散的点代表异常值。
从图 6(a)可以看出,以Dice系数为评估标准时,LFSCA-UNet C表现最佳,在底部困难样本(指在实验结果中表现较差的部分样本,网络难以对其进行精确分割,对应箱形图中下边缘以下的异常值)的表现上也远优于其他实验网络。图 6(b)的结论与图 6(a)类似,可以看出LFSCA-UNet C效果更好。由图 6(c)(e)可以看出,第2次实验较差的结果拉低了LFSCA-UNet B的精确率和特异度指标的平均得分,但在对底部困难样本的处理上,LFSCA-UNet B的效果远高于U-Net、Attention U-Net和LFSCA-UNet A,略高于LFSCA-UNet C。由图 6(d)可以看出,对于底部困难样本,LFSCA-UNet B表现最差,U-Net表现最好,与LFSCA-UNet C结果接近。
综合图 6可以看出,5种网络的多种评估指标都没有过高异常值,原因是这几种网络的5种指标的平均数和中位数都位于0.9以上,而这5种指标的取值范围均为[0, 1],本身数据的中位数和平均值已经接近上限。需要注意的是,LFSCA-UNet B虽然综合得分最低且在3次独立实验中得分方差较大,但是在精确率和特异度的评估中对底部困难样本表现最好。综合考虑查全与查准能力,以Dice系数作为评价指标时,LFSCA-UNet C取得了最高的分数,达到了93.33 %。
图 7展示了5种实验网络在肝数据集的测试集一个样本上的最终分割效果图,绿色部分为专业医生手工标注的肝纤维化区域与实验网络分割出的肝纤维化区域相重叠的部分,即正确分割区域;红色部分为医生手工标注但模型没有分割出的区域,即漏分割区域;蓝色部分为医生没有标注但模型分割出的区域,即误分割区域;其余部分为肝纤维化区域以外的背景区域。由图 7可见,在不同病人的肝纤维化区域分割中,LFSCA-UNet C都表现出了较高的水准,相比其他4种实验网络明显降低了误分割区域的面积、略微降低了漏分割区域的面积。并且LFSCA-UNet C接受的是未经处理的高灰度级DICOM图像,在人工分割时需要先通过控制窗位窗宽进行对比度调整才能进行后续工作,而LFSCA-UNet C无需这一步骤。
3 讨论及分析
3.1 实验结果分析
为了进一步分析5种实验网络的效果,从数据集中抽取一个样本,使用Grad-CAM算法(Selvaraju等,2017)绘制了类激活热力图,如图 8所示。可以看出,对挑选的样本,5种实验网络均有3处偏红的注意区域,但与U-Net和Attention U-Net相比,本文提出的LFSCA-UNet对右边两个区域的关注度更高,说明在跳跃连接中加入ECA模块能够使网络提取到更多的特征。图 8(b)(c)表明,Attention U-Net更加关注左侧较大的红色区域,对右侧区域关注度变小。理论上,U-Net的跳跃连接会将冗余信息连接到解码器部分,AG结构能够在空间域清除这些冗余信息,但是当编码器在空间域上生成的冗余信息较少时,AG则不一定能够提升网络效果。这可能是Attention U-Net在评估时表现劣于U-Net的原因之一。从表 1和表 4可以看出,Attention U-Net在查全和综合能力上弱于U-Net,但表 3的数据显示引入AG结构使得网络的查准能力有所上升。图 8(c)(d)在真实标签的左下方有一块很小的亮蓝色,说明Attention U-Net和LFSCA-UNet A这两个实验网络对真实标签以外的非目标区域产生了注意,这可能是这两个网络在实验结果指标上相对较差的原因之一。这两个网络的共同点是编码器的特征图在经过AG处理后直接进入了解码器部分。而图 8(e)(f)中均没有该亮蓝色部分,说明AG后的ECA模块在通道维度处理了AG的输出张量,能够处理掉类似的错误冗余输出。最后分别将图 8(c)与图 8(d)、图 8(e)与图 8(f)进行对比,图 8(d)(f)中的红色区域更小更红,说明AG前的ECA模块在通道维度处理了AG的输入,能够使网络的注意力区域更加集中。
3.2 对LFSCA-UNet B第2次实验结果的分析
在表 1-表 5中,LFSCA-UNet B的第2次实验表现差且与另两次实验结果有较大差距。为了探究这种情况的产生原因,在保持第2次实验的数据集划分不变的基础上,对LFSCA-UNet进行了附加实验,结果如表 6所示。5次实验中LFSCA-UNet B的类激活热力图如图 9所示。可以看出图 9(b)(c)整体呈现蓝色,网络没有重点注意的区域,仅对目标区域产生了较少的注意,对应的两次实验结果相较于其他网络明显偏低,Dice系数分别为0.852 6和0.908 9,且方差明显大于其他实验数据。表 6中的3次实验仅有初始权重的随机值不同,因此表 1中LFSCA-UNet B的第2次实验结果较差存在一定的偶然因素,但LFSCA-UNet A和LFSCA-UNet C在5次实验中均未出现类似异常情况,说明LFSCA-UNet B本身的结构存在不稳定性,其结果易受数据集划分或初始权重等条件影响,同等情况下更容易出现差的结果。
表 6
LFSCA-UNet在肝数据集第2次划分上的多次重复实验的Dice系数对比
Table 6
Comparison of Dice coefficients of multiple repeated experiments on the second division of the liver data set by LFSCA-UNet
方法 | Dice系数(方差/10-3) | |||
第2次划分的第1次实验 | 第2次划分的第2次实验 | 第2次划分的第3次实验 | 平均 | |
LFSCA-UNet A | 0.921 5(1.598) | 0.934 0(1.087) | 0.927 3(1.432) | 0.927 9(1.372) |
LFSCA-UNet B | 0.852 6(7.518) | 0.908 9(2.289) | 0.933 7(1.091) | 0.898 4(3.633) |
LFSCA-UNet C | 0.930 3(1.447) | 0.932 2(1.183) | 0.929 0(1.395) | 0.930 5(1.342) |
注:加粗字体表示各列最优结果。 |
3.3 对LFSCA-UNet 3种子型的讨论
图 10和图 11分别为实验训练和验证损失曲线图(由于总step数过大,取每10个step的平均值描点作图),为了增加对比度,图 10和图 11的纵坐标均为对数。可以看出,5种网络的训练曲线变化大体上一致,在500 steps后进入收敛状态,但仍存在局部的差别。表 7为训练损失曲线基本收敛后的所有steps的方差。
表 7
5种实验网络收敛后训练损失方差
Table 7
Variance of train loss after five experimental networks converge
方法 | 训练损失方差(steps 500+)/10-4 |
U-Net | 1.157 8 |
Attention U-Net | 1.543 6 |
LFSCA-UNet A | 0.989 6 |
LFSCA-UNet B | 1.226 8 |
LFSCA-UNet C | 1.047 7 |
注:加粗字体为各行最优结果。 |
LFSCA-UNet A在Attention U-Net的每个跳跃连接的AG结构前加入ECA模块,这个ECA模块的作用是对AG的输入进行通道维度的注意用以增强空间注意的效果。从图 6展示的结果来看,LFSCA-UNet A的表现平庸,仅在以召回率做评估指标时得分较好。但结合表 7可以看出,在500 steps收敛后的曲线中,LFSCA-UNet A的方差最小最稳定,说明使用ECA处理AG的输入能够增强空间注意的效果,使网络更加稳定。
LFSCA-UNet B在Attention U-Net的每个跳跃连接的AG结构后加入一个ECA模块,这个ECA模块的作用是对AG的输出进行通道维度的注意,用以优化AG的输出以增强解码器部分的工作效果。从图 6展示的结果来看,LFSCA-UNet B的得分最低。但是从表 1-表 5可以看出,LFSCA-UNet B的平均得分低是因为第2次实验的结果比其他4种实验网络差很多。当仅计算第1次与第3次的结果时,LFSCA-UNet B在不同评估指标下的表现与最好的LFSCA-UNet C相当。由3.2节的分析可知,这种情况是由于LFSCA-UNet B的结构不稳定所致,其结果易受初始权重或数据集划分等随机条件的影响。从图 6(c)可以看出,在精确率指标上,LFSCA-UNet B相比其他实验网络,对底部困难样本有更强的查准能力。由此可见,使用ECA处理AG的输出能够增强解码器的工作效果,从而提升网络的上限以及针对性地优化困难样本,但是网络结构不稳定,易受随机条件影响,导致整体结果指标下降。
LFSCA-UNet C在Attention U-Net的每个跳跃连接的AG结构前后各加入一个ECA模块,结合了LFSCA-UNet A和LFSCA-UNet B的特点,同时在通道维度处理AG的输入和输出。从图 6及表 1-表 5展示的结果来看,LFSCA-UNet C虽然并非每次实验都是最高得分,但5个不同指标都得到了最高的平均分。结合图 10和图 11可以看出,LFSCA-UNet C的两个曲线的收敛值均为最低;由表 7可以看出,LFSCA-UNet C训练收敛后的方差仅略高于LFSCA-UNet A。由此可见,LFSCA-UNet C综合了LFSCA-UNet A和LFSCA-UNet B的优点,能够在提升网络分割效果的同时保持稳定。
4 结论
本文基于U-Net,结合Attention U-Net中的空间注意力机制Attention Gate模块及通道注意力机制ECA模块,提出一种用于CT图像肝纤维化区域自动精准分割的卷积神经网络LFSCA-UNet,并讨论分析了LFSCA-UNet的3种子型。3种子型的区别在于是否使用ECA模块在通道维度对AG的输入及输出进行处理。为验证LFSCA-UNet的有效性,在肝数据集上进行了多组实验,得出以下结论:
1) LFSCA-UNet C同时使用了空间域与通道域的注意力机制,能增强网络的鲁棒性与泛化能力,使肝纤维化区域分割的Dice系数达到了0.933 3,通过与其他算法的对比证明了本文算法的有效性,能够实现对CT图像肝纤维化区域的精准分割。
2) 使用ECA对AG进行输入优化能够提升网络收敛后的稳定性;对AG进行输出优化能提升网络解码器部分的效果,提升该网络的上限以及针对性地优化困难样本,但是会带来易受随机条件影响的负面效果;同时进行AG的输入输出优化能够综合两者的优点,提升网络分割效果的同时也增加了稳定性。
本文工作是对U-Net的跳跃连接结构进行注意力改进,并未改进编码器和解码器部分。同时由于医疗影像数据本身难以获取的特点,本文使用的数据集仅有877个样本。后续的研究将集中在数据收集、标签优化以及改进网络的编、解码结构,以实现更好的分割效果。
致谢 本文使用的数据及标注来自上海交通大学医学院附属仁济医院肝脏外科,在此表示感谢。
参考文献
-
Cai L, Gao J, Zhao D. 2020. A review of the application of deep learning in medical image classification and segmentation. Annals of Translational Medicine, 8(11): #713 [DOI:10.21037/atm.2020.02.44]
-
Chen H Y, Gao J Y, Zhao D, Wang H Z, Song H, Su Q H. 2021. Review of the research progress in deep learning and biomedical image analysis till 2020. Journal of Image and Graphics, 26(3): 475-486 (陈弘扬, 高敬阳, 赵地, 汪红志, 宋红, 苏庆华. 2021. 深度学习与生物医学图像分析2020年综述. 中国图象图形学报, 26(3): 475-486) [DOI:10.11834/jig.200351]
-
Choi K J, Jang J K, Lee S S, Sung Y S, Shim W H, Kim H S, Yun J, Choi J Y, Lee Y, Kang B K, Kim J H, Kim S Y, Yu E S. 2018. Development and validation of a deep learning system for staging liver fibrosis by using contrast agent-enhanced CT images in the liver. Radiology, 289(3): 688-697 [DOI:10.1148/radiol.2018180763]
-
Dice L R. 1945. Measures of the amount of ecologic association between species. Ecology, 26(3): 297-302 [DOI:10.2307/1932409]
-
Ellis E L, Mann D A. 2012. Clinical evidence for the regression of liver fibrosis. Journal of Hepatology, 56(5): 1171-1180 [DOI:10.1016/j.jhep.2011.09.024]
-
Hu J, Shen L and Sun G. 2018. Squeeze-and-excitation networks//Proceedings of 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, USA: IEEE: 7132-7141[DOI: 10.1109/cvpr.2018.00745]
-
Levandowsky M, Winter D. 1971. Distance between sets. Nature, 234(5323): 34-35 [DOI:10.1038/234034a0]
-
Li Q J, Guo Q Y, Chen H B, Zhang R G. 2018. Research progress of liver fibrosis based on texture analysis and deep learning. Radiologic Practice, 33(10): 997-1001 (李秋菊, 郭启勇, 陈海斌, 张荣国. 2018. 基于纹理分析和深度学习的肝纤维化研究进展. 放射学实践, 33(10): 997-1001) [DOI:10.13609/j.cnki.1000-0313.2018.10.004]
-
Liu G C, Liu P F. 2021. Progress in quantitative assessment of liver fibrosis and cirrhosis by MRI. Chinese Journal of Magnetic Resonance Imaging, 12(5): 114-117 (刘冠辰, 刘鹏飞. 2021. MRI对肝纤维化及肝硬化定量评估的研究进展. 磁共振成像, 12(5): 114-117) [DOI:10.12015/issn.1674-8034.2021.05.028]
-
Liu H, Guo S L, Du F H, Wang H. 2012. Progress of CT and MRI in chronic liver fibrosis. Chinese Journal of CT and MRI, 10(1): 74-76 (刘宏, 郭顺林, 杜富会, 王浩. 2012. CT和MRI对慢性肝纤维化的研究进展. 中国CT和MRI杂志, 10(1): 74-76) [DOI:10.3969/j.issn.1672-5131.2012.01.024]
-
Liu P Y, Hao F E, Liu A S, Zhao L. 2019. The research progress of CT in evaluating the course of cirrhosis. Computerized Tomography Theory and Applications, 28(6): 753-761 (刘沛瑶, 郝粉娥, 刘挨师, 赵磊. 2019. CT在评价肝硬化病程方面的研究进展. CT理论与应用研究, 28(6): 753-761) [DOI:10.15953/j.1004-4140.2019.28.06.14]
-
Mallat A, Lotersztajn S. 2013. Cellular mechanisms of tissue fibrosis. 5. Novel insights into liver fibrosis. American Journal of Physiology-Cell Physiology, 305(8): C789-C799 [DOI:10.1152/ajpcell.00230.2013]
-
Oktay O, Schlemper J, Le Folgoc L, Lee M, Heinrich M, Misawa K, Mori K, McDonagh S, Hammerla N Y, Kainz B, Glocker B and Rueckert D. 2018. Attention U-Net: learning where to look for the pancreas[EB/OL]. [2021-04-08]. https://arxiv.org/pdf/1804.03999.pdf
-
Ronneberger O, Fischer P and Brox T. 2015. U-net: convolutional networks for biomedical image segmentation//Proceedings of International Conference on Medical Image Computing and Computer-Assisted Intervention. Munich, Germany: Springer: 234-241[DOI: 10.1007/978-3-319-24574-4_28]
-
Selvaraju R R, Cogswell M, Das A, Vedantam R, Parikh D and Batra D. 2017. Grad-CAM: visual explanations from deep networks via gradient-based localization//Proceedings of 2017 IEEE International Conference on Computer Vision. Venice, Italy: IEEE: 618-626[DOI: 10.1109/iccv.2017.74]
-
Shi J L. 2021. Observation on application effects of color doppler ultrasound and CT in the evaluation of liver morphological changes in patients with chronic liver fibrosis. Chinese Journal of CT and MRI, 19(5): 51-53 (史景璐. 2021. 彩超和CT在慢性肝纤维化患者肝脏形态学变化评估中的应用效果观察. 中国CT和MRI杂志, 19(5): 51-53) [DOI:10.3969/j.issn.1672-5131.2021.05.018]
-
Wang Q L, Wu B G, Zhu P F, Li P H, Zuo W M and Hu Q H. 2020. ECA-net: efficient channel attention for deep convolutional neural networks//Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle, USA: IEEE: 11531-11539[DOI: 10.1109/CVPR42600.2020.01155]
-
West J, Card T R. 2010. Reduced mortality rates following elective percutaneous liver biopsies. Gastroenterology, 139(4): 1230-1237 [DOI:10.1053/j.gastro.2010.06.015]
-
Zeng M D, Wang T L, Wang B E. 2002. Common understanding of diagnosis and effect of hepatic fibrosis. Journal of Diagnostics Concepts and Practice, 1(3): 191-192 (曾民德, 王泰龄, 王宝恩. 2002. 肝纤维化诊断和疗效评估共识. 诊断学理论与实践, 1(3): 191-192) [DOI:10.3969/j.issn.1671-2870.2002.03.020]
-
Zhao W M. 2019. Research on Evaluation Method of Liver Fibrosis by Ultrasound Images based on Radiomics and Deep Transfer Learning. Shenzhen: Shenzhen University (赵万明. 2019. 基于影像组学和深度迁移学习的超声图像肝纤维化评估方法研究. 深圳: 深圳大学)