Print

发布时间: 2020-10-16
摘要点击次数:
全文下载次数:
DOI: 10.11834/jig.200207
2020 | Volume 25 | Number 10




    前沿进展    




  <<上一篇 




  下一篇>> 





医学影像疾病诊断的残差神经网络优化算法研究进展
expand article info 周涛1,3, 霍兵强1, 陆惠玲2, 师宏斌4
1. 北方民族大学计算机科学与工程学院, 银川 750021;
2. 宁夏医科大学理学院, 银川 750004;
3. 宁夏智能信息与大数据处理重点实验室, 银川 750021;
4. 宁夏医科大学总医院泌尿外科, 银川 750004

摘要

残差神经网络(residual neural network,ResNet)及其优化是深度学习研究的热点之一,在医学图像领域应用广泛,在肿瘤、心脑血管和神经系统疾病等重大疾病的临床诊断、分期、转移、治疗决策和靶区勾画方面取得良好效果。本文对残差神经网络的学习优化进行了总结:阐述了残差神经网络学习算法优化,从激活函数、损失函数、参数优化算法、学习衰减率、归一化和正则化技术等6方面进行总结,其中激活函数的改进方法主要有Sigmoid、tanh、ReLU、PReLU(parameteric ReLU)、随机化ReLU(randomized leaky ReLU,RReLU)、ELU(exponential linear units)、Softplus函数、NoisySoftplus函数以及Maxout共9种;损失函数主要有交叉熵损失、均方损失、欧氏距离损失、对比损失、合页损失、Softmax-Loss、L-Softmax Loss、A-Softmax Loss、L2 Softmax Loss、Cosine Loss、Center Loss和焦点损失共12种;学习率衰减总结了8种,即分段常数衰减、多项式衰减、指数衰减、反时限衰减、自然指数衰减、余弦衰减、线性余弦衰减和噪声线性余弦衰减;归一化算法有批量归一化和提出批量重归一化算法;正则化方法主要有增加输入数据、数据增强、早停法、L1正则化、L2正则化、Dropout和Dropout Connect共7种。综述了残差网络模型在医学图像疾病诊断中的应用研究,梳理了残差神经网络在肺部肿瘤、皮肤疾病、乳腺癌、大脑疾病、糖尿病和血液病等6种疾病诊断中的应用研究;对深度学习在医学图像未来发展进行了总结和展望。

关键词

深度学习; 残差神经网络; 优化算法; 医学图像; 疾病诊断

Progress of residual neural network optimization algorithm for medical imaging disease diagnosis
expand article info Zhou Tao1,3, Huo Bingqiang1, Lu Huiling2, Shi Hongbin4
1. School of Computer Science and Engineering, North Minzu University, Yinchuan 750021, China;
2. School of Science, Ningxia Medical University, Yinchuan 750004, China;
3. Ningxia Key Laboratory of Intelligent Information and Big Data Processing, Yinchuan 750021, China;
4. Department of Urology, The General Hospital of Ningxia Medical University, Yinchuan 750004, China
Supported by: National Natural Science Foundation of China (61561040)

Abstract

Residual neural network (ResNet) has gained considerable attention in deep learning research over the last few years and has made great achievements in computer vision. The deep convolutional network represented by ResNet is increasingly used in the field of medical imaging and has achieved good results in the clinical diagnosis, staging, metastasis, treatment decision, and target area delineation of major diseases, such as tumors, cardiovascular and cerebrovascular diseases, and nervous system diseases. The optimization of the ResNet algorithm is an important part of the ResNet research. It largely determines model performance, such as generalization and convergence. This article summarizes the learning optimization of ResNet. First, the optimization of the learning algorithm of ResNet is elaborated, and the six aspects of activation function, loss function, parameter optimization algorithm, learning decay rate algorithm, normalization, and regularization are summarized. Nine improvement methods exist for the activation function; they are sigmoid, tanh, ReLU, PReLU, randomized ReLU, exponential linear units(ELU), softplus function, noisy softplus function, and maxout. The loss function includes 12 types: cross-entropy, mean square, Euclidean distance, contrast, hinge, softmax, L-softmax, A-softmax, L2 softmax, cosine, center, and focus losses. Eight learning rate decay methods, namely, piecewise constant, polynomial, exponential, inverse time, natural exponential, cosine, linear cosine, and noise linear cosine, are summarized. The normalization algorithms include batch normalization and renormalization. The regularization technologies include seven types: input data, data enhancement, early stop method, L1 regularization, L2 regularization, dropout, and dropout connect. Second, the application study of the residual network model in the diagnosis of medical imaging diseases is reviewed. ResNet is used to diagnose six types of diseases: lung tumor, skin disease, breast cancer, brain disease, diabetes, and hematological disease. 1) Lung cancer. Considerable data show that the incidence of lung cancer is increasing yearly, which is a serious threat to human health. Early diagnosis and detection are essential for the treatment of lung cancer. The main contributions of ResNet in lung tumor research are particle swarm optimization(PSo)+convolutional neural network(CNN), intermediate dense projection method+DenseNet, DenseNet+fully convolutional network(FCN), attention mechanism+ResNet, dense network+U-Net, and 3D+CNN. 2) Skin cancer. Malignant melanoma is one of the most common and deadly skin cancers. Melanoma can be cured if it is properly treated in the early stage. The main contributions of ResNet in the diagnosis and research of skin diseases are integrated learning+CNN, multichannel ResNet, ResNet+support vector machine(SVM), integrated learning+ResNet, and whale optimization algorithm+CNN. 3) Breast cancer. It is a malignant tumor in women, which seriously affects their physical and mental health. The main contributions of ResNet in the diagnosis and research of breast cancer include transfer learning+ResNet, decision tree+ResNet, CNN+SVM, DesneNet-Ⅱ, and SE-attention+CNN. 4) Alzheimer's disease (AD). It is an irreversible brain disease accompanied with progressive impairment of memory and cognitive functions. No effective cure method exists for AD. Early diagnosis of AD is particularly important for patient care and treatment. The main contributions of ResNet in the diagnosis and research of brain diseases are DenseNet, multiscale ResNet, 3DResNet, and multitask CNN+3D DenseNet. 5) Diabetic retinopathy (glycemic retinopathy). It is an eye disease induced by long-term diabetes, which will cause the patient to lose sight and eventually lead to blindness. The main contributions of ResNet in relevant diagnosis and research are migration learning+CNN, FCN+ResNet, multicategory ResNet, and ResNet+SVM. 6) Blood diseases. The proportion of white blood cells in liquid is usually an indicator of diseases. The classification and counting of white blood cells are used in the process of diagnosing diseases. White blood cell test plays a vital role in the detection and treatment of leukemia, anemia, and other diseases. The main contributions of ResNet in the diagnosis and research of blood diseases are as follows: deep supervision ResNet, fine-tuned ResNet, deep cross ResNet, and deep supervision FCN. Lastly, the future development of deep learning in medical imaging is summarized. In this paper, the algorithms of ResNet are systematically summarized, which has a positive significance to the research and development of ResNet.

Key words

deep learning; residual neural network(ResNet); optimization algorithm; medical image; disease diagnosis

0 引言

医学影像(肖焕辉等,2019)是现代医学最重要的临床诊断和鉴别诊断方法,也是计算机辅助诊断的重要依据(田娟秀等,2018)。以肿瘤为主的疾病在诊疗过程中产生了以医学影像为主的海量医疗数据。目前,临床诊断均需要借助医学影像检查,超声、X线(digital radiography, DR)、电子计算机断层扫描(computed tomography, CT)、磁共振(magnetic resonance imaging, MRI)、胃镜肠镜、正电子发射型计算机断层显像(positron emission computed tomography, PET)、单光子发射计算机断层成像术(single-photon emission computed tomography, SPECT)、PET/CT、血管造影和全切片数字化图像(whole slide images, WSI)等医学影像技术已广泛应用于疾病筛查和诊断、治疗决策。

以残差神经网络(residual neural network, ResNet)(He等,2016)为代表的深度卷积神经网络(convolutional neural networks, CNN)在医学图像(Litjens等,2017)领域应用日益广泛,在肿瘤、心脑血管、神经系统疾病等重大疾病的临床诊断、分期、转移、治疗决策和靶区勾画方面取得良好效果。刘振丙等人(2018)采用多尺度残差神经网络(multi-scale ResNet, MSResNet),将不同大小的卷积核对图像进行多尺度信息采集,并对神经网络进行残差学习,该方法实现多尺度特征学习,较传统深度卷积网络分类效果良好;Maier等人(2019)认为残差神经网络是对医学图像领域产生重要影响的网络。残差神经网络的成功与网络的优化学习算法密不可分。本文从残差神经网络学习算法的优化出发,对残差神经网络进行总结,并将其应用于计算机辅助诊断中。

1 残差神经网络学习算法的改进

残差神经网络算法的优化是残差神经网络研究中一个非常重要的组成部分,它很大程度上决定了模型的泛化与收敛等性能。从6个方面总结学习算法的改进,具体如图 1所示。

图 1 残差神经网络学习算法改进
Fig. 1 Improvement of learning algorithm of residual neural network

1.1 激活函数

激活函数是一个非线性变换,通过对神经网络输入特征的非线性组合变换,提高神经网络对模型的表达能力,使得神经网络的表达能力更加强大。激活函数的改进主要有Sigmoid、tanh、ReLU、PReLU(parameteric ReLU)、随机化ReLU(randomized leaky ReLU, RReLU)、ELU(exponential linear units)、Softplus函数、NoisySoftplus函数和Maxout共9种方法。具体如下:

1) Sigmoid函数是传统神经网络中最常用的激活函数,它在物理意义上最接近生物神经元。此外,(0,1)的输出还可以被表示为概率,或用于输入的归一化,代表性的如Sigmoid交叉熵损失函数。

2) tanh是双曲正切函数,tanh函数和Sigmoid函数的曲线比较相近,相同点是,函数在输入很大或很小时,输出都平滑且梯度很小,不利于权重更新;不同的是输出区间,tanh的输出区间是在(-1, 1)之间并且对称。

3) ReLU(Nair和Hinton, 2010)是目前常用的激活函数,保留生物学神经元机制,输入超过阈值才会激发,在以梯度为主的反向传播中发挥有效作用。

4) PReLU(He等,2015)是对ReLU参数的优化,它将小于零的斜率换成了可变的参数α王文博等人(2018)在提高无人机航拍图像的识别准确率方面使用PReLU函数,使网络具有更快的收敛速度。

5) RReLU(Xu等,2015)也是对ReLU的优化,将α变成了随机数。

6) ELU(Clevert等,2016),在小于零的部分采用了负指数形式,保证对输入变化的鲁棒性,加快收敛速度,使训练更容易。

7) SoftplusELU(Glorot等,2011)作为ReLU的平滑改进,可以返回大于零的任何值;与ReLU不同的是,它防止死神经元,但不对称且不以零为中心。

8) 杜进等人(2018)引入具有生物真实性的激活函数NoisySoftplus来代替ReLU函数,NoisySoftplus通过在Softplus中引入噪声参数, 同时对神经元的输出响应特性进行刻画, 能更准确地刻画生物神经元的输入特性。该方法不仅提高了残差神经网络的精度, 而且该网络权重可直接用于相同结构的深度脉冲神经网络的权重。

9) Maxout具有拟合任意凸函数的特点,使得网络能收敛于更好的全局解。甘俊英等人(2019)针对人脸识别问题,采用双激活层Maxout + ReLU两层结构,将Maxout与ReLU层的优势结合起来,取得了良好的预测结果。

1.2 损失函数

损失函数(loss function)是一个用来估量模型的预测值与真实值不一致程度的非负实值函数,模型的鲁棒性好坏取决于损失函数大小。损失函数越小则鲁棒性越好。损失函数根据分类的预测结果,衡量出模型预测能力的好坏。损失函数在网络中是在前向传播计算中得到的,同时也是反向传播的起点。损失函数有交叉熵损失、均方损失、欧氏距离损失、对比损失、合页损失、Softmax-Loss、L-Softmax Loss、A-Softmax Loss、L2 Softmax Loss、Cosine Loss、Center Loss、焦点损失共12种损失函数。具体如下:

1) 在机器学习中,交叉熵损失、均方损失、欧氏距离损失、对比损失和合页损失是常用的损失函数。交叉熵(cross entropy)描述的是两个概率分布之间的距离,距离越小表示这两个概率越相近,越大表示两个概率差异越大;均方损失函数常用在最小二乘法中,使得各个训练点到最优拟合线的距离最小(平方和最小);欧氏距离损失函数用于连续值训练样本的拟合;对比损失核心思想是增大类间差异并减小类内差异;合页损失函数在线性支持向量机中,对于一些线性不可分的数据,引入松弛变量,其目的是正确分类比其他错误分类多出一个边界值,即分类间隔。

2) Softmax Loss(Softmax with Cross-Entropy Loss)是卷积网络中最常用的损失函数,在图像分类和分割任务中被广泛用于分类问题,特点是优化类间的距离较好,优化类内距离时较弱。

3) Liu等人(2016)提出L-Softmax(large-margin Softmax Loss),是对Softmax Loss的改进,L-Softmax在Softmax中加入了边界的概念,能有效提高类内聚集和类间分离的特性,通过梯度下降法进行优化,可以抑制过拟合,提升算法鲁棒性,但算法复杂度比Softmax高。

4) Liu等人(2017)提出对L-Softmax进行权重归一化的改进:A-Softmax Loss(angular Softmax Loss),该算法用于人脸识别取得很好效果。

5) Ranjan等人(2017)提出的L2 Softmax Loss (L2-constrained Softmax Loss)对Softmax Loss进行了改进,在训练过程中限制各图像提取的特征范数为常数,使得Softmax Loss会对简单样本和复杂样本同样进行学习,用于人脸聚类效果良好。

6) Cosine Loss (Wang等,2018)结合L-Softmax Loss和A-Softmax Loss优点,在Cosine Loss中直接在余弦空间中最大化分类界限,特征和权值都被归一化,相比Softmax Loss、L-Softmax Loss等,Cosine Loss更明确地约束了角度,使得特征更具有可区分度。

7) Wen等人(2016)提出中心损失(Center Loss)用于人脸识别,Center Loss的思想与支持向量机(SVM)类似,不仅划分出各个类别,同时还使得类与类之间的距离尽可能大,而类之间的样本之间距离尽可能小。

8) Lin等人(2017)利用焦点损失(focal Loss)提升了物体检测效果,针对类别不均衡问题,焦点函数可以通过减少易分类样本的权重,使得模型在训练时更专注于难分类的样本。

1.3 参数优化算法

残差神经网络的优化算法通过最小化代价函数的误差来决定参数的最优值,进而提升网络的性能。针对不同问题,残差神经网络学习率和参数优化算法的选取将一定程度地影响网络性能。优化算法主要包括梯度下降法及其改进算法。梯度下降法用来降低输出和真实输出之间的损失/误差,迭代模型结构,提高迭代速度,避免陷入庞大计算量的泥沼。梯度下降法及其改进算法包括梯度下降法(gradient descent, GD)、随机梯度下降法(stochastic gradient descent, SGD)、mini-batch梯度下降法、动量参数梯度下降法、Nestrov梯度加速法、AdaGrad算法、AdaDelta梯度下降法、RMSProp算法和Adam算法等9种方法。Dauphin等人(2014)指出网络参数的高维优化过程中因存在大量鞍点而难以优化,能否在有限步骤内跳出鞍点也应作为重要考量。Ruder(2016)从鲁棒性、跳出鞍点能力、收敛速度和学习率(Hu等,2017)4个方面对以上参数优化算法进行说明。

1) 鲁棒性。GD、SGD和mini-batch梯度下降法在满足稳定初始值和学习率递减函数条件下,将收敛到局部最优或鞍点;动量法、Nestrov梯度加速法、AdaGrad、AdaDelta、RMSProp和Adam算法因其计算量较大,整体不如上述3种算法的鲁棒性较好;Nestrov梯度加速法采用动量法在收敛性能上进行改进,其鲁棒性相较动量法更强。

2) 跳出鞍点能力。GD、SGD和mini-batch梯度下降法3种算法几乎无法跳出鞍点;动量法、Nestrov梯度加速法在足够多的迭代次数下才能跳出鞍点;而AdaGrad算法、AdaDelta梯度下降法、RMSProp算法和Adam算法可以在有限的几步内跳出鞍点。

3) 收敛速度。动量法、Nestrov梯度加速法的基本思想是在相同的梯度方向使其动量增大,在梯度改变方向减小动量,从而抑制振荡加快收敛速度。动量法和Nestrov梯度加速法收敛速度基本相同;AdaGrad、AdaDelta、RMSProp和Adam算法的收敛速度基本相同;GD,SGD和mini-batch梯度下降法3种算法收敛速度也基本相似;总体而言,动量法和Nestrov梯度加速法收敛速度最优,AdaGrad、AdaDelta、RMSProp和Adam等4种算法其次;GD、SGD和mini-batch等3种梯度下降法最弱。

4) 学习率。GD、SGD和mini-batch梯度下降法、动量法、Nestrov梯度加速法等5种算法需要设定学习率和设计学习率随迭代递减函数,而AdaGrad算法、AdaDelta梯度下降法、RMSProp算法、Adam算法等4种算法为自适应学习率算法,训练过程中每一个参数都动态调整其学习率,每一次迭代都会对学习率进行动态约束,使得参数较为平稳;AdaDelta梯度下降法和Adam算法是对AdaGrad算法和RMSProp算法的改进,Adam算法同时具有AdaGrad和RMSProp算法的优点,AdaGrad算法和RMSProp算法在多次迭代后学习率有可能收敛至0。

1.4 学习衰减率

梯度下降的优化问题由学习率和梯度方向决定,因此设置学习率对梯度下降优化十分重要。在训练残差神经网络时,需要设置学习率(learning rate)控制参数的更新速度,学习速率设置过小,会降低收敛速度,增加训练时间;学习率太大,可能导致参数在最优解两侧来回振荡。而学习率衰减(learning rate decay)是一种可以平衡这两者之间矛盾的解决方案。学习率衰减的基本思想是:学习率随着训练的进行逐渐衰减,在模型训练初期,使用较大的学习率进行模型优化,随着迭代次数增加,学习率会逐渐减小,保证模型在训练后期不会有太大的波动,从而更加接近最优解。在参数优化中,学习率衰减(冯宇旭和李裕梅,2018)方法总结为8种:分段常数衰减、多项式衰减、指数衰减、反时限衰减、自然指数衰减、余弦衰减、线性余弦衰减和噪声线性余弦衰减。图 2图 5以初始学习率0.5、迭代次数400为例,说明学习率随迭代次数的衰减变化。

图 2 多项式衰减
Fig. 2 Polynomial decay
图 3 反时限衰减
Fig. 3 Inverse time decay
图 4 分段常数、指数、自然指数衰减对比图
Fig. 4 Comparison graph of piecewise constant, exponential decay, and natural exp decay
图 5 余弦、线性余弦、噪声线性余弦衰减对比图
Fig. 5 Comparison graph of cosine decay, linear cosine decay, and noisy linear cosine decay

多项式衰减更新学习率时,会给定初始学习率和最低学习率,当学习率衰减到最低值时,如图 2,红色线代表学习率降低至最低后,一直保持学习率不变进行更新,绿色线代表学习率衰减到最低后,又会再次循环往复地升高降低,此方式防止神经网络训练后期学习率过小导致网络一直在某个局部最小值附近振荡,通过增大学习率可以跳出局部极小值。

反时限学习率衰减(倒数衰减)是指学习率的大小与训练次数有一定的反比关系,反时限衰减不固定最小学习率,迭代次数越多,学习率越小,如图 3所示。

分段常数衰减是在定义好的区间上设置不同的学习率常数值,一般开始的学习率较大,之后越来越小;指数衰减的学习率随训练次数不断更新,学习率的大小和训练次数是指数相关的;自然指数衰减是指数衰减的改进,区别在于它的衰减底数是e,故而其收敛的速度更快。图 4是分段常数衰减、指数衰减、自然指数衰减3种方式的对比图,从图中可以看出自然指数衰减方式下的学习率衰减优于指数衰减方式,有助于更快地收敛。

Loshchilov和Hutter(2017)提出余弦衰减,其衰减机制与余弦函数相关,形状也大体上是余弦形状;Bello等人(2017)提出的余弦衰减的改进方法包括:线性余弦衰减方式和噪声线性余弦衰减方式,线性余弦衰减主要应用于强化学习领域;噪声线性余弦衰减是在线性余弦衰减的基础上,加入了噪声,增加了学习率寻找最优值的随机性和可能性。如图 5所示,红色线为标准余弦衰减曲线,学习率从初始值下降到最低学习率后保持不变;蓝色线是线性余弦衰减方式曲线,学习率从初始学习率以线性的方式下降到最低学习率值;而绿色线是加上噪声的线性余弦衰减方式。Xu等人(2019)对残差神经网络进行改进,采用自适应余弦学习率算法以提高网络精度,实验效果优于残差神经网络。

1.5 归一化算法

为解决在迭代过程中调整学习率,以及精细的初始化权重参数问题,需对数据进行归一化处理。批量归一化(batch normalization, BN)是网络中一种特殊的层,用于对前一层的输入数据进行批量归一化,然后送入下一层进行处理,这种做法可以加速神经网络的训练过程。Ioffe和Szegedy(2015)的Inceptionv2模型通过批量归一化每层的输入来解决内部协变量问题,加速网络训练。效果优于GoogLeNet。批量归一化在加速和改进深度模型的训练方面非常有效,但当训练批量较小或不包含独立样本时,其有效性会降低;而Ioffe(2017)随后提出批量重归一化(batch renormalization)可确保训练和推理模型生成相同的输出,输出取决于个体样本而不是整个小批量,使用批量重归一化训练的模型在使用小型或非小型微型训练时表现明显优于BN,同时保留BN的优点。

1.6 正则化技术

正则化算法是残差神经网络中重要的研究算法,它保证了算法的泛化能力,为了避免产生过拟合现象,一般使用参数数量多于输入数据量的网络结构。正则化通过避免训练完美拟合数据样本的系数而有助于算法的泛化。本节总结了增加输入数据、数据增强、早停法、L1正则化、L2正则化、Dropout和Dropout Connect共7种正则化的方法。

增加输入数据、数据增强、早停法、Dropout及其变体是深度残差神经网络中常用的调整方法。1)增加输入数据是最直接有效的避免过拟合方法,如果在训练网络时样本数量太少,网络模型有可能出现过拟合情况。2)数据增强通过向训练数据添加转换或扰动来人工增加训练数据集。数据增强技术包括:水平或垂直翻转图像、裁剪、色彩变换、扩展和旋转等方法;Tustison等人(2019)在肺部分割图像中采用基于模板的数据增强策略,构造和训练了深度卷积神经网络模型,实验取得良好效果。3)早停法旨在解决超参数之一的定型周期数量需要手动设置的问题。4)L1正则化向目标函数添加正则化项,以减少参数的绝对值总和;而L2正则化中,添加正则化项的目的在于减少参数平方的总和,L2正则化是通过修改代价函数来实现的。Dropout(Krizhevsky等,2012)则是通过修改网络本身来实现的,在AlexNet模型中开始使用,Dropout在模型训练时按照一定的概率随机将神经网络单元暂时从网络中丢弃,故对每一次小批量梯度下降法所训练的网络都是不同的,避免了过拟合。5)Wan等人(2013)提出的Drop Connect是另一种减少算法过拟合的正则化策略,它提高了网络的泛化能力,是Dropout的一般化;在Drop Connect的过程中将网络架构权重的一个随机选择子集设置为零,取代了在Dropout中对每个层随机选择激活函数的子集设置为零的做法。

2 残差神经网络在疾病诊断中的应用研究

随着大规模图像数据的产生和计算能力的快速发展,残差神经网络在计算机视觉和图像处理领域取得了突破性成果,其强大的特征学习能力引起了研究者关注,并将其应用于医疗图像领域。Litjens等人(2017)对深度学习在医学图像分类、检测和分割、配准和检索等方面的研究进行了较全面地归纳总结。目前,医学临床需求也推动着医学图像计算机辅助诊断的发展,郑光远等人(2018)指出计算机辅助诊断能够提高诊断的准确性, 减少假阳性的产生, 为医生提供有效的诊断决策支持;不仅能够提高处理效率,而且为后续医生进行病情分析提供辅助作用;本节对残差神经网络在医学图像肺部肿瘤、皮肤疾病、乳腺癌、大脑疾病、糖尿病和血液病等6种疾病诊断方面的应用进行总结。

2.1 ResNet在肺部肿瘤诊断中的应用研究

肺癌是发病率和死亡率居高不下的恶性肿瘤之一,大量资料(巩萍等,2015)表明, 肺癌发病率逐年增长, 严重威胁人类健康, 但由于肺癌患者早期的临床表现不明显,医护人员难以及时发现与诊断,导致疾病一旦确诊就是癌症晚期,因此,早诊断早发现对于肺癌的治疗至关重要。通过对残差神经网络学习算法的改进可以提高肺部肿瘤分类诊断结果,其改进包括:粒子群优化卷积核结合梯度下降法对网络微调修正、Focal Loss损失函数优化网络、混合损失函数等,图 6给出了残差神经网络在肺部疾病诊断中的应用情况。

图 6 残差神经网络在肺部疾病诊断中的应用
Fig. 6 ResNet application in the lung disease diagnosis

残差神经网络在肺部肿瘤研究方面的主要工作有:梁蒙蒙等人(2018)提出基于粒子群优化(particle swarm optimization, PSO)卷积核(PSO-ConvK)肺部肿瘤图像识别算法,采用参数迁移法构造CNN提取卷积核为初始种群,用PSO对其初始化,更新每个粒子的速度和位置,找出全局最优解,将其转换到CNN,利用肺部肿瘤CT数据进行训练,结合梯度下降法对网络微调修正;Nibali等人(2017)将残差神经网络应用于肺结节良恶性分类中,采用ResNet架构,探索迁移学习的效果,以及不同网络深度对恶性肿瘤分类的准确性影响;戴垚均等人(2018)提出了基于密集网络改进的肺结节分类识别算法,该模型以DenseNet为基础,采用中间密集投影法得到肺结节3维信息,在网络中进行训练,采用Focal Loss使网络能着重学习难以分辨的肺结节;姚宇瑾和张利(2019)提出基于混合损失的3维全卷积网络与基于注意力的多尺度3维残差网络相结合的肺结节检测方法,利用基于注意力的多尺度3维残差卷积网络对疑似结节进行分类,从候选结节中精确地分辨出真正结节;朱辉和秦品乐(2019)提出一种改进的U-Net卷积神经网络肺结节检测算法,采用卷积操作与池化操作获取高层特征,通过密集网络使得特征信息在输入层和输出层之间高速流通,并结合扩张卷积生成多尺度特征,提高肺结节低层特征的利用率。Zhang等人(2019)采用3D计算机断层扫描图像用于计算机辅助诊断(computer aided diagnosis, CAD)系统的肺结节分类,将3D的CT图像在多种CNN模型中进行对比实验,实验表明,DenseNet121和Xception在肺结节的诊断均取得了优越的分类效果。

2.2 ResNet在皮肤疾病诊断中的应用研究

黑色素瘤是一种由黑素细胞引起的恶性皮肤癌,在皮肤癌疾病中,恶性黑色素瘤是最常见且最致命的皮肤癌之一,黑色素瘤在早期若能得到正确治疗,是可以痊愈的。通过对残差神经网络学习算法的改进可以提高皮肤疾病分类诊断结果,其改进包括集成ResNet、特征级融合以及鲸鱼算法优化等,图 7给出了残差神经网络在皮肤疾病诊断中的应用情况。残差神经网络在皮肤疾病诊断研究方面的主要工作有:Harangi(2018)采用集成的方法融合了AlexNet,GoogLeNet,VGG(visual geometry group)和ResNet等4种不同深度神经网络架构的分类层的输出,根据CNNs的加权输出进行最终分类,获得较高的分类精度;Guo和Yang(2018)提出的皮肤损伤分析框架——多通道残差神经网络,基本思想是组合多个残差神经网络,将图像分别放入不同的ResNet中,并且连接特征层以获得最终的预测结果;李航等人(2018)提出基于深度残差网络的皮肤镜图像黑色素瘤的识别算法,采用预训练ResNet-152提取皮肤病变图像深层特征,利用支持向量机(SVM)对提取的黑色素瘤特征进行分类。该方法在有限的训练数据下解决黑色素瘤的类内差异大、黑色素瘤与非黑素瘤之间的类间差异小的问题;胡海根等人(2019)针对黑色素瘤分类识别任务中存在对比度低、信息干扰大等问题,采用基于掩盖的数据增强与深度残差神经网络相结合的集成分类方法,该集成分类模型弥补了单一残差神经网络在黑色素瘤分类中的缺陷。Zhang等人(2019)采用改进的鲸鱼算法来优化CNN模型用于皮肤癌诊断,通过AlexNet,VGG-16,Inception-v3和ResNet等模型进行对比实验,以验证该方法的有效性。

图 7 残差神经网络在皮肤疾病诊断中的应用
Fig. 7 ResNet application in skin disease diagnosisl

2.3 ResNet在乳腺诊断中的应用研究

乳腺癌是女性最常见的恶性肿瘤之一,严重影响女性的身心健康甚至威胁生命。通过对残差神经网络学习算法的改进可以提高乳腺疾病诊断结果,其改进包括对数据集进行不平衡处理、数据增强、随机剪裁和角度旋转等,图 8给出了残差神经网络在乳腺疾病诊断中的应用情况。残差神经网络在乳腺诊断研究方面的主要工作有:Chougrad等人(2018)采用迁移学习方法对乳房X线图像进行肿瘤检测,先提取感兴趣区域进行预处理,采用迁移学习方法微调ResNet;Gandomkar等人(2018)利用深层残差神经网络对乳腺组织病理学图像进行多分类问题时,将恶性图像细分为4个癌症亚型,良性图像分为4个亚型,通过使用元决策树将不同放大因子处理后的图像的输出组合起来进行分类;褚晶辉等人(2018)针对良恶性乳腺肿瘤检测,对数据集进行不平衡处理和数据增强,利用卷积神经网络提取特征, 并利用SVM进行分类, 然后计算CNN的特征图的分类F1分数, 选取分类性能最高的一层作为微调节点, 最后连接重新设计的两层全连接层组成新的网络;Li等人(2019)提出了DenseNet-Ⅱ神经网络模型用于准确良恶性乳腺图像分类,DenseNet-Ⅱ采用Inception结构取代DenseNet第1层卷积,该模型保持网络结构的稀疏性。Deng等人(2020)提出了结合一种改进SE-Attention机制的CNN模型用于乳腺癌疾病诊断,改进的SE-Attention机制允许网络选择性地增强有用的特征并抑制无用的特征,从而实现特征的有效学习,实验表明,基于SE-Attention的Inception-V4和DenseNet网络性能有较大提高。

图 8 残差神经网络在乳腺疾病诊断中的应用
Fig. 8 ResNet application in breast disease diagnosis

2.4 ResNet在大脑疾病诊断中的应用研究

阿尔茨海默病(Alzheimer’s disease, AD)是一种不可逆的脑病,伴有记忆和认知功能的进行性损害。当前AD没有有效的治愈方法,其早期诊断对于患者护理和治疗尤为重要,而核磁共振成像(MRI)对AD的诊断具有重要的脑解剖变化评价作用,对脑部病理进展评估和治疗具有重要意义,图 9给出了残差神经网络在大脑疾病诊断中的应用情况。残差神经网络在大脑疾病诊断研究方面的主要工作有:Li和Liu(2018)提出了基于密集卷积神经网络的分类方法,用于学习核磁共振脑图像的各种局部特征,并将其结合到AD分类中;刘振丙等人(2018)提出多尺度残差神经网络,采用不同大小的卷积核对图像进行多尺度信息采集,并对神经网络进行残差学习;Murad等人(2018)提出利用3维深度残差神经网络建立脑年龄预测模型,在3维扫描中提取脑结构的判别特征;Chen等人(2018)提出基于voxelwise的残差网络(VoxResNet),将多模态和多层次的上下文信息集成到网络中,利用不同模态的互补信息,提取出不同规模的特征,实现准确分割大脑结构。Liu等人(2020)提出多任务深度模型和DenseNet集成的深度网络用于AD分类,网络采用多任务深度CNN模型获得图像多级特征,深度3D DenseNet模型从图像中学习特征以进行疾病分类,将模型中学习的功能进行组合以对疾病状态进行最终分类。

图 9 残差神经网络在大脑疾病诊断中的应用
Fig. 9 ResNet application in the brain disease diagnosis

2.5 ResNet在糖尿病诊断中的应用研究

糖尿病性视网膜病变(糖网病)是由长期的糖尿病引起的一种眼科疾病, 将导致患者视力下降, 最终失明。糖网病作为糖尿病最严重的并发症之一,是现今适龄工作人口最主要的致盲因素。视网膜上渗出物的存在是糖尿病性视网膜病变的早期征兆,渗出物的自动检测可以提高对该病的诊断。通过对残差神经网络学习算法的改进可以提高糖尿病诊断结果,其改进包括随机梯度下降优化方法更新权重等,图 10给出了残差神经网络在糖尿病诊断中的应用情况。残差神经网络在糖尿病诊断研究方面的主要工作有:Wan等人(2018)将卷积神经网络引入到糖尿病性视网膜病变检测,采用迁移学习和超参数调优方法进行训练分类,采用随机梯度下降优化方法更新权重;Mo等人(2018)针对糖尿病黄斑水肿(diabetic macular edema, DME)进行检测,首先采用完全卷积的残差网络准确分割渗出物,然后在分割结果的基础上,裁剪出以概率最大的像素为中心的区域,并将其输入到另一个深度残差网络中以区分DME;邹北骥等人(2019)提出多类别训练数据下的残差神经网络糖网病筛查方法,构建糖网病眼底图数据集,然后针对高分辨率图像数据集构建残差网络模型分类;Khojasteh等人(2019)针对糖尿病性视网膜病变检测,采用预训练ResNet-50训练并提取特征,使用SVM进行分类。

图 10 残差神经网络在糖尿病诊断中的应用
Fig. 10 ResNet application in diabetes diagnosis

2.6 ResNet在血液病诊断中的应用研究

血液中白细胞的比例通常是疾病的指标,通过计数血液中白细胞的数量和比例,将白细胞分类计数用于诊断疾病的过程中。白细胞试验在检测和治疗白血病、贫血等疾病中起着至关重要的作用。人上皮2型(HEp-2)细胞图像分类在许多自身免疫性疾病的诊断及后续治疗中起着重要作用。通过对残差神经网络学习算法的改进可以提高血液疾病诊断结果,其改进包括深度监管机制改善梯度流的传播,以减轻梯度消失的问题,添加随机噪声和颜色变化来生成新图像、更改原始图像中RGB通道的强度等,图 11给出了残差神经网络在血液疾病诊断中的应用情况。残差神经网络在血液病诊断研究方面的主要工作有:Lei等人(2018)提出基于深度监督残差网络的框架对HEp-2细胞图像进行分类,采用ResNet提取特征,对网络进行深度监督,减轻梯度消失的问题,进一步提升分类性能;Qin等人(2018)针对白细胞的精细分类构建了残差神经网络的白细胞分类器,根据白细胞检测的先验知识调整深度神经网络分类器的拓扑结构,然后构建显微图像数据集,通过水平或垂直翻转图像、添加随机噪声、对原始图像变化颜色、提高原始图像中RGB通道的强度等方法进行数据扩增,该方法具有良好的泛化能力;Shen等人(2018)提出HEp-2细胞分类的深交叉残差神经网络,基于交叉连接的残差块以增加不同网络层之间的信息流并取得较好实验效果。Xie等人(2019)提出了深度监督全卷积网络用于对HEp-2细胞图像分割,该网络使用上采样来恢复原始输入图像的高分辨率,分层监督以捕获浅层的特征信息,通过获取图层之间的本地和全局信息,获得高分辨率的预测输出。

图 11 残差神经网络在血液疾病诊断中的应用
Fig. 11 ResNet application in blood disease diagnosis

目前深度神经网络在各种疾病诊断中广泛应用,积极推动深度神经网络在医学图像领域的发展,能够更好地辅助医生对疾病的检测与诊断,对疾病的治疗有着重要意义。

3 结语

本文阐述了残差神经网络学习算法;从激活函数、损失函数、参数优化算法、学习衰减率算法、归一化和正则化技术6方面进行总结;探讨残差神经网络在医学图像中的应用;梳理了残差神经网络在肺部肿瘤、皮肤疾病、乳腺癌、大脑疾病、糖尿病、血液病等6种疾病诊断中的应用研究;为临床计算机辅助诊断提供参考。

深度学习在医学图像未来的发展方向应集中在以下几个方面:

1) 多源影像数据具有丰富语义信息,构建融合多源影像数据的泛化模型(周沛等,2019)及综合辅助诊断,将帮助医生更好地获得丰富的图像信息,从而提高诊断效果和效率。

2) 大数据小标注问题。由于大量的临床肿瘤图像数据缺乏有效的数据标注,发展以非监督(无监督)和弱监督(半监督)学习(郑光远等,2018)为主的深度学习模型完成数据的自动标注,具有重要的意义;除此之外,还可以考虑的思路有迁移学习、多任务约束、先验知识引导和数据生成等。

3) 进行基于医学影像的大样本分析时,为了使实验数据能更全面地反映所研究的问题,尽量使用更多数据。虽然国内医院并不缺少医学图像,但海量的病例资料和医学图像并不一定能转化为有效的AI训练和测试的样本数据,不同场景下的标准、规范的医学图像数据集仍然缺乏。

4) AI医疗在国家政策、行业巨大需求的背景下,AI产业蓬勃发展,促进了科研与临床实践相结合的研究,为AI医疗影像的发展夯实基础。在具体实施过程中,应从具体的应用场景出发,使实验数据接近临床。

综上所述,在大数据和AI的第4次工业革命的背景下,可预见AI技术有望进一步推动医疗水平的发展,具有无限广阔的应用前景。

参考文献

  • Bello I, Zoph B, Vasudevan V and Le Q V. 2017. Neural optimizer search with reinforcement learning//Proceedings of the 34th International Conference on Machine Learning. Sydney: PMLR: 459-468
  • Chen H, Dou Q, Yu L Q, Qin J, Heng P A. 2018. VoxResNet:deep voxelwise residual networks for brain segmentation from 3D MR images. NeuroImage, 170: 446-455 [DOI:10.1016/j.neuroimage.2017.04.041]
  • Chougrad H, Zouaki H, Alheyane O. 2018. Deep Convolutional Neural Networks for breast cancer screening. Computer Methods and Programs in Biomedicine, 157: 19-30 [DOI:10.1016/j.cmpb.2018.01.011]
  • Chu J H, Wu Z R, Lyu W, Li Z. 2018. Breast cancer diagnosis system based on transfer learning and deep convolutional neural networks. Laser and Optoelectronics Progress, 55(8): #081001 (褚晶辉, 吴泽蕤, 吕卫, 李喆. 2018. 基于迁移学习和深度卷积神经网络的乳腺肿瘤诊断系统. 激光与光电子学进展, 55(8): #081001) [DOI:10.3788/LOP55.081001]
  • Clevert D A, Unterthiner T and Hochreiter S. 2016. Fast and accurate deep network learning by exponential linear units (ELUs)[EB/OL].[2020-05-26]. https://arxiv.org/pdf/1511.07289.pdf
  • Dai Y J, Yan S J, Song C L. 2018. Benign or malignant lung nodules classification model based on modified DenseNet. Chinese Journal of Medical Imaging Technology, 34(7): 1104-1109 (戴垚均, 闫士举, 宋成利. 2018. 基于密集网络改进的肺结节良恶性分类模型. 中国医学影像技术, 34(7): 1104-1109) [DOI:10.13929/j.1003-3289.201710013]
  • Dauphin Y N, Pascanu R, Gulcehre C, Cho K, Ganguli S and Bengio Y. 2014. Identifying and attacking the saddle point problem in high-dimensional non-convex optimization//Proceedings of the 27th International Conference on Neural Information Processing Systems. Cambridge: ACM: 2933-2941
  • Deng J, Ma Y Y, Li D A, Zhao J M, Liu Y, Zhang H. 2020. Classification of breast density categories based on SE-Attention neural networks. Computer Methods and Programs in Biomedicine, 193: #105489 [DOI:10.1016/j.cmpb.2020.105489]
  • Du J, Chen Y H, Zhang L, Mai Y C. 2018. Energy-efficient facial expression recognition based on improved deep residual networks. Computer Science, 45(9): 303-307, 319 (杜进, 陈云华, 张灵, 麦应潮. 2018. 基于改进深度残差网络的低功耗表情识别. 计算机科学, 45(9): 303-307, 319) [DOI:10.11896/j.issn.1002-137X.2018.09.051]
  • Feng Y X, Li Y M. 2018. An overview of deep learning optimization methods and learning rate attenuation methods. Hans Journal of Data Mining, 8(4): 186-200 (冯宇旭, 李裕梅. 2018. 深度学习优化器方法及学习率衰减方式综述. 数据挖掘, 8(4): 186-200) [DOI:10.12677/HJDM.2018.84020]
  • Gan J Y, Zhai Y K, Huang Y, Zeng J Y, Jiang K Y. 2019. Research of facial beauty prediction based on deep convolutional features using double activation layer. Acta Electronica Sinica, 47(3): 636-642 (甘俊英, 翟懿奎, 黄聿, 曾军英, 姜开永. 2019. 基于双激活层深度卷积特征的人脸美丽预测研究. 电子学报, 47(3): 636-642) [DOI:10.3969/j.issn.0372-2112.2019.03.017]
  • Gandomkar Z, Brennan P C, Mello-Thoms C. 2018. MuDeRN:multi-category classification of breast histopathological image using deep residual networks. Artificial Intelligence in Medicine, 88: 14-24 [DOI:10.1016/j.artmed.2018.04.005]
  • Glorot X, Bordes A and Bengio Y. 2011. Deep sparse rectifier neural networks//Proceedings of the 14th International Conference on Artificial Intelligence and Statistics. Fort Lauderdale: JMLR: 315-323
  • Gong P, Cheng Y H, Wang X S. 2015. Benign or malignant classification of lung nodules based on semantic attributes. Acta Electronica Sinica, 43(12): 2476-2483 (巩萍, 程玉虎, 王雪松. 2015. 基于语义属性的肺结节良恶性分类. 电子学报, 43(12): 2476-2483) [DOI:10.3969/j.issn.0372-2112.2015.12.020]
  • Guo S T, Yang Z W. 2018. Multi-Channel-ResNet:an integration framework towards skin lesion analysis. Informatics in Medicine Unlocked, 12: 67-74 [DOI:10.1016/j.imu.2018.06.006]
  • Harangi B. 2018. Skin lesion classification with ensembles of deep convolutional neural networks. Journal of Biomedical Informatics, 86: 25-32 [DOI:10.1016/j.jbi.2018.08.006]
  • He K M, Zhang X Y, Ren S Q and Sun J. 2015. Delving deep into rectifiers: surpassing human-level performance on ImageNet classification//Proceedings of the 2015 IEEE International Conference on Computer Vision (ICCV). Santiago: IEEE: 1026-1034[DOI:10.1109/ICCV.2015.123]
  • He K M, Zhang X Y, Ren S Q and Sun J. 2016. Deep residual learning for image recognition//Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE: 770-778[DOI:10.1109/CVPR.2016.90]
  • Hu H G, Kong X Y, Zhou Q W, Guan Q, Chen S Y. 2019. Melanoma classification method by integrating deep convolutional residual network. Computer Science, 46(5): 247-253 (胡海根, 孔祥勇, 周乾伟, 管秋, 陈胜勇. 2019. 基于深层卷积残差网络集成的黑色素瘤分类方法. 计算机科学, 46(5): 247-253) [DOI:10.11896/j.issn.1002-137X.2019.05.038]
  • Hu W J, Chen W, Feng H Z, Zhang T P, Zhu Z M, Pan Q M. 2017. A survey of depth learning methods for detecting lung nodules by CT images. Journal of Zhejiang University (Science Edition), 44(4): 379-384 (胡伟俭, 陈为, 冯浩哲, 张天平, 朱正茂, 潘巧明. 2017. 应用于平扫CT图像肺结节检测的深度学习方法综述. 浙江大学学报(理学版), 44(4): 379-384) [DOI:10.3785/j.issn.1008-9497.2017.04.001]
  • Ioffe S and Szegedy C. 2015. Batch normalization: accelerating deep network training by reducing internal covariate shift//Proceedings of the 32nd International Conference on Machine Learning. Lille: JMLR: 448-456
  • Ioffe S. 2017. Batch renormalization: towards reducing minibatch dependence in batch-normalized models//Proceedings of the 31st Conference on Neural Information Processing Systems. Long Beach: NIPS: 1942-1950
  • Khojasteh P, Júnior L A P, Carvalho T, Rezende E, Aliahmad B, Papa J P, Kumar D K. 2019. Exudate detection in fundus images using deeply-learnable features. Computers in Biology and Medicine, 104: 62-69 [DOI:10.1016/j.compbiomed.2018.10.031]
  • Krizhevsky A, Sutskever I and Hinton G E. 2012. ImageNet classification with deep convolutional neural networks//Proceedings of the 25th International Conference on Neural Information Processing Systems. Red Hook: Curran Associates Inc.: 1097-1105
  • Lei H J, Han T, Zhou F, Yu Z, Qin J, Elazab A, Lei B Y. 2018. A deeply supervised residual network for HEp-2 cell classification via cross-modal transfer learning. Pattern Recognition, 79: 290-302 [DOI:10.1016/j.patcog.2018.02.006]
  • Li F, Liu M H. 2018. Alzheimer's disease diagnosis based on multiple cluster dense convolutional networks. Computerized Medical Imaging and Graphics, 70: 101-110 [DOI:10.1016/j.compmedimag.2018.09.009]
  • Li H, Yu Z, Ni D, Lei B Y, Wang T F. 2018. Melanoma recognition in dermoscopy images via deep residual network. Chinese Journal of Biomedical Engineering, 37(3): 274-282 (李航, 余镇, 倪东, 雷柏英, 汪天富. 2018. 基于深度残差网络的皮肤镜图像黑色素瘤的识别. 中国生物医学工程学报, 37(3): 274-282) [DOI:10.3969/j.issn.0258-8021.2018.03.003]
  • Li H, Zhuang S S, Li D A, Zhao J M, Ma Y Y. 2019. Benign and malignant classification of mammogram images based on deep learning. Biomedical Signal Processing and Control, 51: 347-354 [DOI:10.1016/j.bspc.2019.02.017]
  • Liang M M, Zhou T, Xia Y, Zhang F F, Yang J. 2018. Lung tumor images recognition based on PSO-ConvK convolutional neural network. Journal of Shandong University (Engineering Science), 48(5): 77-84 (梁蒙蒙, 周涛, 夏勇, 张飞飞, 杨健. 2018. 基于PSO-ConvK卷积神经网络的肺部肿瘤图像识别. 山东大学学报(工学版), 48(5): 77-84) [DOI:10.6040/j.issn.1672-3961.0.2018.191]
  • Lin T Y, Goyal P, Girshick R, He K M and Dollár P. 2017. Focal loss for dense object detection//Proceedings of 2017 IEEE International Conference on Computer Vision. Venice: IEEE: 2980-2988[DOI:10.1109/ICCV.2017.324]
  • Litjens G, Kooi T, Bejnordi B E, Setio A A A, Ciompi F, Ghafoorian M, Van Der Laak J A W M, Van Ginneken B, Sánchez C I. 2017. A survey on deep learning in medical image analysis. Medical Image Analysis, 42: 60-88 [DOI:10.1016/j.media.2017.07.005]
  • Liu M H, Li F, Yan H, Wang K D, Ma Y X, Initiative A D N, Shen L, Xu M Q. 2020. A multi-model deep convolutional neural network for automatic hippocampus segmentation and classification in Alzheimer's disease. NeuroImage, 208: #116459 [DOI:10.1016/j.neuroimage.2019.116459]
  • Liu W Y, Wen Y D, Yu Z D and Yang M. 2016. Large-margin softmax loss for convolutional neural networks//Proceedings of the 33rd International Conference on International Conference on Machine Learning. New York: ACM: 507-516
  • Liu W Y, Wen Y D, Yu Z D, Li M, Raj B and Song L. 2017. Sphereface: deep hypersphere embedding for face recognition//Proceedings of 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE: 212-220[DOI:10.1109/CVPR.2017.713]
  • Liu Z B, Fang X S, Yang H H, Lan R S. 2018. The diagnosis of Alzheimer's disease classification based on multi-scale residual neutral network. Journal of Shandong University (Engineering Science), 48(6): 1-7, 18 (刘振丙, 方旭升, 杨辉华, 蓝如师. 2018. 基于多尺度残差神经网络的阿尔茨海默病诊断分类. 山东大学学报(工学版), 48(6): 1-7, 18) [DOI:10.6040/j.issn.1672-3961.0.2018.205]
  • Loshchilov I and Hutter F. 2017. SGDR: stochastic gradient descent with warm restarts[EB/OL].[2020-05-26]. https://arxiv.org/pdf/1608.03983.pdf
  • Maier A, Syben C, Lasser T, Riess C. 2019. A gentle introduction to deep learning in medical image processing. Zeitschrift für Medizinische Physik, 29(2): 86-101 [DOI:10.1016/j.zemedi.2018.12.003]
  • Mo J, Zhang L, Feng Y Q. 2018. Exudate-based diabetic macular edema recognition in retinal images using cascaded deep residual networks. Neurocomputing, 290: 161-171 [DOI:10.1016/j.neucom.2018.02.035]
  • Murad A, Kwon G R, Pyun J Y. 2018. P2-402:brain age prediction from minimally preprocessed MRI scans using 3D deep residual neural networks. Alzheimer's and Dementia, 14(7S): #859 [DOI:10.1016/j.jalz.2018.06.1094]
  • Nair V and Hinton G E. 2010. Rectified linear units improve restricted boltzmann machines//Proceedings of the 27th International Conference on International Conference on Machine Learning. Madison: ACM: 807-814
  • Nibali A, He Z, Wollersheim D. 2017. Pulmonary nodule classification with deep residual networks. International Journal of Computer Assisted Radiology and Surgery, 12(10): 1799-1808 [DOI:10.1007/s11548-017-1605-6]
  • Qin F W, Gao N N, Peng Y, Wu Z Z, Shen S Y, Grudtsin A. 2018. Fine-grained leukocyte classification with deep residual learning for microscopic images. Computer Methods and Programs in Biomedicine, 162: 243-252 [DOI:10.1016/j.cmpb.2018.05.024]
  • Ranjan R, Castillo C D and Chellappa R. 2017. L2-constrained softmax loss for discriminative face verification[EB/OL].[2020-05-26]. https://arxiv.org/pdf/1703.09507.pdf
  • Ruder S. 2016. An overview of gradient descent optimization algorithms[EB/OL].[2020-05-26]. https://arxiv.org/pdf/1609.04747.pdf
  • Shen L L, Jia X, Li Y X. 2018. Deep cross residual network for HEp-2 cell staining pattern classification. Pattern Recognition, 82: 68-78 [DOI:10.1016/j.patcog.2018.05.005]
  • Tian J X, Liu G C, Gu S S, Ju Z J, Liu J G, Gu D D. 2018. Deep learning in medical image analysis and its challenges. Acta Automatica Sinica, 44(3): 401-424 (田娟秀, 刘国才, 谷珊珊, 鞠忠建, 刘劲光, 顾冬冬. 2018. 医学图像分析深度学习方法研究与挑战. 自动化学报, 44(3): 401-424) [DOI:10.16383/j.aas.2018.c170153]
  • Tustison N J, Avants B B, Lin Z X, Feng X, Cullen N, Mata J F, Gee J C, Altes T A, Mugler III J P, Qing K. 2019. Convolutional neural networks with template-based data augmentation for functional lung image quantification. Academic Radiology, 26(3): 412-423 [DOI:10.1016/j.acra.2018.08.003]
  • Wan L, Zeiler M, Zhang S X, LeCun Y, Fergus R. 2013. Regularization of neural networks using dropconnect. Journal of machine Learning Research, 28: 1058-1066
  • Wan S H, Liang Y, Zhang Y. 2018. Deep convolutional neural networks for diabetic retinopathy detection by image classification. Computers and Electrical Engineering, 72: 274-282 [DOI:10.1016/j.compeleceng.2018.07.042]
  • Wang H, Wang Y T, Zhou Z, Ji X, Gong D H, Zhou J C, Li Z F and Liu W. 2018. CosFace: large margin cosine loss for deep face recognition//Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE: 5265-5274[DOI:10.1109/CVPR.2018.00552]
  • Wang W B, Chen D L, Dai X C. 2018. UAV aerial image recognition based on deep residual Net. Computer Science and Application, 8(10): 1613-1619 (王文博, 陈大雷, 戴宪策. 2018. 基于深度残差网络的无人机航拍图像识别. 计算机科学与应用, 8(10): 1613-1619) [DOI:10.12677/CSA.2018.810177]
  • Wen Y D, Zhang K P, Li Z F and Qiao Y. 2016. A discriminative feature learning approach for deep face recognition//Proceedings of 14th European Conference on Computer Vision. Amsterdam, The Netherlands: Springer: 499-515[DOI:10.1007/978-3-319-46478-7_31]
  • Xiao H H, Yuan C L, Feng S T, Luo Y J, Huang B S. 2019. Research progress of computer aided diagnosis in cancer based on deep learning. International Journal of Medical Radiology, 42(1): 22-25, 58 (肖焕辉, 袁程朗, 冯仕庭, 罗宴吉, 黄炳升. 2019. 基于深度学习的癌症计算机辅助分类诊断研究进展. 国际医学放射学杂志, 42(1): 22-25, 58) [DOI:10.19300/j.2019.Z6366zt]
  • Xie H, Lei H J, He Y J, Lei B Y. 2019. Deeply supervised full convolution network for HEp-2 specimen image segmentation. Neurocomputing, 351: 77-86 [DOI:10.1016/j.neucom.2019.03.067]
  • Xu B, Wang N Y, Chen T Q and Li M. 2015. Empirical evaluation of rectified activations in convolutional network[EB/OL].[2020-05-26]. https://arxiv.org/pdf/1505.00853.pdf
  • Xu Y F, Wang H G, Liu X, Sun W T. 2019. An improved multi-branch residual network based on random multiplier and adaptive cosine learning rate method. Journal of Visual Communication and Image Representation, 59: 363-370 [DOI:10.1016/j.jvcir.2019.01.030]
  • Yao Y J, Zhang L. 2019. Pulmonary nodule detection via hybrid loss based joint fine-tuning and multi-scale classification. Application Research of Computers, 36(9): 2872-2875, 2880 (姚宇瑾, 张利. 2019. 基于混合损失联合调优与多尺度分类相结合的肺结节检测算法. 计算机应用研究, 36(9): 2872-2875, 2880) [DOI:10.19734/j.issn.1001-3695.2018.03.0153]
  • Zhang N, Cai Y X, Wang Y Y, Tian Y T, Wang X L, Badami B. 2020. Skin cancer diagnosis based on optimized convolutional neural network. Artificial Intelligence in Medicine, 102: #101756 [DOI:10.1016/j.artmed.2019.101756]
  • Zhang Q Q, Wang H F, Yoon S W, Won D, Srihari K. 2019. Lung nodule diagnosis on 3D computed tomography images using deep convolutional neural networks. Procedia Manufacturing, 39: 363-370 [DOI:10.1016/j.promfg.2020.01.375]
  • Zheng G Y, Liu X B, Han G H. 2018. Survey on medical image computer aided detection and diagnosis systems. Journal of Software, 29(5): 1471-1514 (郑光远, 刘峡壁, 韩光辉. 2018. 医学影像计算机辅助检测与诊断系统综述. 软件学报, 29(5): 1471-1514) [DOI:10.13328/j.cnki.jos.005519]
  • Zhou P, Chen H J, Yu Z K, Peng Y H, Li Y F, Yang F. 2019. Review of cross-modality medical image prediction. Acta Electronica Sinica, 47(1): 220-226 (周沛, 陈后金, 于泽宽, 彭亚辉, 李艳凤, 杨帆. 2019. 跨模态医学图像预测综述. 电子学报, 47(1): 220-226) [DOI:10.3969/j.issn.0372-2112.2019.01.029]
  • Zhu H, Qin P L. 2019. U-Net pulmonary nodule detection algorithm based on multi-scale feature structure. Computer Engineering, 45(4): 254-261 (朱辉, 秦品乐. 2019. 基于多尺度特征结构的U-Net肺结节检测算法. 计算机工程, 45(4): 254-261) [DOI:10.19678/j.issn.1000-3428.0051769]
  • Zou B J, Zhang Z Q, Zhu C Z, Chen C L, Liu J, Ouyang P B. 2019. Automatic screening of diabetic retinopathy based on residual network. Journal of Computer-Aided Design and Computer Graphics, 31(4): 581-588 (邹北骥, 张子谦, 朱承璋, 陈昌龙, 刘佳, 欧阳平波. 2019. 基于残差网络的糖网病自动筛查. 计算机辅助设计与图形学学报, 31(4): 580-588) [DOI:10.3724/SP.J.1089.2019.17346]