Print

发布时间: 2022-03-16
摘要点击次数:
全文下载次数:
DOI: 10.11834/jig.210682
2022 | Volume 27 | Number 3




    计算机断层扫描图像    




  <<上一篇 




  下一篇>> 





结构图注意力网络的新冠肺炎轻重症诊断
expand article info 刘彦北1,2, 李赫南3, 张长青4, 肖志涛1, 张芳1, 隗英5, 高耀宗5, 石峰5, 单飞6, 沈定刚5,7
1. 天津工业大学生命科学学院, 天津 300387;
2. 天津光电检测技术与系统重点实验室, 天津 300387;
3. 天津工业大学电子与信息工程学院, 天津 300387;
4. 天津大学智能与计算学部, 天津 300073;
5. 上海联影智能医疗科技有限公司, 上海 200232;
6. 复旦大学附属公共卫生临床中心, 上海 201508;
7. 上海科技大学生物医学工程学院, 上海 201210

摘要

目的 为辅助医生快速分辨新型冠状病毒肺炎(corona virus disease 2019, COVID-19)轻、重症患者,以便对症下药减轻医疗负担,提出一种基于结构图注意力网络的轻重症诊断算法。方法 基于胸部CT图像提取的特定特征以及肺段间的位置关系构建结构图,以肺部内不同肺段为节点,以提取特征为节点属性。采用图神经网络汇聚相邻节点特征,再利用池化层获取分别代表左肺叶和右肺叶特征的图表示。使用结构注意力机制计算左、右肺叶的感染情况对结果诊断的重要性,并依据重要性融合左、右肺叶图表示以得到最终图表示,最后执行分类任务。由于数据中存在明显的类别不平衡现象,采用Focal-Loss损失函数优化模型以减轻对分类结果的影响。结果 实验将所提算法分别与传统机器学习方法和流行的图神经网络算法做性能对比。在重症诊断的准确率上,本文算法相较于传统机器学习方法和图神经网络算法分别取得14.2%~42.0%和3.6%~4.8%的提升。在AUC(area under curve)指标上,本文算法相较于上述两种算法分别取得8.9%~18.7%和3.1%~3.6%的提升。除此之外,通过消融实验发现具有结构注意力机制的算法相较于未使用的算法在SPE(specificity)、SEN(sensitivity)和AUC 3个指标上分别取得了2.4%、1.4%和1.1%的提升;应用Focal-Loss损失函数的算法相较于未使用的算法提升了2.1%、1.1%和0.9%。结论 所提出的诊断模型综合了图神经网络以及结构注意力机制的优点,引入Focal-Loss损失函数,提升了困难样本的分类准确率,使诊断结果更加准确。

关键词

新冠肺炎(COVID-19)诊断; 图神经网络(GNN); 结构注意力机制; 拓扑结构图; 图分类

Diagnosis of COVID-19 by using structural attention graph neural network
expand article info Liu Yanbei1,2, Li Henan3, Zhang Changqing4, Xiao Zhitao1, Zhang Fang1, Wei Ying5, Gao Yaozong5, Shi Feng5, Shan Fei6, Shen Dinggang5,7
1. School of Life Sciences, Tiangong University, Tianjin 300387, China;
2. Tianjin Key Laboratory of Optoelectronic Detection Technology and Systems, Tianjin 300387, China;
3. School of Electronic and Information Engineering, Tiangong University, Tianjin 300387, China;
4. College of Intelligence and Computer, Tianjin University, Tianjin 300073, China;
5. Department of Research and Development, Shanghai United Imaging Intelligence Co., Ltd., Shanghai 200232, China;
6. Department of Radiology, Shanghai Public Health Clinical Center, Fudan University, Shanghai 201508, China;
7. School of Biomedical Engineering, ShanghaiTech University, Shanghai 201210, China
Supported by: National Natural Science Foundation of China (61901297)

Abstract

Objective The primary routine clinical diagnosis of COVID-19(corona virus disease 2019) is usually conducted based on epidemiological history, clinical manifestations and various laboratory detection methods, including nucleic acid amplification test (NAAT), computed tomography (CT) scan and serological techniques. However, manual detection is costly, time-consuming and leads to the potential increase of the infection risk of clinicians. As a good alternative, artificial intelligence techniques on available data from laboratory tests play an important role in the confirmation of COVID-19 cases. Some studies have been designed for distinguishing between novel coronavirus pneumonia, community-acquired pneumonia and normal people by graph neural network. However, these studies leverage the relationships between features to build a topological structure graph (e.g., connecting the nodes with high similarity), while ignoring the inner relationships between different parts of the lung, and thus limiting the performance of their models. To address this issue, we propose a graph neural network with hierarchical information inherent to the physical structure of lungs for the improved diagnosis of COVID-19. Besides, an attention mechanism is introduced to capture the discriminative features of different severities of infection in the left and right lobes of different patients. Method Firstly, the topological structure is constructed based on the lungs' physical structure, and different lung segments are regarded as different nodes. Each node in the graph contains three kinds of handcrafted features, such as volume, density and mass feature, which reflect the infection in each lung segment and can be extracted from chest CT images using VB-Net. Secondly, based on graph neural network (GNN) and attention mechanism, we propose a novel structural attention graph neural network (SAGNN), which can perform the graph classification task. The SAGNN first aggregates the features in a given sample graph, and then uses the attention mechanism to effectively fuse the different features to obtain the final graph representation. This representation is then fed into a linear layer with softmax activation function that performs graph classification, so that the corresponding sample graph can be finally classified as a mild case or a severe one. To alleviate the effect of category imbalance on the classification results, we use the focal loss function. We optimize the proposed model via back propagation and learn the representations of graphs. Result To verify the effectiveness of the proposed method, we compared SAGNN with several classical machine learning methods and graph classification methods on a real COVID-19 dataset, which includes 358 severe cases and 1 329 mild cases, provided by Shanghai Public Health Clinical Center. The result of comparative experiments was measured using three evaluation metrics including the sensitivity (SEN), the specificity (SPE) and the area under the receiver operating characteristic(ROC) curve (AUC). In the experiments, our model had a good performance, indicating the effectiveness of our model. Based on comparison with the classical machine learning methods and the graph neural network methods, SAGNN outperformed by 14.2%~42.0% and 3.6%~4.8% in terms of SEN, respectively. In terms of AUC, the performance of SAGNN increased by 8.9%~18.7% and 3.1%~3.6%, respectively. In addition, through the ablation experiments of SAGNN, we found that the SAGNN with attention mechanism outperformed by 2.4%, 1.4% and 1.1% in SPE, SEN and AUC than the SAGNN not with attention mechanism, respectively. The SAGNN with focal loss function outperformed by 2.1%, 1.1% and 0.9% in SPE, SEN and AUC than the SAGNN with cross-entropy loss function, respectively. Conclusion In this work, we propose SAGNN, a new architecture for the diagnosis of severe and mild cases of COVID-19. Experimental results show the superior performance of SAGNN on classification task. Experimental results show that concatenating features of lung segments by their structure is effective. Moreover, we introduce an attention mechanism to distinguish the infection degree of right and left lungs. The focal loss is used to solve the issue of imbalanced group distribution, which further improves the overall network performance. We thus demonstrate the potential of SAGNN as clinical diagnosis support in this highly critical domain of medical intervention. We believe that our architecture provides a valuable case study for the early diagnosis of COVID-19, which is helpful for improvement in the field of computer-aided diagnosis and clinical practice.

Key words

corona virus disease 2019(COVID-19) diagnosis; graph neural network(GNN); structural attention mechanism; topology diagram; graph classification

0 引言

新型冠状病毒肺炎(corona virus disease 2019,COVID-19),简称“新冠肺炎”,其临床表现高度可变,当患者转为重症时,严重者可能会快速出现急性呼吸窘迫综合征、脓毒症休克等症状(Corman等,2020),病情恶化速度较快。因此,辅助医生快速准确地分辨轻重症病人进行针对性治疗无疑可以有效减轻患者病情,降低死亡率,对于新冠肺炎治疗具有十分重要的意义。通常判断新冠肺炎患者病情需要依赖医生丰富的诊断经验,医生通过临床检测、胸部CT图像等方法了解、判断患者病情,为其提供针对性治疗。但临床检测费时费力且大大增加了医生的感染风险。因此,作为一个替代的选择,基于医学影像的人工智能计算机检测方法成为辅助医生诊断的有力依据(左艳等,2021),它可以加快疾病诊治速度,减少医护人员与患者的直接接触次数,降低感染风险。

目前已有大量学者利用机器学习、深度学习等手段进行新冠肺炎的检测与分析研究,但新冠肺炎轻重症的诊断仍旧是一个难点。首先是因为轻重症患者的人数比例严重不平衡,轻症患者数目远多于重症患者数目。依据中国疾病预防控制中心(Chinese center for disease control and prevention, CDC)的报告以及中国—世界卫生组织的联合报告,在中国新冠肺炎患者中,约包含14%重症患者和6%危重患者(Wu和McGoogan,2020World Health Organization,2020)。因为重症与危重症均需重点关注,本文将其统一称为重症。此时轻重症患者比例约为4 ∶1(Wei等,2020),因此在使用真实数据集执行分类任务时将面临巨大的挑战;其次,不同患者感染新冠肺炎的程度不同,病灶大小不同,症状复杂,轻重症不易判断;最后,因为当前样本不足,直接利用图像执行分类任务容易过拟合。针对上述问题, Zhu等人(2021)利用Shan等人(2020)提出的VB-Net算法提取胸部CT图像中肺部患病区域的密度、体积和质量3种特定特征,并进一步利用特征实现了轻重症样本的分类任务。该方法首先利用1-范数进行特征选择降低维度,再利用0-范数平衡轻重症样本类别数目降低类别不平衡的影响,最后使用逻辑回归与线性回归的方法判别样本属于轻症患者或是重症患者并预测轻症样本有可能在未来多少天内转为重症。该算法首次对轻症与重症进行区分,并可预测转重症天数,但它存在计算复杂度高,性能与人为设定的0-范数、1-范数高度依赖,重症分类的准确率不高等问题。

针对上述问题和难点,提出一种基于结构图注意力网络的新冠肺炎轻重症诊断算法,用以提高新冠肺炎轻重症诊断的准确率。具体地讲,即以肺部实际解剖结构构建拓扑图,将左、右肺叶内的肺段当做节点,对应位置的CT图像提取特征作为节点属性。通过上述方法每个样本均可获得代表左、右肺叶的两幅子图。算法利用图神经网络获取不同节点的表示后再通过池化层获取左、右肺叶的图表示。此时图表示中既包含了CT图像提取特征,也融合了肺部结构信息。其次,因为每个样本的左、右肺叶感染程度不同,引入结构注意力机制,分别计算不同样本左、右肺叶对于自身疾病诊断的重要性大小,以此融合左、右肺叶的特征。最后,为解决数据中存在的轻重症样本类别不平衡问题,引入Focal-Loss损失函数。

本文主要贡献如下:1)提出结构图注意力网络的新冠肺炎轻重症诊断算法(structural attention graph neural network, SAGNN),该方法结合肺部的感染特征和真实的解剖结构信息利用图神经网络学习左、右肺叶图表示,并利用结构注意力机制融合左、右肺叶图表示获得最终整体图表示,以图分类的方式完成轻重症的判别。2)在模型中引入结构注意力机制——依据左、右肺叶对判别结果的重要性大小决定左肺叶特征与右肺叶特征汇聚时的权重系数。针对数据集内轻重症类别不平衡问题,采用Focal-Loss损失函数,提高困难样本的分类准确率。3)利用真实数据集验证模型有效性。良好的实验结果表明相比于其他方法,算法判别COVID-19轻、重度病例更加准确,尤其是重症判别的准确率取得了较大的提升。

1 相关工作

图(graph)在现实世界中是普遍存在的,如社交网络、引文网络和生物网络均可以构成图。它们通常以单个样本为节点,以样本间的关系为连接构建图。图$\boldsymbol{G}$中包含众多节点与边,$\boldsymbol{G}$=($\boldsymbol{V}$, $\boldsymbol{E}$),$\boldsymbol{V}$代表图中节点的集合,$\boldsymbol{E}$代表图中边的集合。每个节点$v$均有自己的特征向量,节点之间的连接传递着重要的信息。在图神经网络(graph neural networks, GNNs)(Micheli,2009Scarselli等,2009)中通常遵循递归邻域聚合的规则,每个节点依靠聚合其邻居节点的特征获得自身特征向量。经过$k$次聚合后,节点可以聚合$k$阶邻居节点的特征。目前,图学习已成为机器学习的一个重要研究方向,它可以连接到多种任务中,如图分类(Ying等,2018)、节点分类(Kipf和Welling,2016)和链路预测(Zhang和Chen,2018)等。

图分类是图学习中的一个重要任务,它通常在节点聚合其邻居节点的特征后利用池化层得到整图的表示,例如利用均值池化(mean-pooling)的方式将所有节点的特征值加和求平均以获得图表示。目前,学者们已经提出了许多通过优化聚合方式或池化层获得图表示的图分类方法。首先是优化聚合方式的方法,Hamilton等人(2017)提出GraphSAGE(graph sample and aggregate),该方法可以学习聚合邻居信息的“聚合函数”,均匀地采样固定个数的邻居。Xu等人(2018)提出了GIN(graph isomorphism network),该网络针对GraphSAGE的局限性,通过理论证明聚合函数采用SUM-Pooling的方式可获得更加优秀的性能。依据改变池化方式优化模型性能的方法包括Zhang等人(2018)提出的DGCNN(deep graph convolutional neural network),它采用一种特殊的包含排序和对齐功能的池化方式Sort-Pooling获取最终图表示。Ying等人(2018)提出的DiffPool同样针对池化层进行改动,它引入了一种自适应池化机制,该机制可以基于一种监督标准来获取当前层的节点表示。

当前,在新冠肺炎诊断领域图神经网络多用于新冠肺炎传播模式预测以及可使用药物预测。Kapoor等人(2020)利用图神经网络进行新冠肺炎传播模式模拟,其中节点表示区域级别的人类接触数据,边基于人类间的互相接触构建。Fritz等人(2021)也采用类似方法,两种模型均取得了不错的效果。Ioannidis等人(2020)Doshi和Chepuri(2020)Cheung和Moura(2020)则利用图神经网络预测医治新冠肺炎的药物或药物分子特性,结果也均令人满意。除此之外,也有一些学者利用图神经网络执行与新冠肺炎有关的分类任务,但大多数分类任务集中于区分新冠肺炎患者和非患者或区分新冠肺炎患者、普通肺炎患者和非患者。例如,Wang等人(2021)提出了FGCNet,即利用提出的DFF(deep feature fusion)融合CNN(convolutional neural network)与GCN(graph neural networks)分别提取图像特征与自注意力特征。Saha等人(2021)将提取的肺部边缘信息与图神经网络结合,仅考虑肺部边缘而不是整幅图,进而执行图分类任务,区分患者病情(包括二分类与三分类)。目前,面向轻、重症新冠肺炎分类任务的研究较少。Goncharov等人(2021)提出的模型可以识别COVID-19的潜在病例并量化病情程度,将其形式化为分类任务以及肺部患病百分比的估计任务。Zhu等人(2021)预测了样本是否为轻重症以及轻症转重症的时间。

尽管目前基于深度学习的新冠肺炎研究取得了不错的效果,但这些方法均忽略了人体内肺部不同部位间的内在联系,没有考虑实际结构信息。另外,上述方法同样未考虑肺叶患病程度不同对最终诊断结果的影响。因此提出一种基于结构图注意力网络的新冠肺炎轻重症诊断算法以解决上述问题。

2 本文方法

利用从CT图像中提取的质量特征、体积特征和密度特征3种特定特征以及肺部结构信息判别样本当前处于新冠肺炎轻症阶段或是重症阶段。模型主要分为4个部分:1)图的构建。利用肺部真实解剖结构以及特定特征构建图,肺叶中的肺段代表节点,CT图像提取特征为节点属性。每个样本构建的图包含两幅子图,分别代表左肺叶与右肺叶。2)节点级特征聚合策略。利用图神经网络聚合邻居节点信息,再利用池化层得到左肺叶和右肺叶分别对应的图表示。3)图级特征聚合策略。利用结构注意力机制聚合左、右肺叶图表示获得最终图表示,即计算左、右肺叶图表示对新冠肺炎轻重症判别的重要性大小,重要性越大,在聚合最终图表示时设置的注意力参数值将越大。4)分类结果及损失函数。利用分类器执行图分类任务获得最终分类结果。同时,利用Focal-Loss损失函数降低类别不平衡对分类结果的影响。具体算法框架图如图 1所示。

图 1 方法框架图
Fig. 1 Framework of the proposed method

2.1 图的构建

有效的图结构是应用图神经网络算法的重要基础。Tian等人(2020)以样本作为节点,基于样本特征之间的相似性来定义图边。Rakhimberdina和Murata(2019)提出以大脑中不同区域作为节点,区域的时间序列之间的函数关联构成边,获得的节点表示用于自闭症诊断。本文利用图神经网络引入肺部的结构信息,寻找特征间的潜在联系。因此提出以肺部内各肺段的实际位置关系构建结构图,将肺部结构作为图的结构信息融入图神经网络中,得到包含信息更加丰富的特征。

人体内肺包含左肺叶与右肺叶。右肺叶由上、中、下3个肺叶组成,其中包含10个肺段。左肺叶由上、下2个肺叶组成,其中包含8个肺段。在构建的图中因左、右肺叶间通过支气管连通无直接接触,因此将左、右肺叶构建的图看做两幅子图,代表右肺叶的图包含10个节点(10个肺段),代表左肺叶的图包含8个节点(8个肺段),二者间无连接。当肺段间具有实际接触关系时,连接它们对应的节点构成无向边。同时,利用CT分析工具(Shan等,2020)从胸部CT图像中提取密度特征、体积特征和质量特征。密度特征定义为当前输入区域的平均CT值,CT值也称为HU值(Hounsfield unit);体积特征为当前输入区域的体积;质量特征依据密度特征与体积特征计算而得,可表示为

$ m{\rm{ }} = (HU{\rm{ }} + 1{\rm{ }}000) \times {\rm{ }}V{\rm{ }} \times 0.{\rm{ }}001 $

$m$为质量,$V$为体积。

依据上述方法,提取每一肺段的整体密度特征、质量特征和体积特征,以及每一肺段中患病区域的密度特征、质量特征和体积特征。最终单一肺段提取特征的总维度为37。

提出的图用$\left\{ {{\mathit{\boldsymbol{G}}^1}, \cdots, {\mathit{\boldsymbol{G}}^k}} \right\} \subseteq \mathit{\boldsymbol{G}}, {\mathit{\boldsymbol{G}}^k} = \left({{\mathit{\boldsymbol{V}}^k}, {\mathit{\boldsymbol{E}}^k}} \right)$描述,即每个样本包含$k$幅子图($k=2$),其中$\boldsymbol{G}^{1}$代表左肺叶的结构图,$\boldsymbol{G}^{2}$代表右肺叶的结构图。$\boldsymbol{V}^{k}$表示第$k$幅子图中的节点,$\boldsymbol{E}^{k}$表示第$k$幅子图的边。

2.2 节点级特征聚合策略

为了获取有效的图表示,首先需要汇聚肺部内各个肺段的特征,利用GNN汇聚邻居节点特征的计算方法可表示为

$ \begin{array}{*{20}{c}} {\mathit{\boldsymbol{h}}_v^{(l, k)} = \mathit{Re}LU\left({\mathit{\boldsymbol{M}} \cdot \mathit{SUM}\left\{ {\mathit{\boldsymbol{h}}_u^{(l - 1, k)}} \right\}} \right)}\\ {u \in \mathit{\boldsymbol{N}}(v) \cup \{ v\} } \end{array} $ (1)

式中,$\boldsymbol{h}^{(l, k)}_{v}$代表样本所包含的第$k$幅子图中节点$v$在第$l$次迭代时汇聚的表示。每个样本共需计算两幅子图的特征,即分别代表左、右肺叶的两幅子图。初始化$\boldsymbol{h}^{(0, k)}_{v}$=$\boldsymbol{x}^{k}_{v}$$\boldsymbol{N}(v)$代表节点$v$的邻居节点集,$\boldsymbol{M}$是一个可学习的变换矩阵,$ReLU$代表激活函数。通过式(1)可以获得经历$l$次迭代后节点$v$的表示。

为了计算出每幅子图的重要性,首先需要利用pooling层汇聚节点特征,得到图表示$\boldsymbol{z}^{k}$,具体方法可表示为

$ {\mathit{\boldsymbol{z}}^k} = SUM\left\{ {\mathit{\boldsymbol{h}}_v^{(l, k)}, v \in {\mathit{\boldsymbol{G}}^k}} \right\} $ (2)

式中,$SUM$代表Sum-pooling,它将所有属于该图的节点特征进行累加,获得最终图表示用于后续计算。

2.3 图级注意力特征聚合策略

在传统图神经网络中,注意力机制往往应用于节点汇聚邻居特征时为不同邻居节点施加不同大小的注意力,本文将注意力机制应用于图级别。因为新冠肺炎患者左、右肺叶的感染程度往往是不相同的,所以在判别轻重症时应该对左、右肺叶给予不同的关注度。将作用于节点间的注意力机制转换为可应用于图级别的结构注意力机制,计算不同结构图所汇聚出的图表示对判别分类结果时的重要性,即计算左肺叶图表示以及右肺叶图表示分别对判别样本属于轻症还是重症新冠肺炎患者这一结果的重要性大小。通过图级别结构注意力机制达到对更能影响诊断结果的肺叶施加更大关注度的目的。引入的图级别结构注意力的计算方法可统一表示为

$ \left({{\beta ^1}, \cdots, {\beta ^k}} \right) = \mathit{att}\left({{\boldsymbol{z}^1}, \cdots, {\boldsymbol{z}^k}} \right) $ (3)

式中,$att(·)$代表注意力层,即研究中应用的图级别结构注意力机制模块。$β^{k}$代表经过深度卷积网络后所获得的第$k$幅子图的重要性大小。通过式(3)可以发现,每幅子图对判别结果的重要性是依据其自身所得图表示计算出的,与其他因素无关。

为了得到不同图表示向量对分类结果判别的重要性,SAGNN将图神经网络所得到的表示输入到非线性网络中进行整合,即将图表示输入到注意力层求出每一幅子图的影响力大小,具体计算为

$ {p^k} = {\mathit{\boldsymbol{a}}^{\rm{T}}} \cdot \tanh \left({\mathit{\boldsymbol{W}} \cdot {\boldsymbol{z}^k} + \mathit{\boldsymbol{b}}} \right) $ (4)

式中,$\boldsymbol{W}$是权重矩阵,$\boldsymbol{b}$是偏差向量,$\boldsymbol{a}$代表注意力层。$p^{k}$表示第$k$幅子图的影响力大小。此时,不同的样本共享同样的$\boldsymbol{W}$$\boldsymbol{b}$以及$\boldsymbol{a}$这些网络参数,但因每个样本的子图所得到的图表示不相同,即输入不同,所以获得的影响力$p^{k}$不同。

在得到每幅子图对于样本诊断的影响力后,利用Softmax函数进行归一化,计算为

$ {\beta ^k} = \frac{{\exp \left({{p^k}} \right)}}{{\sum\limits_{i = 1}^k {\exp } \left({{p^k}} \right)}} $ (5)

式中,$β^{k}$是第$k$幅子图的重要性大小,$\sum {{\beta ^k}} $。第$k$幅子图获得的$β^{k}$越大,代表由图神经网络所得到的图表示对判别结果的重要性越大,当前肺叶越有助于完成分类任务。

在计算出不同图表示对最终判别结果的重要性后,利用重要性将所有图表示汇聚为最终图表示。该过程可理解为在获得不同肺叶对疾病判别的重要性大小后,将不同肺叶的特征汇聚成一个统一的隐表示,该隐表示即为最终的图特征。计算为

$ \boldsymbol{z} = \sum\limits_{k = 1}^2 {{\beta ^k}} \cdot {\boldsymbol{z}^k} $ (6)

式中,$\boldsymbol{z}$是获得的最终图表示。为了更加清晰地说明图级别结构注意力特征聚合策略,图 2展示了具体的计算过程。

图 2 图级结构注意力特征聚合策略
Fig. 2 Explanation of attention based graph-level representation learning

2.4 分类结果及损失函数

为获得样本的分类结果,将分类器用于输出当前样本分别属于两个类别的概率。通过获得其中较大概率值的索引值得到样本分类结果,完成新冠肺炎轻重症诊断。同时面对训练中存在的新冠肺炎轻症患者与新冠肺炎重症患者间严重的类别不平衡问题,采用Focal-Loss损失函数进行优化,以减少对分类结果的影响。Focal-Loss损失函数的具体表示为

$ L = \frac{1}{n}\sum\limits_{m = 1}^n - \alpha {\left({1 - {\bf{C}} \cdot {\mathit{\boldsymbol{z}}_m}} \right)^\gamma } \cdot {y_m} \cdot \log \left({{\bf{C}} \cdot {\mathit{\boldsymbol{z}}_m}} \right) $ (7)

式中,$\boldsymbol{C}$代表分类器中全部参数。该分类器由线性层与Softmax激活函数构成,输入最终图表示执行分类任务,诊断当前样本属于轻症或是重症。$n$是训练集中包含的样本数目,$\boldsymbol{z}_{m}$是样本$m$的最终图表示,$y_{m}$是样本$m$的标签,$α$$γ$是超参数。SAGNN通过反向传播优化所提出的模型,学习图的表示。

2.5 本文算法

SAGNN采用4层GNN层和1层注意力层。任意两个GNN层间均包含一个批标准化层(batch normalization,BN)和一个ReLU层。注意力层由两层线性层以及线性层中间的激活函数tanh组成。分类器由1层线性层和softmax函数组成,预测最终分类结果。

训练过程中的隐表示维度设置为128。Adam优化器和反向传播算法用于优化模型,初始学习率为0.001,每100个周期学习率衰减0.3倍,batch-size设置为64,训练次数设置为400。采用10倍交叉验证策略对所有比较方法进行评价,给出了性能的均值和标准差。

算法步骤如下:

输入:样本肺部不同部位的特定提取特征;$α=0.325$$γ=2$

输出:轻重症诊断结果。

1) 初始化图神经网络参数$\boldsymbol{M}$$\boldsymbol{W}$$\boldsymbol{b}$$\boldsymbol{a}$$\boldsymbol{C}$,并利用输入特征与肺部实际结构构建结构图。

2) 汇聚节点信息,得到分别对应左、右肺叶的两个图表示。

3) 利用图表示以及图级结构注意力机制,分别计算左、右肺叶的重要性。

4) 根据计算的重要性汇聚左、右肺叶表示,得到最终图表示。

5) 利用分类器输出分类结果。

3 实验结果及分析

3.1 数据集

采用的数据集由上海公共卫生临床中心和联影公司联合提供。目前,上海公共卫生临床中心的伦理委员会已批准了研究方案。数据集中所有患者均由中国疾病预防控制中心(CDC)根据新冠病毒核酸抗体的阳性结果进行确认。数据集包含336名患者,每名患者提供的不同次检测结果作为样本。数据集共包含样本1 687例,其中包括1 328个新冠肺炎轻症样本和358个新冠肺炎重度样本。每例样本所对应性别和数据集内患者年龄分布如表 1图 3所示。CT图像由日立医疗公司的SCENARIA-64、飞利浦的Brilliance-64和UIH的uCT528三种型号的仪器采集。拍摄CT时充分吸气屏住呼吸,电压为120 kV,重建厚度1~1.5 mm。本研究中所有使用的特征均是利用V-Net模型自CT图像中分割不同肺段和肺段中的患病区域所得。

表 1 样本性别分布
Table 1 Subject distribution in terms of gender

下载CSV
性别 重症样本 轻症样本 总数
女性 143 680 823
男性 215 649 864
总数 358 1 329 1 687
图 3 患者年龄分布
Fig. 3 Subject distributions in terms of age

3.2 性能分析

3.2.1 评价指标及对比方法

因数据集样本内部类别不平衡现象较为严重,准确率无法直观衡量模型算法性能,因此采用ROC(receiver operating characteristic)曲线下面积(area under curve, AUC)、灵敏度(sensitivity, SEN)和特异度(specificity, SPE)进行评价,SEN与SPE的计算方法可表示为

$ \begin{array}{l} {f_{{\rm{SEN}}}} = \frac{{TP}}{{TP + FN}}\\ {f_{{\rm{SPE}}}} = \frac{{TN}}{{TN + FP}} \end{array} $ (8)

式中,$TP$为真阳率,代表样本为重症且预测为重症的样本数;$FN$为假阴率,代表样本为重症但预测为轻症的样本数;$FP$为假阳率,代表样本为轻症但预测为重症的样本数;$TN$为真阴率,代表样本为轻症且预测为轻症的样本数。综上,SEN为重症判别准确率,SPE为轻症判别准确率,AUC为ROC曲线下的面积,3个评价指标数值越大代表模型性能越好。

为验证模型的有效性,本文算法分别与经典的机器学习方法和流行的图分类算法进行比较,经典的机器学习方法有支持向量机(support vector machines, SVM)(Cao等,2006)、逻辑回归(logistic regression, LR)(Ng和Jordan, 2000)、高斯朴素贝叶斯(Gaussian naive Bayes, GNB)(Xue和Titterington, 2002)和多项式朴素贝叶斯(multinomial naive Bayes, MNB)(Xue和Titterington, 2002);图分类算法有图卷积网络(graph convolution network, GCN)(Kipf和Welling,2016)、GraphSAGE(graph sample and aggregate)(Hamilton等,2017)和GIN(graph isomorphism network)(Xu等,2018)。此外,在算法框架下,为验证结构注意力机制对分类结果的有效性以及损失函数Focal-Loss对类别不平衡问题优化的有效性,考虑了3种变体,即SAGNN-atten、SAGNN-FL与SAGNN-atten-FL进行消融实验。SAGNN-atten在汇聚左、右肺叶特征时,不再计算左、右肺叶的重要性,赋予二者相等的重要性,损失函数采用Focal-Loss;SAGNN-FL仍计算左、右肺叶重要性,但损失函数替换为交叉熵损失函数;SAGNN-atten-FL不计算左、右肺叶重要性且采用交叉熵损失函数。

所有对比模型均遵循原始参数,且与SAGNN采用相同的10倍交叉验证,最终取10次结果的平均值与方差,所有实验的具体结果如表 2表 3所示。

表 2 分类实验结果
Table 2 Classification results

下载CSV
方法 SPE SEN AUC
LR 0.958±0.011 0.414±0.094 0.686±0.050
SVM 0.973±0.023 0.585±0.108 0.729±0.054
GNB 0.855±0.030 0.498±0.089 0.676±0.051
MNB 0.954±0.020 0.307±0.044 0.631±0.025
GCN 0.889±0.020 0.679±0.065 0.784±0.033
Graph-SAGE 0.902±0.025 0.690±0.077 0.782±0.046
GIN 0.883±0.043 0.691±0.079 0.787±0.044
SAGNN(本文) 0.913±0.032 0.727±0.094 0.818±0.043
注:加粗字体表示最优结果。

表 3 消融实验结果
Table 3 Ablation experimental results

下载CSV
方法 SPE SEN AUC
SAGNN-atten-FL 0.895±0.071 0.682±0.065 0.796±0.037
SAGNN-FL 0.919±0.067 0.696±0.041 0.807±0.035
SAGNN-atten 0.916±0.028 0.693±0.098 0.805±0.049
SAGNN 0.913±0.032 0.727±0.094 0.818±0.043
注:加粗字体表示最优结果。

3.2.2 结果分析

表 2主要展示了SAGNN与对比方法的性能比较。从表 2中可以看出,传统机器学习方法的轻症诊断准确率(SPE)普遍较高而重症准确率(SEN)普遍较低,这是因为使用的训练集中轻重症样本比例约为4 ∶1,且测试集同样如此。与此同时,包括SAGNN在内的所有应用图神经网络的模型在具有相同训练集与测试集的情况下,SEN方面取得了较好的提升。此时轻症判别准确率虽然有所降低但并不多,且重症判别准确率提升使得AUC得到提升。基于上述对比,可以发现引入图结构对于新冠肺炎的轻重症分类诊断是有帮助的。

SAGNN算法与传统机器学习方法相比在SEN上取得了较大的提升(14.2%~42.0%),与其他图神经网络的方法相比提升了3.6%~4.8%。与此同时,SAGNN在AUC指标上也取得了一定的提升,在与传统方法和图分类算法对比时取得了8.9%~18.7%和3.1%~3.6%的提升。为了更直观地对模型性能进行比较,实验提供了最终图表示的可视化聚类结果,如图 4所示。具体而言,通过t-SNE(van Der Maaten,2014)工具箱将SAGNN和不同对比算法学习到的最终图表示分别投影到2维空间中形成样本点,并根据样本点的标签对其着色。在图 4中,蓝色和红色样本点分别代表COVID-19轻症样本和COVID-19重症样本。不同颜色的样本点类间距离越大、类内聚敛效果越好,代表模型获得的表示效果越好,越有利于分类。通过图 4可以发现,相比于图 4(a)—(c)的方法,图 4(d)的方法中红蓝样本点间的界限最为清晰,两类样本的类间距离最大。但同时也可以发现,本文方法的类内聚集效果并不十分理想,样本点间距离较分散,这可能是因为缺少类内约束的原因。

图 4 可视化实验结果
Fig. 4 Comparison of visualization of results on dataset among different methods((a)GCN; (b)GIN; (c)Graph-SAGE; (d)SAGNN)

表 3中展示了消融实验的结果,可以发现注意力机制与Focal-Loss损失函数在模型中均起到积极的作用。通过对比SAGNN-atten-FL与SAGNN-FL和SAGNN-atten,可以发现结构注意力机制对于模型的提升相对更大,在SPE,SEN,AUC指标上SAGNN-FL比SAGNN-atten-FL提升了2.4%,1.4%,1.1%;SAGNN-atten比SAGNN-atten-FL提升了2.1%,1.1%,0.9%。

3.3 算法分析

3.3.1 拓扑结构图分析

通过表 2可以发现未利用图结构的传统机器学习方法对于重症的分类效果明显低于利用了图拓扑结构的图神经网络方法,其中基于图的方法(不包括SAGNN)在SEN方面领先传统机器学习方法10.6%~38.4%,在AUC方面领先5.8%~15.6%。由此可以发现引入图结构对疾病的判别具有帮助,对于重症的判别能力提升明显。为了进一步证明所提出的基于肺部结构构建拓扑结构图的科学性,计算了不同肺段特征两两之间的相关性$r$,计算公式为

$ \begin{array}{*{20}{c}} {r = \frac{1}{m} \times }\\ {\sum\limits_1^m {\left| {\frac{{\sqrt {\left({{\mathit{\boldsymbol{x}}_p}{\mathit{\boldsymbol{x}}_q} - \frac{{\sum {{\mathit{\boldsymbol{x}}_p}} {\mathit{\boldsymbol{x}}_q}}}{d}} \right.} }}{{\sqrt {\left({\mathit{\boldsymbol{x}}_p^2 + \frac{{{{\left({\sum {{\mathit{\boldsymbol{x}}_p}} } \right)}^2}}}{d}} \right)\left({\sum {\mathit{\boldsymbol{x}}_q^2} + \frac{{{{\left({\sum {{\mathit{\boldsymbol{x}}_q}} } \right)}^2}}}{d}} \right)} }}} \right|} } \end{array} $ (9)

式中,$\boldsymbol{x}_{p}$$\boldsymbol{x}_{q}$为要计算相关性的两个特征向量,$d$为向量维度,$m$为所有样本数。在计算过程中,对结果取绝对值。为方便观察用热力图表示其数值大小,相关性越大颜色越深。依据统计学相关理论,$|r|≤0.5$为不相关或低度相关;$0.5<|r|≤0.7$为中度相关;$0.7<|r|≤1$为高度相关。图 5为计算的相关性结果。图中LS_1~LS_8分别代表左肺叶8个肺段,RS_1~RS_10分别代表右肺叶的10个肺段。

图 5 肺段间相关性
Fig. 5 Correlation of lung segment features
((a)left lung segment; (b)right lung segment)

在构建图结构过程中,以左肺叶为例,将左肺上叶前段(LS_1)与左肺上叶上舌段(LS_2)和左肺下叶背段(LS_4)分别相连,除此之外左肺上叶前段与其他节点无连接。与此同时可以发现,如图 5(a)所示,LS_1与LS_2,LS_4的相关性相比其他节点更高,这也证明在它们之间存在着潜在的联系。肺部间相连肺段患病特征具有高度相关性这一现象也说明了构图方法的合理性,即相互接触的肺段的患病特征较为相似。

3.3.2 结构注意力机制分析

图 6分别统计了在训练集和测试集上不同样本对左、右肺叶特征的注意力分配情况,蓝色柱状图代表分配给样本右肺叶的重要性大于左肺叶,红色柱状图代表样本左肺叶的重要性大于右肺叶。通过图 6可以发现在训练集中右肺叶在疾病判别中扮演更重要角色的样本数是左肺叶扮演更重要角色的样本数的2.79倍,测试集中恰好为3倍,二者比例较为一致。上述结果表明右肺叶通常对于新冠肺炎轻重症的判别有着更大的作用,这一结果从实验角度证明了在利用深度学习方法诊断新冠肺炎轻重症时左右肺重要性并不相同,验证了结构注意力机制的有效性。

图 6 左右肺叶重要性大小统计
Fig. 6 Statistics of the attention of left and right lungs

4 结论

基于图神经网络以及注意力机制,提出了结构图注意力网络的新冠肺炎轻重症诊断算法,利用肺部实际解剖结构构建拓扑图,引入结构注意力机制,以图分类的方法实现对于新冠肺炎轻重症样本的分类任务。同时,模型引入Focal-Loss损失函数, 降低样本类别不平衡对分类结果的影响。在新冠肺炎数据集上与其他方法相比,重症判别准确率取得了3.6%的提升,AUC指标取得了3.1%的提升。在下一步工作中,将会考虑将预测轻症样本是否会转为重症的概率和时间加入到任务中,以多任务的方式进一步优化模型,提升模型准确度。

参考文献

  • Cao L J, Keerthi S S, Ong C J, Uvaraj V, Fu X J, Lee H P. 2006. Developing parallel sequential minimal optimization for fast training support vector machine. Neurocomputing, 70(1-3): 93-104
  • Cheung M and Moura J M F. 2020. Graph neural networks for COVID-19 drug discovery//Proceedings of 2020 IEEE International Conference on Big Data (Big Data). Atlanta, USA: IEEE: 5646-5648 [DOI: 10.1109/bigdata50022.2020.9378164]
  • Corman V M, Landt O, Kaiser M, Molenkamp R, Meijer A, Chu D K W, Bleicker T, Brünink S, Schneider J, Schmidt M L, Mulders D G J C, Haagmans B L, van der Veer B, van der Brink S, Wijsman L, Goderski G, Romette J L, Ellis J, Zambon M, Peiris M, Goossens H, Reusken C, Koopmans M P G, Drosten C. 2020. Detection of 2019 novel coronavirus (2019-nCoV) by real-time RT-PCR. Eurosurveillance, 25(3): #2000045 [DOI:10.2807/1560-7917.es.2020.25.3.2000045]
  • Doshi S and Chepuri S P. 2020. Dr-COVID: graph neural networks for SARS-CoV-2 drug repurposing[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/2012.02151.pdf
  • Fritz C, Dorigatti E and Rügamer D. 2021. Combining graph neural networks and spatio-temporal disease models to predict COVID-19 cases in Germany[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/2101.00661.pdf
  • Goncharov M, Pisov M, Shevtsov A, Shirokikh B, Kurmukov A, Blokhin I, Chernina V, Solovev A, Gombolevskiy V, Morozov S, Belyaev M. 2021. CT-based COVID-19 triage: deep multitask learning improves joint identification and severity quantification. Medical Image Analysis, 71: #102054 [DOI:10.1016/j.media.2021.102054]
  • Hamilton W L, Ying R and Leskovec J. 2017. Inductive representation learning on large graphs[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/1706.02216.pdf
  • Ioannidis V N, Zheng D and Karypis G. 2020. Few-shot link prediction via graph neural networks for COVID-19 drug-repurposing[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/2007.10261.pdf
  • Kapoor A, Ben X, Liu L Y, Perozzi B, Barnes M, Blais M and O'Banion S. 2020. Examining COVID-19 forecasting using spatio-temporal graph neural networks[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/2007.03113.pdf
  • Kipf T N and Welling M. 2016. Semi-supervised classification with graph convolutional networks[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/1609.02907.pdf
  • Micheli A. 2009. Neural network for graphs: a contextual constructive approach. IEEE Transactions on Neural Networks, 20(3): 498-511 [DOI:10.1109/tnn.2008.2010350]
  • Ng A Y and Jordan M I. 2000. On discriminative vs. generative classifiers: A comparison of logistic regression and naive Bayes// Proceedings of the 14th International Conference on Neural Information Processing Systems: Natural and Synthetic. Colorado, USA: [s. n. ]: 841-848
  • Rakhimberdina Z and Murata T. 2019. Linear graph convolutional model for diagnosing brain disorders//Proceedings of the 8th International Conference on Complex Networks and Their Applications. Lisbon, Portugal: Springer: 815-826 [DOI: 10.1007/978-3-030-36683-4_65]
  • Saha P, Mukherjee D, Singh P K, Ahmadian A, Ferrara M, Sarkar R. 2021. GraphCOVIDnet: a graph neural network based model for detecting COVID-19 from CT scans and X-rays of chest. Scientific Reports, 11(1): #8304 [DOI:10.1038/s41598-021-87523-1]
  • Scarselli F, Gori M, Tsoi A C, Hagenbuchner M, Monfardini G. 2009. The graph neural network model. IEEE Transactions on Neural Networks, 20(1): 61-80 [DOI:10.1109/tnn.2008.2005605]
  • Shan F, Gao Y Z, Wang J, Shi W Y, Shi N N, Han M F, Xue Z, Shen D G and Shi Y X. 2020. Lung infection quantification of COVID-19 in CT images with deep learning[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/2003.04655.pdf
  • Tian Z Q, Li X J, Zheng Y Y, Chen Z, Shi Z, Liu L Z, Fei B W. 2020. Graph-convolutional-network-based interactive prostate segmentation in MR images. Medical Physics, 47(9): 4164-4176 [DOI:10.1002/mp.14327]
  • Van Der Maaten L. 2014. Accelerating t-SNE using tree-based algorithms. The Journal of Machine Learning Research, 15(1): 3221-3245
  • Wang S H, Govindaraj V V, Górriz J M, Zhang X, Zhang Y D. 2021. COVID-19 classification by FGCNet with deep feature fusion from graph convolutional network and convolutional neural network. Information Fusion, 67: 208-229 [DOI:10.1016/j.inffus.2020.10.004]
  • Wei W, Hu X W, Cheng Q, Zhao Y M, Ge Y Q. 2020. Identification of common and severe COVID-19: the value of CT texture analysis and correlation with clinical characteristics. European Radiology, 30(12): 6788-6796 [DOI:10.1007/s00330-020-07012-3]
  • World Health Organization. 2020. Report of the WHO-China joint mission on coronavirus disease 2019 (COVID-19)[EB/OL]. [2021-07-15]. https://www.who.int/publications/i/item/report-of-the-who-china-joint-mission-on-coronavirus-disease-2019-(covid-19)
  • Wu Z Y, McGoogan J M. 2020. Characteristics of and important lessons from the coronavirus disease 2019 (COVID-19) outbreak in China: summary of a report of 72 314 cases from the Chinese Center for Disease Control and Prevention. JAMA, 323(13): 1239-1242 [DOI:10.1001/jama.2020.2648]
  • Xue J H, Titterington D M. 2002. Comment on "on discriminative vs. generative classifiers: a comparison of logistic regression and naïve Bayes". Neural Processing Letters, 28(3): 169-187
  • Xu K, Hu W H, Leskovec J and Jegelka S. 2018. How powerful are graph neural networks?[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/1810.00826.pdf
  • Ying R, You J, Morris C, Ren X, Hamilton W L and Leskovec J. 2018. Hierarchical graph representation learning with differentiable pooling[EB/OL]. [2021-07-15]. https://arxiv.org/pdf/1806.08804.pdf
  • Zhang M H and Chen Y X. 2018. Link prediction based on graph neural networks [EB/OL]. [2021-07-15]. Proceedings of Advances in Neural Information Processing Systems 31: Annual Conference on Neural Information Processing Systems 2018. Montréal, Canada: [s. n. ]: 5171-5181. https://arxiv.org/pdf/1806.08804.pdf
  • Zhang M H, Cui Z C, Neumann M and Chen Y X. 2018. An end-to-end deep learning architecture for graph classification//Proceedings of the 32nd AAAI Conference on Artificial Intelligence. New Orleans, USA: AAAI: 4438-4445
  • Zhu X F, Song B, Shi F, Chen Y B, Hu R Y, Gan J Z, Zhang W H, Li M, Wang L Y, Gao Y Z, Shan F, Shi D G. 2021. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. Medical Image Analysis, 67: #101824 [DOI:10.1016/j.media.2020.101824]
  • Zuo Y, Huang G, Nie S D. 2021. Application and challenges of deep learning in the intelligent processing of medical images. Journal of Image and Graphics, 26(2): 305-315 (左艳, 黄钢, 聂生东. 2021. 深度学习在医学影像智能处理中的应用与挑战. 中国图象图形学报, 26(2): 305-315) [DOI:10.11834/jig.190470]