摘要:目的多模态心脏磁共振(Cardiac Magnetic Resonance,CMR)图像预测非缺血性扩张型心肌病(Non-Ischemic Dilated Cardio Myopathy,NIDCM)的预后对临床中心力衰竭或心源性猝死等不同应用中发挥着重要作用。由于各个模态CMR图像对同一疾病的感兴趣区域(Regions Of Interest,ROI)不同,使得不同模态图像间的信息互补性和相关性关系复杂,导致多模态CMR图像在对NIDCM预后时表征困难。同时由于预后任务标注困难,可用于训练预后模型的有标注数据规模小,导致模型容易陷入局部最优。针对这两点挑战,提出了一种基于混合匹配蒸馏与对比互信息估计的模型,用于小样本上的多模态CMR图像对NIDCM预后。方法本文的预后模型有两种不同的设计,解决深度学习网络中多模态CMR图像的表征困难和模型容易陷入局部最优的问题。首先将不同模态CMR图像组合为不同的模态对,并提取对应的图像特征。由于不同模态对的预后目标一致而图像特征分布之间存在差异,因此设计一种混合匹配蒸馏网络,利用逻辑分布一致性将不同图像特征分布关联匹配,以此约束深度学习网络中多模态特征的提取和引导联合表征。然后在不同模态对之间设计一种互信息的对比学习策略,从而估计出多模态分布上的潜在的分类边界,以此作为预后模型的正则化项,避免模型在有限的数据上陷入局部最优。结果实验在一个NIDCM临床数据集上分别与最新的6种方法进行了比较。F1值和Acc值达到81.25%和85.61%;为了验证模型的泛化性,在一个脑肿瘤公共数据集上也分别与最新的4种方法进行了比较,F1值和Acc值达到85.07%和87.72%。结论本文所提出的基于混合匹配蒸馏与对比互信息估计的预后网络模型对多模态CMR图像进行了有效表征,同时利用多模态之间的潜在互信息增强深度学习模型在小样本场景下的模型优化,最终使得多模态CMR图像的对NIDCM预后结果更加准确。
摘要:目的经颅超声成像技术作为高效率、低成本且无创的诊断手段,已逐步应用于帕金森病患者认知功能障碍诊断。由于经颅超声图像信噪比低、成像质量差、目标组织复杂且相似度高,需要依赖专业医生手动检测。但是人工检测不仅费时费力,还可能因为操作者的主观因素影响,造成检测结果出现差异性。针对这一问题,本文提出了一种基于Swin Transformer和多尺度深度特征融合的YOLO-SF-TV(YOLO network based on Swin Transformer and multi-scale deep feature fusion for third ventricle)模型用于经颅超声图像三脑室检测,以提高临床检测准确率,辅助医生进行早期诊断。方法YOLO-SF-TV模型在YOLOv8的基础上使用基于窗口注意力的Swin Transformer作为模型特征提取网络,并引入空间金字塔池化合模块SPP-FCM(spatial pyramid pooling fast incorporating CSPNet and multiple attention mechanisms)扩大网络感受野,并增强多尺度特征融合能力。在网络的多尺度特征融合部分结合深度可分离卷积和多头注意力机制,提出了PAFPN-DM(path aggregation and feature pyramid network with depthwise separable convolution)模块,并对主干特征输出层增加多头注意力机制,以提高网络对不同尺度特征图中全局和局部重要信息的理解能力。与此同时,将传统卷积替换为深度可分离卷积模块,通过对每个通道单独卷积提高网络对不同通道敏感性,以保证模型准确度的同时降低训练参数和难度,增强模型的泛化能力。结果实验在本文收集的经颅超声三脑室图像数据及对应标签的数据集下进行,并与典型的目标检测模型对比实验。结果表明,本文提出的YOLO-SF-TV在经颅超声三脑室目标上mAP能够达到98.69%,相比于YOLOv8提升了2.12%,并与其他典型模型相比检测精度达到最优。结论本文提出的YOLO-SF-TV模型在经颅超声图像三脑室检测问题上表现优秀,SPP-FCM模块和PAFPN-DM模块可以增强模型检测能力,提高模型泛化性和鲁棒性,同时本文制作的数据集将有助于推动经颅超声三脑室图像检测问题的研究。