摘要:目的近年来,随着深度学习、4K相机和无人机技术的迅猛发展,远距离小目标检测取得了显著进展,其应用范围广泛涵盖刑侦、城市规划和灾害救援等领域。然而,无人机远距拍摄导致目标尺寸较小,细节信息易在成像过程中丢失。尽管扩散模型在超分辨率领域取得了一定进展,但无人机图像具有高分辨率和物体稀疏分布的特点,对整幅图像进行超分辨率处理会造成大量资源浪费。此外,局部空间特征和全局判别性特征对小目标的定位和分类至关重要。现有模型通过顺序堆叠卷积神经网络和Transformer结构,分别对图像的局部空间特征和全局语义特征进行编码,以实现更精确的目标检测。但Transformer的序列编码结构忽略了图像的局部空间信息,这种局部空间信息的缺失在卷积与自注意力层的混合堆叠过程中被进一步放大,导致特征表示存在固有的分离性。方法针对上述问题,提出融合前景细化和多维归纳偏置自注意力的无人机小目标检测。前景细化模块通过类别无关的多层协同显著性映射方法筛选前景图像块,结合条件扩散模型生成前景区域的细化图像,恢复小目标的关键细节,从而在减少背景区域计算负担的同时提高了检测精度。多维归纳偏置自注意力网络包括多维自注意力模块、混合增强前馈模块、尺度耦合模块和邻域特征交互模块。多维自注意力模块将自注意力分解到水平和垂直两个维度,强化了对空间位置信息的捕捉,弥补图像转为一维序列后空间结构信息的损失,同时引入并行的归纳偏置感知路径,实现局部与全局特征的协同表征,避免了特征分离。融合后的特征进入混合增强前馈模块,通过动态卷积核响应不同目标区域,进一步提升对局部信息的敏感度。此外,尺度耦合模块通过多重卷积与自注意力交互,能够最大限度保留局部与全局特征。最后,邻域特征交互模块通过逐层聚合邻域特征汇总不同层的信息,确保预测特征图中包含充分的无人机小目标信息。结果为了验证所提方法的有效性,在3个数据集上与当前先进的检测方法进行了广泛的对比实验,实验结果在精确率、召回率、平均检测精度和IoU(intersection of union)阈值为0.5的平均准确率均有显著提高,IoU阈值为0.5的平均准确率在3个数据集上分别达到53.2%、38.7%和93.9%。相较于基线方法分别提高了9.7%、9.5%和1.2%。结论实验结果表明,所提方法拥有在无人机场景下处理复杂背景和小目标检测的强大能力。代码开源在https://github.com/CUMT-GMSC/MIBSN。
摘要:目的图表示学习在社交网络、生物信息及推荐系统等领域应用广泛。无监督图对比学习因其无需大量标注数据即可获取高质量节点表示而备受关注,但现有方法普遍存在增强策略单一、对比粒度粗放等问题,影响嵌入表示质量。方法针对上述问题,本文提出一种结合局部-全局图增强技术与多重神经网络协同建模的多维度图对比学习模型(local augmentation and SVD based on triple network for multi-dimensional graph comparative learning,LAST-MGCL)。首先,构建局部增强图神经网络和奇异值分解增强模块,分别从节点邻域信息和整体拓扑模式出发,对原始图数据进行多粒度增强;其次,设计由多头注意力图神经网络构成的三重编码网络,分别处理原始图和增强图,通过跨网络信息交互强化多视图融合表示;最后,提出跨网络对比、跨视图对比与邻居对比相结合的多维度对比损失,协同优化图表示质量。结论在节点分类任务上,LAST-MGCL模型在Cora、Citeseer和PubMed数据集上的平均分类准确率分别达到82.5%、72.5%和81.6%,整体优于当前主流对比学习方法,体现出较好的分类性能与鲁棒性;同时,在可视化任务中,LAST-MGCL生成的节点嵌入表现出更紧密的类内聚合与更清晰的类间边界,进一步验证了模型在表征学习中的有效性。综上,本文提出的LAST-MGCL面向无标签图数据场景,对现有图对比学习框架进行了系统性增强,为无监督图表征学习提供了一种有效解决方案。
摘要:目的在组织病理切片制备过程中,不可避免地会产生伪影,可能严重影响病理医生诊断准确性及计算机辅助诊断系统效能。现有伪影分类算法在处理相似伪影时,因缺乏全局分布规律学习能力,导致分类准确度并不理想。为此,本文提出了一种改善病理图像伪影多分类的局部与全局信息交互融合网络MoLiNet(mobile linear net)方法首先,构建了一个基于HSV颜色域的边缘检测模块以增强对裂缝的关注。然后在双分支架构的基础上,结合门控线性单元(gated linear unit,GLU)与移动倒残差瓶颈卷积模块(mobile inverted bottleneck convolution,MBConv)构建出一种新型前馈层,以自适应地筛选出关键特征,同时提高整体计算效率。此外,还提出了线性聚焦交叉注意力,以对全局特征和局部特征进行充分交互,从而增强特征表达能力。结果本文提出的网络在分类精度和计算效率方面均超越同类先进方法。在NCPDCSAD(ningbo clinical pathology diagnosis center similar artifact dataset)数据集测试中,我们的模型取得了94.24%准确率(Accuracy),超越了专门用于伪影分类的DKL网络。另一方面,本文构建的网络在参数量(Params)和计算量(Flops)上相较于DKL分别减少了80.91%和96.94%。此外,通过热力图可视化分析,进一步验证了本文提出的伪影分类网络对伪影特征具有敏锐捕捉能力。结论本方法不仅能够有效地区分组织病理切片中相似伪影,而且在计算资源消耗上实现了显著降低。这一研究成果为病理图像质量评估领域带来了一种有效解决方案。