摘要:目的无人机小目标检测受运动模糊等因素影响,导致目标细节在成像过程中丢失。尽管超分辨技术能够还原目标细节,但全图处理会造成大量计算资源浪费。此外,现有模型通过顺序堆叠卷积和Transformer,因固有的范式冲突导致局部空间特征和全局特征存在分离性。方法本文提出融合前景细化和多维归纳偏置自注意力的无人机小目标检测。前景细化通过多层协同显著性映射方法筛选前景,并利用扩散模型仅对前景进行超分辨处理,从而在减少背景计算负担的同时提高检测精度。多维归纳偏置自注意力网络包括多维自注意力模块、混合增强前馈模块、尺度耦合模块和邻域特征交互模块。多维自注意力将自注意力分解到水平和垂直两个维度,强化对空间信息的感知,同时引入并行的归纳偏置感知路径,实现局部与全局特征的协同表征,避免特征分离。混合增强前馈模块和尺度耦合模块分别通过动态卷积和多重卷积与自注意力交互,能够最大限度保留局部与全局特征。最后,邻域特征交互模块通过逐层聚合邻域特征,确保预测特征图中包含充分的小目标信息。结果在3个数据集上与先进检测方法进行对比实验,精确率、召回率、平均检测精度和交并比(intersection of union,IoU)阈值为0.5的平均准确率均有显著提高,IoU阈值为0.5的平均准确率在3个数据集上分别达到53.2%、38.7%和93.9%,相较于基线方法分别提高9.7%、9.5%和1.2%。结论实验结果表明,所提方法在无人机场景下具有处理复杂背景和小目标检测的强大能力。代码开源链接https://github.com/CUMT-GMSC/MIBSN。
摘要:目的路面缺陷检测是道路维护和管理的重要环节,人工智能技术能够极大地提升路面缺陷检测的性能和效率。为解决当前路面缺陷检测算法难以满足在计算资源受限设备上进行实时检测的问题,本文基于YOLOv8(you only look once version 8)目标检测框架,结合部分卷积(partial convolution)与初始深度卷积(inception depthwise convolution)机制提出一种轻量级的路面缺陷检测算法YOLOv8n-PIVI。方法该算法在主干网络引入PartialBlock降低模型参数量,同时引入IDBlock(inception depthwise block)丰富网络的特征提取能力并进一步降低计算复杂度;在特征融合网络引入VanillaBlock减少网络参数的同时优化网络特征融合能力;引入ID-Detect(inception depthwise detect)检测头,极大降低模型的计算复杂度并优化检测头对不同尺度特征的解析能力。结果在Pothole Dataset数据集上的实验结果显示,本文算法的mAP50(mean average precision at 50% intersection over union)达到0.55,较基线算法提升3.5个百分点,帧速率(frames per second,FPS)达到243,较基线算法提升43,并且模型参数量和计算量仅为基线的67%和72%,模型参数文件由6.3 MB降低至4.3 MB,内存占用较原模型降低了近1/3。在与目标检测领域经典算法的对比实验中,本文算法在同参数量级模型中检测精度、计算复杂度及FPS较对比算法都有一定优势。此外,在RDD2022(road damage detector 2022)-China-MotorBike数据集和VOC2012(visual object classes 2012)数据集上的实验结果表明,本文算法具有良好的适应性和鲁棒性,能够适应不同的目标检测任务。结论综合实验结果表明,本文算法能够以轻量级的计算资源需求,实现更高的目标检测性能,并且具有良好的适应性和鲁棒性,有助于降低路面缺陷检测算法的使用限制,拓宽路面缺陷检测系统的适用场景。
摘要:目的在组织病理切片制备过程中,会不可避免地产生伪影,可能严重影响病理医生诊断准确性及计算机辅助诊断系统效能。现有伪影分类算法在处理相似伪影时,因缺乏全局分布规律学习能力,导致分类准确度并不理想。为此,提出一种改善病理图像伪影多分类的局部与全局信息交互融合网络MoLiNet(mobile linear net)。方法首先,构建了一个基于HSV颜色域的边缘检测模块以增强对裂缝的关注。然后,在双分支架构的基础上,结合门控线性单元(gated linear unit,GLU)与移动倒残差瓶颈卷积模块(mobile inverted bottleneck convolution,MBConv)构建出一种新型前馈层,以自适应地筛选出关键特征,同时提高整体计算效率。此外,还提出线性聚焦交叉注意力,以对全局特征和局部特征进行充分交互,从而增强特征表达能力。结果本文提出的网络在分类精度和计算效率方面均超越同类先进方法。在NCPDCSAD(ningbo clinical pathology diagnosis center similar artifact dataset)数据集测试中,本文模型取得了94.24%准确率(accuracy),超越了专门用于伪影分类的DKL网络。另外,本文构建的网络在参数量(Params)和计算量(Flops)上相较于DKL(deep kernel learning)分别减少了80.91%和96.94%。通过热力图可视化分析,进一步验证了本文提出的伪影分类网络对伪影特征具有敏锐捕捉能力。结论本文方法不仅能够有效地区分组织病理切片中相似伪影,而且在计算资源消耗上实现了显著降低。这一研究成果为病理图像质量评估领域带来了一种有效解决方案。