目的胎儿心脏超声检查是诊断先天性心脏病的重要手段,但由于胎儿心脏体积小、搏动速率高且位置受体位变化影响,5个标准切面的捕捉时效要求高且重复性差,严重制约了筛查效率。为实现准确、全面的标准切面自动识别,本文提出一种基于“先检测后分类”策略的胎儿心脏标准切面识别多任务模型FHSP-Net(fetal heart standard planes net,FHSP-Net)。方法在检测任务中,设计路径交织特征金字塔(path weaved network,PWN)、目标感知增强模块(target-aware enhancer,TAE)并引入均衡损失函数(equalization loss version 2,EQLv2),解决胎心超声检测数据集在多尺度与小目标检测、噪声与伪影干扰、样本数量不均等方面的固有难题,提供精确的第一阶段结果;针对基于解剖结构包含条件的切面识别算法精确率高但召回率低的问题,设计候选视图评分识别算法,在保证高精确率的同时显著提高召回率。结果在测试集上的实验结果表明,FHSP-Net多任务模型在解剖结构检测与标准切面识别任务中均展现出优异性能:检测任务平均精度均值达到0.962,相较基线提升0.027;候选视图评分识别算法较基于解剖结构包含条件的切面识别算法准确率提升0.10。最终,FHSP-Net切面识别准确率高达0.959,较基线与解剖结构包含条件切面识别算法的组合模型准确率提高0.194,验证了其有效性与优越性。结论所提FHSP-Net多任务模型在胎心结构检测和标准切面识别任务上均表现优异,路径交织特征金字塔、目标感知增强模块及均衡损失函数显著提高了结构检测模型的鲁棒性,候选视图评分算法在提升分类准确性与召回率方面展现出显著优势,能为超声智能辅助诊断提供有力支持。
目的虚拟现实(virtual reality, VR)在物理实验教学中的应用日益广泛,但现有消费级设备受限于稀疏追踪节点,难以实现自然流畅的全身运动重建,导致用户交互体验不连贯且易引发视觉不适。为此,本文提出一种高保真的虚拟具身运动解算框架,以解决全身运动重构质量差及交互精度低的问题。方法提出结合骨骼重定向、逆向运动学和数据驱动的虚拟具身运动解算框架,为未来实现多用户协同的虚拟具身交互提供理论依据和实践指导。通过脊柱链和肢体链分离与手部调整方法,优化虚拟具身交互行为,有效提升虚拟具身的生物力学合理性、运动自然性和交互精度,实现其比例动态校准与跨平台模型一致性。结果定量层面,实验组在“拾杯”任务中平均耗时更短(30.78 s vs 32.00 s);在“按钮”交互任务中优势更明显,尤其是左手操作耗时显著降低(36.45 s vs 38.36 s),完成率由55%提升至70%。主观层面,实验组在具身感(代理感、自我定位)及空间临场感(参与感、总体沉浸)得分上均显著高于对照组。回归分析(R²=0.543)进一步揭示了双路径机制:该方法不仅直接提升交互体验,还能通过增强沉浸感显著降低晕动症易感人群的视觉不适。结论该框架有效解决现有技术局限,提升虚拟具身性能与用户体验,其双路径优化机制可推广至化学实验、工程模拟等需高精度交互的VR教育场景,在多用户协同沉浸式教学中应用前景广阔。
目的现有低光照图像增强方法大多直接学习从低光图像到增强图像的端到端映射,因缺乏对照明与反射分量的有效先验约束,难以在复杂低光条件下准确区分两类分量,易导致暗区域噪声放大、色彩偏移等问题。为此,本文提出一种照明先验约束的潜在空间分解方法(prior-illumination-based latent space decomposition for low-light image enhancement, PrioLLIE),以实现更稳定、更有效的光照建模。方法首先,本文构建了空间先验融合模块,结合RGB(Red, Green, and Blue)空间的色彩信息与HSV(hue, saturation, and value)空间亮度通道,提取并融合多源光照先验以形成鲁棒的照明引导特征。随后,设计了潜在向量提取模块,将输入映射至潜在特征空间,对光照分量进行解耦建模,并在生成过程中注入先验特征以增强光照估计的可控性与稳定性。最后,提出一种Retinex驱动的跨空间分解模块,在潜在空间中实现照明分量的精准分解,并在RGB空间对反射分量建模,实现内容与光照的互补表达,提高分解与重建的协同性。结果将本文方法与SCLM(learning a single convolutional layer model)等10种方法在三个基准低光照数据集上实施定性和定量评估。在相近参数量下,本方法在峰值信噪比(peak signal-to-noise ratio, PSNR)上比StableLLVE(learning temporal consistency)提高了2.40db,也在LOL(low-light dataset)数据集的结构相似性(Structural Similarity Index Measure, SSIM)、学习式感知图像块相似度(learned perceptual image patch similarity)和色差(deltae)均优于其他算法。结论PrioLLIE 通过引入照明先验并结合潜在空间解耦建模,有效缓解了传统端到端方法在复杂低光场景中存在的光照估计偏差与细节恢复不足等问题。该方法具有良好的普适性和泛化性,具有较好的潜在应用价值。
随着人工智能技术在医疗领域的深度融合,基于深度学习的影像分析模型已在多项任务中展现出显著潜力。然而,这类模型的性能严重依赖于大规模、高质量的训练数据,而真实临床环境下的医学数据常面临三大类挑战:数据稀缺、数据异质性以及数据不均衡问题。传统深度学习模型在处理此类复杂数据时,往往表现出过度自信的错误预测,且缺乏对认知不确定性的表达能力,从而为高风险的临床决策带来潜在安全威胁。证据深度学习(evidential deep learning,EDL)作为一种新兴的不确定性量化范式,通过将狄利克雷分布引入到神经网络的输出来对预测进行证据建模,能够一定程度上建模偶然不确定性和认知不确定性,这种能力为应对真实复杂医学数据提供了强有力的工具。本文从数据稀缺、数据异质性及数据不均衡这三大挑战的视角切入,系统性地综述了证据深度学习在复杂医学数据下的影像分析应用,并阐明了证据深度学习凭借其不确定性量化和内在的可解释性,在利用无标签数据、检测异常样本、解析并融合冲突证据、识别尾部数据以及仲裁噪声数据等方面展现的核心优势。本文提及的相关算法已汇总至https://github.com/oscarab/Medical-EDL。最后,本文对该领域当前面临的挑战进行了总结,并对未来的研究方向进行了展望,为研究者们提供了一个清晰的路线图,以推动构建更安全、更可靠、更可信的下一代智能医学影像分析系统。