最新刊期

结合双通道Mamba与金字塔通道注意力的事件驱动运动图像去模糊 AI导读

“在图像去模糊领域，研究者提出了双通道Mamba去模糊网络，有效结合模糊图像和事件数据，重建出清晰潜在图像序列。”

罗炜麒, 高灿, 刘泓驿, 夏桂松, 余磊

DOI：10.11834/jig.250115

摘要：目的高时间分辨率的事件相机为传统运动图像去模糊任务提供新的发展思路，但是当前基于事件驱动的运动图像去模糊方法中存在跨模态补偿机制不足、深度特征计算复杂度较高、缺乏多尺度时空信息关注的问题，在复杂场景中的去模糊泛化性能受限。针对以上挑战，提出了一种双通道Mamba去模糊网络（Dual Channel Mamba Network，DCM-Net）。方法使用一种双通道跨模态Mamba模块（Dual Channel Cross-modal Mamba，DCCM），通过线性复杂度的状态空间模型（state space model，SSM）隐状态映射，将事件与模糊图像投影至共享的潜在特征空间中，再通过非线性交叉门控结构，利用低噪声的模糊图像信息来抑制事件噪声，并提取事件的清晰边缘特征，将其嵌入到图像特征中，实现事件和模糊图像的跨模态特征互补融合，达到去模糊的效果。此外，提出一种金字塔通道注意力模块（Pyramid Channel Attention，PyCA）对特征的多尺度时空信息进行提取，引导网络聚焦关键时间通道、增强对空间内局部模糊的细节重建，进一步提高潜在清晰图像序列的复原精度。结果实验在合成的REDS数据集与半合成的HQF数据集上进行，与最新的11种方法进行了比较。与目前最先进的方法相比，本文方法在REDS数据集重建序列的峰值信噪比（peak signal-to-noise ratio，PSNR）上平均提升了0.16dB，在结构相似性指数（structural similarity，SSIM）上平均提升了0.003；在HQF数据集上PSNR和SSIM分别平均提升约0.11dB和0.002；在两个数据集上的序列重建结果的学习感知图像块相似度（learned perceptual image patch similarity，LPIPS）达到最优。在与其中5种先进方法进行比较的主观对比实验中，本文方法取得最佳评分。结论本文所提出的方法可以结合模糊图像和事件数据，重建出清晰潜在图像序列，证明了所提出网络框架的有效性。
关键词：运动图像去模糊;事件相机;Mamba模型;金字塔通道注意力;跨模态融合

12

|

6

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 115656330 false

更新时间：2025-07-10
融合视觉Mamba与自适应多尺度损失的医学图像分割 AI导读

“在医学图像分割领域，专家提出了融合视觉Mamba和多尺度加权损失的VMAML-UNet方法，显著提升了模型对复杂医学图像的分割精度，为该领域研究提供了新方向。”

刘建明, 曹圣浩, 张志鹏

DOI：10.11834/jig.250224

摘要：目的在医学图像分割领域，传统基于卷积神经网络（convolutional neural network，CNN）的模型在捕捉长距离依赖信息方面存在固有局限，而基于视觉转换器（vision Transformer， ViT）的模型其自注意力机制的计算复杂度与图像尺寸呈平方关系，在资源有限的现实环境中难以部署。为了解决这些问题，提出一种融合视觉 Mamba 和多尺度加权损失的医学图像分割方法—VMAML-UNet。方法VMAML-UNet采用编码器-解码器架构。在编码阶段，设计了融合小波卷积的视觉 Mamba 块，以线性复杂度提取病变区域的精确特征并扩大感受野，并通过块合并进行下采样。解码阶段同样引入融合小波卷积的视觉 Mamba 块并利用块扩展进行上采样。跳跃连接中，提出了小波卷积注意力聚合模块，用于提取并融合不同尺度下的图像特征。此外，设计了柯尔莫哥洛夫-阿诺德网络（Kolmogorov-Arnold Network， KAN）调控多尺度加权损失，动态调控各层级损失权重。结果在BUSI、GlaS和CVC三个异质性显著的医学图像数据集上的实验结果表明，与主流的VM-UNet等采用Mamba的医学图象分割方法相比取得了显著的性能提升。具体而言，在BUSI数据集上，交并比（IoU）和F1分数分别提升了2.72%和2.02%；在GlaS数据集上，IoU和F1分数分别提升了3.38%和1.89%；在CVC数据集上，IoU和F1分数分别提升了2.51%和1.42%。结论提出的VMAML-UNet通过采用基于视觉Mamba的线性复杂度的长距离依赖建模与基于KAN的动态损失优化机制，显著减少了计算成本同时提升了模型对复杂医学图像的分割精度。该模型在三个数据集上的优异表现证明了其在不同医学图像场景下的广泛适用性和高效性。
关键词：状态空间模型;柯尔莫哥洛夫-阿诺德网络;小波卷积;多尺度加权损失;连续流

12

|

7

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 115656299 false

更新时间：2025-07-10
月球探测遥感影像匹配方法研究综述 AI导读

“在深空探测领域，专家综述了月球影像匹配的研究进展，为行星表面测绘提供解决方案。”

杨义成, 彭嫚, 万文辉, 邸凯昌, 刘召芹, 李禄

DOI：10.11834/jig.250161

摘要：随着深空探测技术的发展，月球探测器获取了不同类型的海量遥感影像，这些影像为行星表面测绘、地质分析及资源勘探提供了重要支持。然而，由于月球表面环境的独特性，如极端的地形起伏、光照变化及缺乏显著纹理，月球遥感影像匹配面临着辐射差异、几何畸变和尺度变化等严峻挑战。本文综述了自实施月球探测任务以来，国内外关于月球影像匹配的研究进展。首先对月球探测任务和获取的影像数据进行了介绍，然后阐述了不同类型的月球影像匹配方法，具体包括：1）在月球影像特征匹配方法研究进展方面，梳理了轨道器影像匹配、巡视器影像匹配和月球多模态影像匹配的相关研究发展过程； 2）针对月球影像密集匹配方法研究进展，围绕基于金字塔的匹配和半全局匹配SGM（semi-global matching）算法等方面进行阐述；3）在月球影像深度学习匹配方法部分，剖析了基于深度学习的特征匹配和密集匹配代表性算法的核心思想，并总结分析了这些算法的参数量、推理速度及硬件需求等指标；4）通过实验对比了传统方法和深度学习方法的匹配性能。根据特征匹配实验结果，传统方法中HAPCG（histogram of absolute phase consistency gradients）精度表现总体最佳，深度学习方法中Alike（Accurate and Lightweight Keypoint Detection and Descriptor Extraction）的表现较为优秀。密集匹配方法中，SGBM（semi-global block matching）和DepthAnything均呈现出较好的性能。最后对月球遥感影像匹配的未来发展方向进行了展望和探讨。
关键词：深空探测;遥感影像;特征匹配;密集匹配;深度学习

82

|

52

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 110057711 false

更新时间：2025-06-18
视觉语言模型驱动的目标计数 AI导读

“在视觉语言模型领域，专家提出了跨分支协作对齐网络CANet，有效解决了目标计数问题，为零样本目标计数任务提供了解决方案。”

曹锋, 张孝文, 岳子杰, 李莉, 史淼晶

DOI：10.11834/jig.250119

摘要：目的近年来，大型视觉语言模型的进展给解决基于文本提示的目标计数问题带来了新的思路。然而，现有方法仍面临类别语义错位与解码器架构局限两大挑战。前者导致模型易将相似背景或无关类别误检为目标，后者依赖单一CNN（Convolutional Neural Networks）架构的局部特征提取，可能引发全局语义与局部细节的割裂，严重制约复杂场景下的计数鲁棒性。方法针对上述问题，提出跨分支协作对齐网络CANet（Cross-branch cooperative Alignment Network），其核心包括：（1）双分支解码器架构：通过并行Transformer分支（建模全局上下文依赖）与CNN分支（提取细粒度局部特征），结合信息互馈模块实现跨分支的特征交互和密度图预测；（2）视觉-文本类别对齐损失：通过约束图像与文本特征的跨模态对齐，迫使模型区分目标与干扰语义，实现对类别的准确检测。结果在5个基准数据集上与最新的4种基于文本的目标计数方法进行了比较实验。在FSC-147数据集上， CANet相较于性能第2的模型，在测试集上的MAE和RMSE分别降低了1.22和8.45；在CARPK和PUCPR+数据集的交叉验证实验上，相较于性能第2的模型，MAE分别降低了0.08和3.58；在SHA和SHB数据集的交叉验证实验上，相较于性能第2的模型，MAE分别降低了47.0和9.8。同时也在FSC-147数据集上进行了丰富的消融实验以验证算法的有效性，消融实验结果证明了提出的方法针对两个问题做出了有效改进。结论本文所提出的方法，能够解决现有方法所面临的两个问题，使计数结果更加准确。且本文的方法在4个数据集的交叉验证实验均取得了SOTA（state-of-the-art）的性能，证明了CANet在零样本目标计数任务中的强大泛化能力。
关键词：目标计数;视觉语言模型;文本提示;双分支解码器;信息互馈

40

|

23

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 111079830 false

更新时间：2025-06-18
地月空间编目系统观测体制研究 AI导读

“在地月空间非合作目标编目定轨领域，专家提出了基于天基光学观测技术的编目定轨关键算法，为提高编目定轨精度和时效性提供解决方案。”

陈艳玲, 黄勇, 王鹏

DOI：10.11834/jig.250146

摘要：目的地月空间非合作目标因缺乏合作信号的高精度测量手段，同时深空探测地面测控资源有限，以及在地月空间多体摄动环境条件下运动轨迹复杂需考虑完备的动力学模型，其编目定轨精度与时效性受到一定的制约和独特的挑战。方法本文聚焦地月空间非合作目标的编目定轨，提出了基于天基光学观测技术的三体轨道约束条件下的空间目标编目定轨关键算法，以DRO（Distant Retrograde Orbit，远距逆行轨道）和NRHO（Near Rectilinear Halo Orbit，近直线晕轨道）组成的地月空间卫星星座，模拟天基平台与空间目标的光学观测数据，利用仿真数据，采取动力学统计定轨算法，探讨了不同平台轨道误差、不同平台数量和平台分布，以及不同观测数据条件下的DRO、NRHO目标的编目定轨精度。结果在天基平台轨道误差1km，光学成像观测2″测量噪声水平、光压10%模型误差的仿真条件下，2DRO与2NRHO地月空间导航星座对DRO目标单站定轨精度为1-7km，双站3天内每天观测3小时，定轨精度约1km，预报1天轨道精度优于1.3km；对于NRHO目标，单站观测3天定轨精度为1-3km，双站每天观测3小时、6小时以及连续协同观测定轨精度分别优于1.2km、1.1km和1.0km，这三种观测条件下预报1天轨道误差RMS（Root Mean Square，均方根）分别优于3.0km、2.5 km和1.9 km。结果表明，在天基测站误差1km和3天定轨弧长的条件下，双站观测精度较单站观测有显著提高，双站每天观测3小时，针对DRO和NRHO目标的定轨精度均优于1.2km，DRO轨道预报1天的精度较高优于1.3km，NRHO轨道预报1天在连续观测3天的条件下精度最高，优于1.9km。结论本文采用完备的三体动力学模型，通过对典型地月空间目标光学定轨的多种场景仿真，发现双站每天3小时观测的编目定轨能力优于单站每天连续观测的定轨精度。这一结论对地月空间编目定轨观测效率和观测体制的规划和布局，以及地月空间区域的态势感知能力论证和分析有重要的工程应用价值。
关键词：地月空间;非合作目标;天基光学观测;编目定轨;DRO;NRHO

65

|

13

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 110057676 false

更新时间：2025-06-18
面向人脸视频防伪检测的大规模中文数据测评基准 AI导读

“在AIGC技术领域，专家构建了面向中文场景的量化评估基准，有效推动防伪检测技术发展。”

贝毅君, 娄恒瑞, 高克威, 宋杰, 王蕊, 金苍宏, 雷杰, 宋明黎, 胡秉德, 冯尊磊

DOI：10.11834/jig.250077

摘要：目的针对AIGC技术生成的高逼真伪造人脸视频对人类视觉感知的欺骗性问题，以及当前人脸防伪检测算法评估体系在中文数据层面有效性和应用性验证方面的空白，旨在构建面向中文场景的量化评估基准以推动防伪检测技术迭代发展。方法提出面向大规模中文人脸伪造视频的CHN-DF数据集，详细阐述数据采集、伪造样本生成及质量评估的全流程构建方法。通过多维度实验验证数据集复杂性，兼顾跨模态伪造技术覆盖、环境干扰因子完备性等复杂因素，并建立基于深度检测模型的系统性评测基准。结果发布全球首个包含434 727样本的中文人脸视频防伪数据集，实验显示出该数据集鉴别难度高，在16种包含SOTA与主流防伪模型的测评中视觉与视听结合的准确率分别被控制在85%与70%以下。构建的评测基准覆盖了视觉与听觉模态场景，在跨域泛化性测试中显示模型准确率性能波动平均幅度达19.6%，显著揭示现有算法的应用局限性。结论构建的中文防伪评测基准有效填补领域空白，通过系统性实验阐明数据集特性与算法性能的关联机制，提出针对模型鲁棒性增强、跨模态泛化能力提升等关键发展方向，为面向中文场景的量化评估以及人脸视频防伪技术的实际部署提供数据支撑与实践指导。CHN-DF数据集在线发布地址为：https：//github.com/HengruiLou/CHN-DF。
关键词：深度伪造;人脸伪造视频;人脸防伪评测基准;中文数据集;多模态

29

|

22

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 111079757 false

更新时间：2025-06-18
地月空间物体雷达成像与智能认知方法研究 AI导读

“在地月空间探测领域，专家系统探索了雷达探测机制与信息获取方法，为实现地月空间物体高稳健探测提供核心路径。”

刘丹, 张磊, 尚华涛, 任远桢

DOI：10.11834/jig.250148

摘要：目的随着月球探索、深空探测任务的持续推进，地月空间物体的高稳健探测成为保障航天活动安全的核心需求。本研究旨在系统探索雷达对该类物体的探测机制与信息获取方法，重点解决其轨道动力学高度复杂导致的信号积累效率低与成像效果差等难题。方法首先通过对地月空间典型轨道的分析，揭示了不同轨道目标相对于雷达的径向距离与速度变化规律；其次针对目标姿态转动难以等效简化的关键问题，论述了融合轨道运动方程与电磁散射模型的必要性，阐明运动约束模型是实现复杂条件下雷达成像处理的理论基础；最后基于雷达探测月面目标的典型场景，对比月面不同区域的雷达成像结果，实证分析了轨道特性差异对径向观测量变化规律的影响机制，进一步阐明运动约束模型对成像性能提升的意义。结果不同轨道类型目标的径向运动特征存在显著差异，这直接决定了雷达信号处理策略的选择；姿态与轨道的强耦合效应使传统成像模型失效，基于精确运动约束的补偿算法可有效抑制成像散焦，月面成像实验进一步验证了考虑运动约束模型的重要性。结论发展基于不同轨道及姿态变化模型约束下的目标成像与智能认知方法，是实现地月空间物体高稳健探测的核心路径，对构建深空探测体系具有重要意义。
关键词：地月空间;雷达成像;轨道约束;电磁散射模型;智能认知

34

|

41

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 110057045 false

更新时间：2025-06-18
人工智能赋能地月空间感知技术现状及展望 AI导读

“在地月空间感知领域，人工智能技术展现出显著潜力，为构建智能感知体系提供新契机。”

于登云, 尹继豪, 刘斯琦, 王鹏, 王汇娟, 张余, 姜鸿翔, 陈培

DOI：10.11834/jig.250204

摘要：随着深空探测的不断推进，地月空间已成为探月和深空任务的关键战略区域。面对日益增多的航天器及太空碎片数量，亟需先进的空间态势感知技术以实现对地月空间目标的精准监测与持续跟踪。传统方法因复杂动力学环境和远距离探测精度限制，难以满足高精度轨迹预测和目标识别的需求，制约了地月空间感知技术进一步发展，人工智能技术的快速发展为解决这一瓶颈提供了新契机。本文系统梳理了人工智能技术在地月空间感知领域的应用进展，涵盖空间目标监视需求、传统机器学习在目标检测及轨道定轨中的应用，以及深度学习、强化学习等人工智能算法的初步应用。通过对国内外典型研究成果的对比分析，归纳了现有技术的优势和不足，提出了在算法优化、模型开发等方面的发展展望。分析表明，人工智能方法在提升暗弱目标检测精度、智能轨道确定及复杂态势感知方面表现出显著潜力，尽管面临数据匮乏和专用场景未知等挑战，人工智能技术已初步展现出构建全天候、高自适应性地月空间智能感知体系的能力。未来需加强人工智能与地月空间目标检测、轨道定轨与预报等传统技术结合，持续拓展人工智能在地月空间感知领域的应用，推动地月空间开发迈向智能化发展新阶段。
关键词：地月空间;态势感知;人工智能;目标检测;轨道定轨

65

|

44

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 110140767 false

更新时间：2025-06-12
窄角相机月球影像自适应多尺度超分辨率重建 AI导读

“在月球科学探测领域，专家提出了多尺度超分辨率模型MSRT，有效恢复月球NAC影像精细地貌，为地质分析和着陆区评估提供高质量数据支持。”

苗丁锐博, 鄢建国, 涂志刚, Jean-Pierre Barriot

DOI：10.11834/jig.250126

摘要：目的针对月球南极窄角相机（narrow-angle camera， NAC）影像因“求和”模式导致空间分辨率显著下降、关键地貌模糊的问题，本文旨在通过超分辨率技术恢复其精细地貌，为月球科学与探测任务提供高质量数据。方法本文构建模拟NAC“求和”模式下多尺度退化的月球影像数据集，通过模拟“求和”模式得到包含2倍、3倍和4倍下采样的退化影像，用于用于模型训练和验证。进一步的，本文提出融合卷积神经网络（convolutional neural networks， CNN）与Transformer的多尺度超分辨率模型（multi-scale super resolution Transformer， MSRT）。其创新性在于采用共享Transformer骨干提取跨尺度深度特征，并为各尺度设计独立的轻量化上采样分支，实现“主干共享、分支特化”的高效重建，提升了对复杂退化适应性与精度，兼顾模型复杂度。结果实验结果表明：MSRT在2倍、3倍及4倍超分任务中均显著优于对比方法。在最具挑战的4×任务（2m/pixel→0.5m/pixel）中，峰值信噪比（peak signal-to-noise ratio， PSNR）达28.73dB，结构相似性指数（structural similarity index， SSIM）为0.923。消融研究验证了模型设计的有效性。可视化结果证实MSRT能有效抑制伪影，清晰重建小型陨石坑、岩块等精细月表地貌。结论本文提出的MSRT模型有效解决了月球NAC影像多尺度退化问题，可显著提升月表微小地貌特征的重建质量，为精细地质分析、着陆区评估和巡视器安全路径规划提供了高质量的数据支持和技术保障。
关键词：超分辨率重建;月球窄角相机;Transformer;多尺度;深度学习

37

|

32

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109924891 false

更新时间：2025-06-11
面向地月空间感知任务设计与分析的智能仿真系统架构与实现 AI导读

“在地月空间感知任务设计与分析领域，专家基于“容器云+微服务”设计了智能仿真系统架构，有效支持任务正向设计及方案优化，为地月空间任务研究提供解决方案。”

胡佳鑫, 郑清标, 朱彦伟, 王鹏, 李永昌

DOI：10.11834/jig.250183

摘要：目的地月空间轨道普遍存在周期长、混沌性强、对各类扰动高度敏感等特征，地月空间感知任务呈现出显著的动态变化和不确定性，亟需借助虚拟仿真、仿真试验以及人工智能等先进技术手段开展科学研究与试验验证。方法论文以地月空间感知任务设计与分析为牵引，以服务化、标准化、国产化和工具化为理念，基于“容器云+微服务”设计了满足高性能计算、高并发访问、多样化应用需求的“基础支撑+服务支撑+典型应用”三层智能仿真系统架构。分析了地月空间轨道动力学模型库、基于Kuberneter的计算任务智能调度和全链路微服务集成框架等关键技术。结果研制了地月空间感知任务设计与分析仿真系统，阐述了场景设计模块、态势感知系统设计与分析模块、任务规划模块、体系仿真模块、试验设计模块以及试验评估模块的实现情况。结论通过应用案例说明，仿真系统能够有效支持用户开展地月空间任务的正向设计以及方案的选代优化，高精度星历模型下15年驻留轨道积分能够达到分钟级计算性能，具有高效性、智能性、稳定性和良好的扩展性。
关键词：系统架构;容器技术;微服务技术;地月空间;三体轨道

42

|

43

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 110057599 false

更新时间：2025-06-11
基于频域图像的地月三角平动点轨道特征识别 AI导读

“在空间轨道设计领域，专家提出了基于图像信息提取的频率数据处理方法，为地月三角平动点附近稳定轨道设计提供快速半分析解，显著提高效率。”

刘沐林, 侯锡云, 王鹏

DOI：10.11834/jig.250144

摘要：目的地月三角平动点附近的稳定轨道对可能存在的自然天体的研究以及一些工程应用都有重要的意义。在实际工作中，现有的轨道设计方法普遍采用数值方法进行迭代，效率受限，需要进一步改进。方法在本工作中，提出了基于图像信息提取的频率数据处理方法，对不同振幅轨道的相同频率进行了研究，从而实现了对轨道的不同组成频率项的数值拟合。不同于传统的半分析解构造方法，该方法从频域分析结果出发，对拟周期轨道的主要频率项进行分析。与使用数值连续方法得到对应轨道的速度相比，该方法所消耗时间仅为数值连续方法的1%。结果使用该方法对地月三角平动点附近的空间稳定轨道进行了研究，验证了频率数据处理算法的可靠性，并得到了相应稳定区域内稳定轨道的半分析解，验证了解的可靠性。使用该方法，本文首次构造并得到了地月三角平动点附近空间稳定轨道的半分析解。结论本文所提出的方法适用于空间任务所需要的各种具有受迫和自由运动特征的拟周期轨道，可以较快获得相应轨道族的半分析解，从而实现轨道设计过程的加速。该方法可以被应用于未来的工程实践中，可以使轨道设计过程更有效率。
关键词：三角平动点;拟周期轨道;频域分析;半分析解;轨道设计优化;数值拟合

34

|

38

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109943633 false

更新时间：2025-06-10
双路径编码与自适应感受野驱动的医学图像分割 AI导读

“在医学图像分割领域，专家提出了一种端到端框架，通过双路径编码与自适应感受野机制，有效提升了全局-局部特征融合能力，实现了SOTA级别的分割精度。”

彭晏飞, 孙伟强

DOI：10.11834/jig.250128

摘要：目的受限于局部感受野特性，卷积神经网络在长程依赖关系建模方面存在固有局限。现有研究尝试将Transformer模块嵌入至卷积神经网络某些特定功能单元（如编码器、解码器或跳跃连接层）以缓解此问题，但此类离散化设计仅能在局部层级实现有限的局部-全局关联，难以有效建模医学图像中解剖结构形态异质性引发的复杂依赖关系。此外，传统的卷积神经网络训练后，其卷积核参数呈现静态固化特性，无法自适应医学图像中组织器官的几何形变，进一步制约了模型对动态形变目标的表征能力。方法针对上述问题，本文提出了一种端到端的医学图像分割框架，通过双路径编码与自适应感受野机制的协同设计，增强模型对全局-局部特征融合能力。具体而言：首先，设计了双路径编码结构，在多个网络层级融合卷积神经网络与Transformer特征，实现局部细节与全局上下文的渐进式融合；其次，构建编码器多层次融合机制，通过跨尺度信息交互整合浅层纹理与深层语义特征，增强模型对目标结构的多分辨率解析能力；最后，提出自适应感受野机制，基于像素级语义差距动态调整卷积核感知范围，突破静态卷积在形变组织表征中的瓶颈。结果实验在2个公开数据集上与最新的方法进行了比较，在Synapse数据集中，本方法较次优模型在DSC和HD95评价指标上分别提升了0.44%和0.44%；在ACDC数据集上的DSC值提高了0.34%；消融实验进一步验证了双路径编码与自适应感受野机制的协同有效性。结论本文方法通过深度融合卷积神经网络局部感知与Transformer全局建模的各自优势，结合自适应感受野机制，有效解决了当前医学图像分割模型中全局-局部特征融合不足及卷积核参数静态固化的问题，实现了SOTA级别的分割精度，为复杂医学图像分割任务提供了新的方案。代码已开源：https：//github.com/Swq308/DPAR-Net
关键词：卷积神经网络;Transformer;双路径编码;自适应感受野;多层次融合

78

|

43

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109943600 false

更新时间：2025-06-10
用于轨道图像缺陷检测的轻量级金字塔交叉注意力网络 AI导读

“在轨道缺陷检测领域，研究者提出了LPCANet模型，利用RGB-D图像和深度学习技术，实现了轻量化、高精度的轨道缺陷检测，具有实际应用价值。”

郭斯栩, 耿慧拯, 粟栗, 何申, 张鑫月

DOI：10.11834/jig.240547

摘要：目的现存基于视觉的轨道缺陷检测方案大多存在高参数、计算复杂，检测速度慢，精度低等缺陷。为了解决上述问题，本文介绍了一种使用RGB和深度图像进行轨道缺陷检测的轻量级金字塔交叉注意网络（LPCANet，Lightweight pyramid Cross attention network for orbital image defect）。LPCANet模型利用深度学习、RGB-D与显著性目标检测等技术，设计了一种轻量级金字塔模块，其能够从深度图像中提取多尺度特征图，而骨干模块用于从RGB图像中捕获金字塔特征细节；然后，方案将交叉注意力模块（Cross-Attention Mechanism，CAM）应用于两种类型的特征映射；其次，方案利用空间特征提取子（Spatial Feature Extractor，SFE）提高缺陷检测性能；最后，应用“像素洗牌（Pixel Shuffle"）”操作恢复原始图像的大小。结果方案在搭载NVIDIA 3090 GPU的环境下，利用PyTorch库对所提出的模型以及其他对照模型进行了计算。LPCANet方案实验采用了NEU-RSDDS-AUG、RSDD-TYPE1、RSDD-TYPE2三种公开无服务RGB-D轨道数据集，实验表明，在NEU-RSDDS-AUG数据集下，方案的网络模型运行参数为9.90 M，计算量为2.50G，模型大小为37.95MB，运行速度为162.60帧/秒，相比于现有的18种轨道缺陷检测方案，LPCANet在性能上更为轻量化；与当前性能最优的CSEPNet模型相比，在 $S$ -度量（ $S_{α}$ ）、交并比（IOU）、最大 $F$ -度量（ $F_{β}^{m a x}$ ）、平均精度（mAP）和平均绝对误差（MAE）五项指标上分别提高了+1.48%、+0.86%、+0.14%、+0.03%、+1.77%；在对LPCANet四种上采样方法（插值、转置卷积、补丁合并和“像素洗牌（Pixel Shuffle）”）的消融实验中，实验显示“像素洗牌”方法表现出了明显的优势，更适合于LPCANet模型；在深入分析各种骨干网络的性能时，实验表明LPCANet模型不仅适用于现有的各种骨干网络，而且取得的检测结果更加优异。同时本文增加了DAGM2007、MT与Kolektor-SDD2 3个非轨道数据集进行实验，实验证明该LPCANet模型对非轨道图像的缺陷检测而言，其在maP、MAE与IOU三项指标均有提高，具备一定的泛用性。结论本文所提出的LPCANet模型，综合了传统模型和深度学习模型的优点，在轨道缺陷图像检测领域具备良好的实际应用价值。未来，本方案将进一步减小模型体积，以实现更快速的轨道缺陷检测速度，并确保性能质量能够得到进一步提升。
关键词：轨道缺陷检测;深度学习;RGB-D;显著性目标检测;空间特征提取子

36

|

19

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109943567 false

更新时间：2025-06-10
旋转不变点云网络研究进展 AI导读

“在三维视觉领域，点云深度学习网络取得显著进展，但面临旋转变换挑战。专家系统整理了旋转不变点云网络的研究内容和方法，为解决该问题提供解决方案。”

王正宝, 曾振轩, 欧阳轩, 陈昊哲, 李林杰, 杨佳琪

DOI：10.11834/jig.250029

摘要：近年来，点云深度学习网络取得了显著进展，其表现出的强大语义理解能力推动着整个三维视觉领域的进步，然而三维点云通常表现出复杂的变换对称性，其中旋转是一个具有挑战性且必要的主题。不同旋转变换下点云的语义信息一致，但空间坐标不同，这影响了常规点云深度学习网络在语义感知方面的稳定性，难以应用到任意姿态的现实场景。早期的研究主要采用旋转数据增强的方式，但由于旋转本身的无限性和连续性，这种简易方案并不能满足需求。因此，越来越多的学者着手研究具有旋转不变属性的点云深度学习网络，在网络设计层面排除旋转对于特征提取的影响。本文对于旋转不变点云网络相关研究进行了充分调研，分析其中存在的挑战，并系统整理相关主流方法，依据旋转不变能力获取方式的不同，划分为几何旋转不变方法、特征旋转不变方法和训练旋转不变方法。本文详细描述了当前学术界在该问题上的研究内容和方法，总结和对比了各类方法的优缺点，并对常用的一些数据集和评价指标进行了整理总结。最后，本文调研和总结了旋转不变点云深度学习网络的下游应用前景，并对未来发展和研究热点进行了展望。
关键词：三维视觉;深度学习;点云网络;旋转不变性;旋转等变性

20

|

9

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109943530 false

更新时间：2025-06-10
面向月球空间站的智能时序行为检测技术研究 AI导读

“在航天领域，专家提出了一种高效时序动作检测框架，为航天员动作监测提供轻量化、高精度解决方案。”

苗仕林, 唐业鹏, 张淳杰, 刘传凯, 张济韬, 曹建峰

DOI：10.11834/jig.250135

摘要：目的随着全球太空经济加速发展，我国航天事业已进入深空探测、空间站常态化运营与地月资源开发的新阶段。航天员在复杂太空环境中的动作规范性直接影响任务安全与效率。然而，现有视频动作检测方法因依赖密集光流计算，存在高计算成本与实时性不足的瓶颈，难以满足航天任务中长时间、高精度动作监测的需求。方法为解决上述问题，本文提出一种高效时序动作检测框架，旨在通过稀疏光流表征与知识蒸馏技术，提升航天员训练与工作视频的动作检测效率，为太空任务中实时操作反馈、虚拟训练系统优化提供技术支持。本方法采用稀疏光流表征，规避密集光流的高内存开销，缩短光流提取时间。通过从密集光流中蒸馏时空特征知识，弥补稀疏表征的信息损失，确保检测精度。结果该方法输入相对稀疏的光流，将光流计算耗时缩减至传统密集光流的1/4，总处理时间从132.1小时显著降低至32.5小时，有效规避了密集光流计算的高内存和计算成本。在检测精度方面，通过设计知识蒸馏机制，将平均均度均值从60.7提升至61.5，超越了基准模型的性能指标，验证了稀疏采样策略的计算效率优势与蒸馏网络在特征增强方面的有效性，实现了精度与效能的同步提升。结论本研究为航天员动作检测提供了一种轻量化、高精度的解决方案，可实现快速高效动作定位，有助于实现太空情景下的高效航天员动作检测。
关键词：动作检测;时序动作定位;知识蒸馏;视频理解;太空任务安全检测

30

|

23

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109942955 false

更新时间：2025-06-10
融合深度神经网络与约束容许域的地月空间航迹智能分类 AI导读

“在地月目标编目定轨领域，专家提出了结合CNN与CAR的短弧航迹智能轨道族分类方法，实现了高鲁棒性的航迹分类，为地月空间复杂轨道的智能识别提供有效参考。”

李佳怡, 蔡晗, 孙秀聪, 桂海潮, 张晨

DOI：10.11834/jig.250139

摘要：目的地月空间距离遥远，对地月目标的观测弧段短、间隔长，导致观测的航迹难以判定其所属轨道族。如何根据短弧航迹对其轨道族快速、精准分类，是实现地月目标编目定轨的重要前提。然而，传统方法受限于地月系统复杂的三体动力学特性，且先验知识与统计信息不足，对航迹分类存在精度低、效率不足的缺陷。为解决该问题，本文提出一种结合卷积神经网络（Convolutional Neural Networks， CNN）与约束容许域（Constraint Admissible Region， CAR）的短弧航迹智能轨道族分类方法。方法首先，利用不同轨道族的雅可比常数约束，构建各轨道族的CAR，表征假设轨道集合。其次，根据地月轨道数据库生成训练集，通过训练，CNN可实现依据假设轨道对其所属轨道族的快速、精准分辨。最后，将CNN方法与不同轨道族的CAR结合，建立轨道族的联合判别机制，实现目标航迹的智能归属分析。结果仿真结果表明，在使用DRO（Distant Retrograde Orbit）卫星观测HaloL1、HaloL2等轨道的典型场景中，所提出的CNN-CAR方法可使CAR面积减少50%，且对未知航迹的分类成功率较单独使用CAR提升近一倍。结论所设计的算法实现了高鲁棒性的航迹分类。该方法可为地月空间复杂轨道的智能识别、航迹关联与编目维持等任务提供有效参考。
关键词：态势感知;航迹分类;卷积神经网络;约束容许域;地月空间目标;融合算法

107

|

38

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109942912 false

更新时间：2025-06-10
地月空间多目标高时效跟踪方法研究 AI导读

“在地月空间多目标跟踪领域，研究者开发了基于DeepSORT的高效跟踪方法，显著提升了跟踪准确性和实时性，为解决复杂场景下的多目标跟踪问题提供解决方案。”

王磊, 张晓明, 支挥, 张茵迪, 何梦秋, 姜晓军

DOI：10.11834/jig.250138

摘要：目的针对地月空间中多目标运动状态复杂的问题，本研究致力于开发一种高效的地月空间多目标跟踪方法，以满足大视场光学探测中对多个运动速度和方向不一致目标的快速、准确跟踪需求。方法针对地月空间多目标高动态跟踪的挑战，本文提出了一种基于DeepSORT的多目标自动跟踪方法。该方法首先根据目标的形态特征生成自适应检测框，并针对不同类别目标配置差异化的检测框策略，同时结合特征提取技术计算运动目标的表观信息，将其融入DeepSORT算法框架，显著提升了多目标跟踪的准确性和实时性。结果仿真目标跟踪模式下的图像实验结果表明，该方法的多目标跟踪准确度达到95.0%，IDF1分数为96.2%。新疆天文台南山1米大视场望远镜目标跟踪模式下的实测数据结果显示，该方法的多目标跟踪准确度达到91.5%，IDF1分数为91.7%，4k×4k图像的处理时间约为每帧0.53秒，并且在目标消失和轨迹交叉等复杂场景下表现出较强的鲁棒性。结论该方法能够跟踪轨迹交叉的多目标，且在暗弱目标偶尔未提取或断续消失的复杂场景中，仍能准确跟踪多目标。
关键词：地月空间;图像处理;多目标跟踪;空间目标;DeepSORT

31

|

42

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109942853 false

更新时间：2025-06-10
面向自下而上人体姿态估计的自适应真值热力图生成方法 AI导读

“在人体姿态估计领域，专家提出了自适应真值热力图生成方法，有效提高了关键点检测准确率。”

江玲, 刘卓程, 熊源, 吴威, 李凯歌

DOI：10.11834/jig.240615

摘要：目的热力图回归方法因其能够提供丰富的空间信息，在人体姿态估计领域受到广泛关注。然而，由于传统真值热力图通常由固定标准差的2D高斯核覆盖标注点位置生成，当人体尺度变化较大时，固定的高斯核覆盖范围可能与关键点的实际语义区域不匹配，导致模型对关键点定位的模糊性和语义不确定性。提出面向自下而上人体姿态估计的自适应真值热力图生成方法。方法首先设计一种自适应真值热力图生成模块，通过学习图像中关键点的固有尺度信息以及近邻关键点之间的几何关系生成自适应尺度因子，为图像定制尺度自适应的真值热力图。另外，由于现有方法使用的热力图损失函数未能有效捕捉局部结构的相关性，导致其对关键点位置偏差不敏感。为此，提出局部概率一致性损失函数，通过在热力图的局部区域上计算结构相似性，提升模型对局部结构的学习和理解，同时引入动态权重来平衡样本的贡献，进一步引导模型优化方向，提高模型鲁棒性。结果在两个公开数据集（MS COCO与CrowdPose）上进行实验评估，实验结果表明所提方法相较对比工作，关键点检测平均准确率分别提高了1.6%与6.5%，达到了72.1%和74.1%，验证了所提方法的有效性。此外，所提方法在拥挤场景的CrowPose数据集上也能带来显著的性能提升，这进一步表明其能够有效缓解复杂场景中的人体尺度变化带来的问题。同时消融实验验证了所提方法的有效性。结论提出了面向自下而上人体姿态估计的自适应真值热力图生成方法，通过学习图像中关键点的固有尺度信息以及近邻关键点之间的几何关系生成自适应热力图作为真值，结合局部概率一致性损失函数来处理图像中尺度变化问题，有效地提高了人体姿态估计准确率。
关键词：人体姿态估计;自适应尺度;自下而上;热力图回归;动态权重

26

|

19

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109942818 false

更新时间：2025-06-10
融合高斯修正的双阶段指导弱监督语义分割 AI导读

“在弱监督语义分割领域，研究者提出了基于知识蒸馏的端到端框架，通过双阶段知识交互和高斯修正模块，有效降低噪声干扰，提升伪标签质量，展现出优越性能。”

白雪飞, 王渊辉, 许文杰, 姜高霞, 王文剑

DOI：10.11834/jig.250040

摘要：目的近年来，端到端的弱监督语义分割模型因其高效的训练效率备受关注，然而现有研究还存在语义信息提取不充分、生成的伪标签质量较低等不足。针对上述问题，本文提出一种基于知识蒸馏的端到端弱监督语义分割框架，通过双阶段知识交互模块增强学生网络和教师网络之间的知识传递，同时借助高斯修正模块对伪标签进行修正。方法首先，设计双阶段知识交互模块强化教师网络和学生网络的特征学习过程，有效降低训练过程中的噪声干扰。其次，为了生成高质量的伪标签，本文设计了高斯修正模块，通过拟合类激活图的分布，利用EM算法估算每个像素点的噪声概率，并依据与邻域像素的相似度关系修正伪标签，进而提升弱监督语义分割网络的性能。结果本文方法在PASCAL VOC 2012数据集和COCO 2014数据集上的mIoU值分别达到74.77%、42.30%，优于其他对比方法。结论本文通过双阶段知识交互模块以及高斯修正模块，有效降低了图像内部噪声以及潜在的标签噪声对训练过程的影响，并且改善了伪标签生成不完整的问题，与现有方法相比取得了显著的性能提升，在端到端的弱监督语义分割方法中展现出明显的优越性，具有一定的研究价值。
关键词：深度学习;端到端弱监督语义分割;高斯混合模型;知识蒸馏;类激活图

30

|

27

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109940538 false

更新时间：2025-06-10
结合Kolmogorov-Arnold网络的高轨目标初轨确定 AI导读

“在空间态势感知领域，专家提出了基于KAN的天基光学观测高轨目标短弧初轨确定模型，有效解决了初轨确定问题，为空间目标监测提供新手段。”

刘宏宇, 张余, 张超群, 陈果, 尹继豪

DOI：10.11834/jig.250147

摘要：目的作为空间态势感知的关键环节，高效且准确的初轨确定技术对于轨迹关联、卫星编目、异动感知等下游任务至关重要。传统方法通常依赖精确的动力学模型和充足的观测数据，但在短弧段条件下，物理约束不足易导致出现平凡解或方法不收敛的问题。尽管深度学习方法在数据拟合方面表现优异，但其对轨道动力学内在物理规律的建模能力仍存在不足。针对以上问题，提出了一种基于Kolmogorov-Arnold Network（KAN）的天基光学观测高轨目标短弧初轨确定模型，该模型兼具强大的物理规律捕捉能力和数学拟合能力，能够获得稳定且高精度的定轨结果。方法首先，构建了面向初轨确定任务的专用KAN模型架构，采用“先升维，后降维”的策略增强物理特征提取能力，并设计了融合运动状态约束的损失函数，以针对性优化初轨确定性能。此外建立了一个大规模的天基光学观测短弧段数据集，该数据集源自真实在轨卫星数据，每个观测弧段时长5分钟，包含六个观测点，记录了目标卫星相对于观测卫星的方位角、俯仰角及其变化率。数据集涵盖多样化的目标卫星轨道，为模型的训练与性能验证提供了可靠的数据支持。结果与传统方法相比，所提方法预测结果的位置和速度误差分别为27.458km和3.904m/s，仅为传统方法的0.58%和1.14%。与基于多层感知机（MLP）的深度学习方法相比，所提方法预测结果的位置和速度误差分别为前者的25.01%和19.58%，显示出更优的性能。结论实验结果表明，提出的基于KAN的初轨确定模型有效解决了天基光学观测的高轨目标短弧初轨确定问题，在定轨精度、计算效率和结果稳定性等方面均展现出显著优势，为空间目标监测提供了新的技术手段。
关键词：初轨确定;KAN;短弧段;天基光学观测;高轨目标;深度学习

57

|

33

|

0

<HTML>
<网络PDF><WORD><Meta-XML>

<引用本文> <批量引用> 109937244 false

更新时间：2025-06-10