最新刊期

    2020 25 1

      综述

    • 多媒体信号处理的数学理论前沿进展

      熊红凯, 戴文睿, 林宙辰, 吴飞, 于俊清, 申扬眉, 徐明星
      2020, 25(1): 1-18. DOI: 10.11834/jig.190468
      摘要:深度学习模型广泛应用于多媒体信号处理领域,通过引入非线性能够极大地提升性能,但是其黑箱结构无法解析地给出最优点和优化条件。因此如何利用传统信号处理理论,基于变换/基映射模型逼近深度学习模型,解析优化问题,成为当前研究的前沿问题。本文从信号处理的基础理论出发,分析了当前针对高维非线性非规则结构方法的数学模型和理论边界,主要包括:结构化稀疏表示模型、基于框架理论的深度网络模型、多层卷积稀疏编码模型以及图信号处理理论。详细描述了基于组稀疏性和层次化稀疏性的表示模型和优化方法,分析基于半离散框架和卷积稀疏编码构建深度/多层网络模型,进一步在非欧氏空间上扩展形成图信号处理模型,并对国内外关于记忆网络的研究进展进行了比较。最后,展望了多媒体信号处理的理论模型发展,认为图信号处理通过解析谱图模型的数学性质,解释其中的关联性,为建立广义的大规模非规则多媒体信号处理模型提供理论基础,是未来研究的重要领域之一。  
      关键词:结构化稀疏表示;基于框架理论的深度卷积网络;多层卷积稀疏编码;图信号处理;多媒体信号处理   
      25
      |
      33
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693554 false
      更新时间:2024-05-07
    • 视觉传感机理与数据处理进展

      王程, 陈峰, 吴金建, 赵勇, 雷浩, 刘纪元, 汶德胜
      2020, 25(1): 19-30. DOI: 10.11834/jig.190404
      摘要:传统视觉感知以RGB光学图像和视频图像为主要数据源,借助计算机视觉的发展取得了巨大成功。然而,传统RGB光学成像也存在着光谱、采样速度、测量精度、可工作条件等方面的限制。近年来,视觉感知的新机理和新数据处理技术的迅速发展,为提升感知和认知能力带来了重大机遇;同时,也具有重要的理论价值和重大应用需求。本文围绕激光扫描、水声声呐成像、新体制动态成像、计算成像、位姿感知等研究方向,综述发展现状、前沿动态、热点问题和发展趋势。当前,在视觉传感研究领域,国内研究机构和团队在数据处理和应用方面取得了显著进展。整体上,国内依然要落后于欧美日等先进国家,尤其是在相关硬件的研制方面。最后,给出了发展趋势与展望,以期为相关研究者提供参考。  
      关键词:视觉传感;激光扫描;合成孔径声呐;新体制动态成像;计算成像;位姿感知   
      61
      |
      54
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693553 false
      更新时间:2024-05-07

      图像处理和编码

    • 多尺度显著区域检测图像压缩

      曲海成, 田小容, 刘腊梅, 石翠萍
      2020, 25(1): 31-42. DOI: 10.11834/jig.190168
      多尺度显著区域检测图像压缩
      摘要:目的为了解决利用显著区域进行图像压缩已有方法中存在的对多目标的图像内容不能有效感知,从而影响重建图像的质量问题,提出一种基于多尺度深度特征显著区域检测图像压缩方法。方法利用改进的卷积神经网络(CNNs),进行多尺度图像深度特征检测,得到不同尺度显著区域;然后根据输入图像尺寸自适应调整显著区域图的尺寸,同时引入高斯函数,对显著区域进行滤波,得到多尺度融合显著区域;最后结合编码压缩技术,对显著区域实行近无损压缩,非显著区域利用有损编码技术进行有损压缩,完成图像的压缩和重建工作。结果提出的图像压缩方法较JPEG压缩方法,编码码率为0.39 bit/像素左右时,在数据集Kodak PhotoCD上,峰值信噪比(PSNR)提高了2.23 dB,结构相似性(SSIM)提高了0.024;在数据集Pascal Voc上,PSNR和SSIM两个指标分别提高了1.63 dB和0.039。同时,将提出的多尺度特征显著区域方法结合多级树集合分裂(SPIHT)和游程编码(RLE)压缩技术,在Kodak数据集上,PSNR分别提高了1.85 dB、1.98 dB,SSIM分别提高了0.006、0.023。结论提出的利用多尺度深度特征进行图像压缩方法得到了较传统编码技术更好的结果,该方法通过有效地进行图像内容的感知,使得在图像压缩过程中,减少了图像内容损失,从而提高了压缩后重建图像的质量。  
      关键词:图像压缩;多尺度深度特征;显著区域检测;卷积神经网络;峰值信噪比;结构相似性   
      19
      |
      21
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693578 false
      更新时间:2024-05-07
    • 结合块旋转和马赛克拼图的生成式伪装方法

      王洋, 邵利平, 陆海
      2020, 25(1): 43-59. DOI: 10.11834/jig.190069
      结合块旋转和马赛克拼图的生成式伪装方法
      摘要:目的搜索式无载体信息隐藏容量低,涉及大量载体密集传输;纹理合成无载体隐藏只能生成简单质地的纹理图像;马赛克拼图信息隐藏尽管能产生有意义图像,但需修改嵌入参数。针对以上问题,提出一种结合块旋转和马赛克拼图的生成式伪装方法。方法将灰度图像进行圆形化并添加随机转角构建马赛克,通过随机坐标决定秘密信息的隐藏位置;在隐藏位置,根据密钥和放置位置来放置代表秘密比特串的圆形图像和施加认证转角,对于非隐藏位置则放置最接近圆形图像来掩盖秘密信息;将放置过程产生的偏差通过误差扩散分散给周围未处理像素。在提取时,结合质心旋转匹配提取秘密比特并进行转角认证。结果采用圆形图像表达秘密信息而不涉及修改式嵌入,通过马赛克拼图产生有意义含密掩体,可通过质心旋转匹配提取秘密比特并进行转角认证。对密钥严格依赖,在遭受质量因子为50~80的JPEG压缩和随机转角攻击时,秘密信息可完整恢复,在遭受强度为8%~20%的椒盐噪声攻击时,提取信息的误码率低于5%,且对秘密信息的认证成功率均在80%以上。结论所提方法具有较好的抗攻击能力,可抵御信道攻击且具备较高的安全性。  
      关键词:图像马赛克;无载体;生成式隐藏;质心旋转匹配;误差扩散;随机转角认证   
      118
      |
      49
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693555 false
      更新时间:2024-05-07
    • 结合时间戳的指纹密钥数据加解密传输方案

      汪佩怡, 游林, 简志华, 胡耿然
      2020, 25(1): 60-72. DOI: 10.11834/jig.190175
      结合时间戳的指纹密钥数据加解密传输方案
      摘要:目的对于生物密钥而言,生物特征数据的安全与生物密钥的管理存储都很关键。为了构造能够应用在通信数据传输场景的生物密钥,同时保证生物特征本身的模糊性与密码学的精确性处于一种相对平衡状态,提出一种基于时间戳与指纹密钥的数据加解密传输方案。方法利用发送方指纹特征点之间的相对信息,与保密随机矩阵生成发送方指纹密钥;借助通信双方的预先设定数与时间戳,生成接收方恢复指纹密钥时所需的辅助信息;利用发送方指纹密钥加密数据,实现密文数据的传输。结果本文方法在仿真通信双方数据加解密的实现中,测试再生指纹密钥的识别率(GAR)与误识率(FAR)。通过实验数据分析,表明了本文提出的指纹密钥生成方法的可用性,以及指纹密钥作为数字身份所具备的可认证性,其中真实发送方的再生指纹密钥识别率可高达99.8%,并且本方案还可用于即时通信、对称加密等多种场景当中。结论本文方法利用时间戳确定了通信事件的唯一性与不可否认性,同时实现了指纹密钥恢复时的"一次一密"。此外,方案通过保密随机矩阵实现了发送方指纹密钥的可撤销,极大程度保障了指纹数据的安全性。  
      关键词:指纹密钥;时间戳;设定数;摘要值;随机矩阵;分割度量   
      20
      |
      22
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693552 false
      更新时间:2024-05-07
    • 嵌入广义树分类器的集合划分编码

      王卓, 周生龙, 田原, 帅云开, 李秋富
      2020, 25(1): 73-80. DOI: 10.11834/jig.190162
      嵌入广义树分类器的集合划分编码
      摘要:目的针对现有小波域图像集合划分编码(SPC)方法存在无损编码性能较弱的问题,设计广义树分类器,构建嵌入广义树分类器的集合划分编码方法(SPACS_C)。方法针对已有SPC方法对坐标集合直接进行"先检测后划分"编码,存在当位平面降低导致数据之间相关性降低后位置比特和不必要比特数量急剧增大问题,SPACS_C对编码过程中产生的坐标集合分类处理,减少对坐标集合的显著性检测次数,从而降低位置比特的输出。SPACS_C对广义树分类处理利用图像小波系数的稀疏度随位平面降低而迅速降低的数据特点,对"先划分后检测"和"先检测后划分"两种方式所需的比特开销进行预测,选用比特开销较少的方式编码坐标集合,减少SPACS_C输出的位置比特数量。结果采用不同统计特性和不同大小的可见光图像(8 bit)和红外图像(16 bit)测试SPACS_C,结果表明SPACS_C的无损编码性能优于JPEG 2000,特别是对红外图像的无损编码平均节省了3.1%的数据空间;性能接近或超过图像无损压缩标准JPEG-LS。结论SPACS_C对坐标集合的分类处理利用小波域图像低层位平面稀疏度差的数据特点,有效减少位置比特输出,进而提高编码性能。与JPEG2000一样,SPACS_C可以实现图像质量的渐进式压缩。SPACS_C的编码不受图像数据动态范围的影响,可以对任意位深度的图像进行压缩编码。  
      关键词:集合划分编码;分类器;无损编码;位置比特;不必要比特   
      45
      |
      59
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693686 false
      更新时间:2024-05-07

      图像分析和识别

    • 钢板表面低对比度微小缺陷图像增强和分割

      汤勃, 孔建益, 王兴东, 刘钊, 刘怀广
      2020, 25(1): 81-91. DOI: 10.11834/jig.190057
      钢板表面低对比度微小缺陷图像增强和分割
      摘要:目的环境干扰及光学元件不稳定等因素往往会造成钢板表面图像照度不均,钢板表面的微小缺陷具有图像灰度不均、对比度低、形态微小等特点,给后续图像分析和缺陷识别带来因难。为此,提出一种钢板表面低对比度微小缺陷图像增强和分割算法,以消除照度不均并突出缺陷信息,从而有效分割缺陷目标。方法采用小波-同态滤波算法进行图像增强处理,即先利用小波变换对图像进行分解,再基于同态滤波对小波低频系数进行图像灰度修正,同时对高频系数进行高通滤波,然后将处理后的小波低频系数和高频系数进行重构得到增强的图像,从而达到消除照度不均、增强缺陷细节信息的目的。最后利用最大类间方差法(Otsu法)确定自适应阈值提供给Canny算子进行边缘检测。结果采用本文算法对钢板表面多类型低对比度表面微小缺陷进行研究,有效消除了光照不均;单一的Otsu阈值分割和Canny算子难以有效检测这些缺陷,而本文Otsu-Canny算法的正确检测率达96%。结论采用小波-同态滤波进行图像增强处理后,再利用Otsu-Canny算法对钢板表面多类型、低对比度的微小缺陷进行边缘检测取得了良好效果。  
      关键词:机器视觉;表面缺陷;低对比度;小波变换;同态滤波   
      44
      |
      50
      |
      7
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693687 false
      更新时间:2024-05-07
    • 特征融合AlexNet模型的古代壁画分类

      曹建芳, 崔红艳, 张琦
      2020, 25(1): 92-101. DOI: 10.11834/jig.190221
      特征融合AlexNet模型的古代壁画分类
      摘要:目的针对古代壁画图像自身特征提取存在的主观单一性和客观不充分性等问题,以经典AlexNet网络模型为基础,提出了一种结合特征融合思想的卷积神经网络模型,用于古代壁画图像的自动分类。方法首先,由于大型壁画数据集较为缺乏,通过对壁画样本使用缩放、亮度变换、加噪和翻转等图像增强算法来扩大数据集,并提取壁画图像第1阶段的边缘等底层特征;其次,采用结构不同的双通道网络对提取的第1阶段特征进行第2阶段的深层抽象,得到两个通道的特征;最后,融合两个通道的特征,共同构建损失函数得到分类结果,从而提高模型的鲁棒性和特征表达能力。结果实验结果表明,在构造的壁画图像数据集上,该模型最终达到了85.39%的准确率。与AlexNet模型以及一些改进的卷积神经网络模型相比,各项评价指标均有大约5%的提高;与未进行预训练的经典模型相比,本文网络结构不易产生过拟合现象;与结合预训练的经典模型相比,准确率大致上有1%~5%的提升,从硬件条件、网络结构和内存消耗上来说代价更小。由此验证了本文模型对于壁画图像自动分类的合理性和有效性。结论本文提出的壁画分类模型,综合考虑网络宽度和深度的影响,能从多局部的角度提取壁画图像丰富的细节特征,具有一定的优势和使用价值,可进一步结合到与壁画图像分类的相关模型中。  
      关键词:壁画分类;特征融合;AlexNet模型;卷积神经网络;壁画数据集   
      73
      |
      0
      |
      3
      <HTML>
      <Meta-XML>
      <引用本文> <批量引用> 55693701 false
      更新时间:2024-05-07
    • 采用卷积核金字塔和空洞卷积的单阶段目标检测

      刘涛, 汪西莉
      2020, 25(1): 102-112. DOI: 10.11834/jig.190166
      采用卷积核金字塔和空洞卷积的单阶段目标检测
      摘要:目的在基于深度学习的目标检测模型中,浅层特征图包含更多细节但缺乏语义信息,深层特征图则相反,为了利用不同深度特征图的优势,并在此基础上解决检测目标的多尺度问题,本文提出基于卷积核金字塔和空洞卷积的单阶段目标检测模型。方法所提模型采用多种方式融合特征信息,先使用逐像素相加方式融合多层不同大小的特征图信息,然后在通道维度拼接不同阶段的特征图,形成具有丰富语义信息和细节信息的信息融合特征层作为模型的预测层。模型在锚框机制中引入卷积核金字塔结构,以解决检测目标的多尺度问题,采用空洞卷积减少大尺寸卷积核增加的参数量,合理地降低锚框数量。结果实验结果表明,在PASCAL VOC2007测试数据集上,所提检测框架在300×300像素的输入上检测精度达到79.3% mAP(mean average precision),比SSD(single shot multibox detector)高1.8%,比DSSD(deconvolutional single shot detector)高0.9%。在UCAS-AOD遥感数据测试集上,所提模型的检测精度分别比SSD和DSSD高2.8%和1.9%。在检测速度上,所提模型在Titan X GPU上达到21帧/s,速度超过DSSD。结论本文模型提出在两个阶段融合特征信息并改进锚框机制,不仅具有较快的检测速度和较高的精度,而且较好地解决了小目标以及重叠目标难以被检出的问题。  
      关键词:单阶段目标检测;特征融合;卷积核金字塔;锚框;空洞卷积   
      90
      |
      32
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693739 false
      更新时间:2024-05-07
    • 自适应混合高斯建模的高效运动目标检测

      刘伟, 郝晓丽, 吕进来
      2020, 25(1): 113-125. DOI: 10.11834/jig.190155
      自适应混合高斯建模的高效运动目标检测
      摘要:目的如何使快速性与完整性达到平衡是运动目标检测的关键问题。现有的满足快速性的算法容易受到光照的影响,对动态环境的适应能力较弱,获取的目标信息不完整,导致空洞问题的产生。而具有较高完整性的算法复杂度高,运算速度慢,实时性差。为此,本文提出基于自适应混合高斯建模的3帧差分算法。方法利用3帧差分运算简单、可扩展性强、抗干扰能力好的特性,对视频图像进行目标轮廓的提取。针对3帧差分运算导致目标内部信息提取不完整的问题,采用学习率自适应调整的混合高斯背景差分,在模型创建之初,通过较快的模型更新速率,增加背景模型的迭代次数,消除物体运动造成的"鬼影"。在背景模型中的干扰信息消除之后,以目标像素及相邻8像素在当前帧与背景模型中的差异度为依据调整学习率,实现背景模型的自适应修正,增加目标图像的完整性;同时,通过删除冗余的高斯分布,降低算法复杂度。为进一步确保目标边缘的完整及连续,采用边缘对比差分算法,使参与运算的帧数依据目标的运动速度自适应选取,以降低背景点的误判率,使边缘信息尽可能地连续、完整。结果本文算法获取的目标信息完整,且边缘平滑。在提升检测率的同时保证较高的准确率,达到了95.23%,所获目标的完整度提高了28.95%;与传统混合高斯算法相比,时间消耗降低了29.18%,基本达到实时性要求。与基于混合高斯建模的背景差分法(BD-GMM)和基于边缘对比的3帧差分法(TFD-EC)相比,本文算法明显占优。结论实验结果表明,本文算法可以有效抑制动态环境的干扰,降低算法复杂度,既保证实时性,又具有较好的完整性,可广泛应用于智能视频监控、军事应用、工业检测、航空航天等领域。  
      关键词:运动目标检测;3帧差分;边缘对比差分;背景模型;混合高斯建模;自适应学习率   
      13
      |
      5
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693766 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 顾及目标关联的自然场景文本检测

      易尧华, 何婧婧, 卢利琼, 汤梓伟
      2020, 25(1): 126-135. DOI: 10.11834/jig.190179
      顾及目标关联的自然场景文本检测
      摘要:目的目前基于卷积神经网络(CNN)的文本检测方法对自然场景中小尺度文本的定位非常困难。但自然场景图像中文本目标与其他目标存在很强的关联性,即自然场景中的文本通常伴随特定物体如广告牌、路牌等同时出现,基于此本文提出了一种顾及目标关联的级联CNN自然场景文本检测方法。方法首先利用CNN检测文本目标及包含文本的关联物体目标,得到文本候选框及包含文本的关联物体候选框;再扩大包含文本的关联物体候选框区域,并从原始图像中裁剪,然后以该裁剪图像作为CNN的输入再精确检测文本候选框;最后采用非极大值抑制方法融合上述两步生成的文本候选框,得到文本检测结果。结果本文方法能够有效地检测小尺度文本,在ICDAR-2013数据集上召回率、准确率和F值分别为0.817、0.880和0.847。结论本文方法顾及自然场景中文本目标与包含文本的物体目标的强关联性,提高了自然场景图像中小尺度文本检测的召回率。  
      关键词:自然场景;文本检测;小尺度文本;目标关联;级联卷积神经网络   
      23
      |
      5
      |
      6
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693787 false
      更新时间:2024-05-07
    • 使用密集弱注意力机制的图像显著性检测

      项圣凯, 曹铁勇, 方正, 洪施展
      2020, 25(1): 136-147. DOI: 10.11834/jig.190187
      使用密集弱注意力机制的图像显著性检测
      摘要:目的基于全卷积网络(FCN)模型的显著性检测(SOD)的研究认为,更大的解码网络能实现比小网络更好的检测效果,导致解码阶段参数量庞大。视觉注意力机制一定程度上缓解了模型过大的问题。本文将注意力机制分为强、弱注意力两种:强注意力能为解码提供更强的先验,但风险很大;相反,弱注意力机制风险更小,但提供的先验较弱;基于此提出并验证了采用弱注意力的小型网络架构也能达到大网络的检测精度这一观点。方法本文设计了全局显著性预测和基于弱注意力机制的边缘优化两个阶段,其核心是提出的密集弱注意力模块。它弥补了弱注意力的缺点,仅需少量额外参数,就能提供不弱于强注意力的先验信息。结果相同的实验环境下,提出的模型在5个数据集上取得了总体上更好的检测效果。同时,提出的方法将参数量控制在69.5 MB,检测速度达到了实时32帧/s。实验结果表明,与使用强注意力的检测方法相比,提出的密集弱注意力模块使得检测模型的泛化能力更好。结论本文目标是使用弱注意力机制来提高检测效能,为此设计了兼顾效率和风险的弱注意力模块。弱注意力机制可以提高解码特征的效率,从而压缩模型大小和加快检测速度,并在现有测试集上体现出更好的泛化能力。  
      关键词:显著性检测;视觉注意力机制;编码—解码;全卷积网络;实时检测   
      19
      |
      46
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693842 false
      更新时间:2024-05-07

      计算机图形学

    • 关键点选取的最小二乘渐进迭代逼近

      周雅情, 张莉, 王积荣, 龙启蒙, 黄鑫, 吴岸
      2020, 25(1): 148-157. DOI: 10.11834/jig.190148
      关键点选取的最小二乘渐进迭代逼近
      摘要:目的最小二乘渐进迭代逼近(LSPIA)方法多以均匀参数化或弦长参数化的形式均匀地确定初始控制点,虽然取得了良好效果,但在处理复杂曲线时,迭代速度相对较慢且误差精度不一定能达到预期设定值。为了进一步提高迭代效率和误差精度,本文提出了基于关键点(局部曲率最大点和极端曲率点)的最小二乘渐进迭代逼近方法。方法首先计算所有数据点的离散曲率,筛选出局部曲率最大点;接着设定初始的曲率下限,筛选出极端曲率点;然后将关键点与均匀选取的控制点按参数顺序化,并将其作为迭代的初始控制点;最后利用LSPIA方法对数据点进行拟合。结果对同一组数据点,分别采用LSPIA方法和基于关键点的LSPIA方法,本文方法较好地提高了收敛速度;在相同的控制点数目下,与LSPIA算法相比,本文方法的误差精度较小。结论本文方法适合于比较复杂的曲线,基于曲率分布的关键点的选取,可以更好地反映曲线的几何信息。数值实例表明,结合关键点筛选策略的LSPIA算法提高了计算效率,取得了更好的拟合效果。  
      关键词:曲率;关键点;最小二乘;渐进迭代逼近;增量算法   
      13
      |
      4
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693859 false
      更新时间:2024-05-07

      虚拟现实与增强现实

    • 复杂场景下视觉先验信息的地图恢复SLAM

      刘盛, 张宇翔, 徐婧婷, 邹大方, 陈胜勇, 王振华
      2020, 25(1): 158-170. DOI: 10.11834/jig.190041
      复杂场景下视觉先验信息的地图恢复SLAM
      摘要:目的 目前已有的单目视觉SLAM(simultaneous localization and mapping)系统每次开始运行时都将初始帧而不是绝对位置设置为参考帧,不能在一个固定的坐标系中获得位姿,导致无法重用已有的建图信息,而且在复杂场景中相机容易跟踪失败,需要当前帧与已有的关键帧非常相似时才能重定位并继续建图。针对这个问题,提出一种具有重新初始化、地图重用与地图恢复能力的视觉SLAM系统。方法 首先,加载先验地图,通过ORB(oriented brief)特征匹配SLAM系统当前帧与先验地图关键帧,并结合重定位方法完成SLAM系统的初始化。接着,为了避免丢失地图,建立一种应对SLAM系统跟踪失败的地图保存机制,保存跟踪成功地图,并提出一种自适应快速重新初始化算法,引入灭点检测,自动选择最佳重新初始化策略,保证SLAM系统继续跟踪与建图,建立的地图称为恢复地图。最后,对于跟踪成功地图与恢复地图,采用改进的回环方法获得它们之间的转换关系,并提出一种地图恢复法,减少跟踪成功地图与恢复地图尺度不一带来的误差,确保得到的全局一致地图更加准确。结果 在经过加噪处理的KITTI数据集上进行地图恢复融合的测试,实验结果表明,在KITTI00、KITTI02、KITTI05数据集下,本文提出的SLAM系统比ORB-SLAM2系统分别可以多获得39.25%、47.75%、32.46%的地图信息。在EuRoC数据集上的运行结果表明,本文提出的单目视觉SLAM系统不仅在建图精度方面与ORB-SLAM2效果相当,还在跟踪稳定性方面有显著提升。结论 本文提出的SLAM系统可以在跟踪失败的情况下有效恢复地图;此外,还可以高效重用SLAM系统已有的建图结果,固定SLAM地图坐标系,提升SLAM系统运行稳定性。  
      关键词:单目视觉SLAM;地图融合;地图重用;地图增强;地图恢复;自适应快速初始化算法   
      49
      |
      53
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693873 false
      更新时间:2024-05-07

      医学图像处理

    • 改进预训练编码器U-Net模型的PET肿瘤自动分割

      何慧, 陈胜
      2020, 25(1): 171-179. DOI: 10.11834/jig.190058
      改进预训练编码器U-Net模型的PET肿瘤自动分割
      摘要:目的 为制定放疗计划并评估放疗效果,精确的PET(positron emission tomography)肿瘤分割在临床中至关重要。由于PET图像存在低信噪比和有限的空间分辨率等特点,为此提出一种应用预训练编码器的深度卷积U-Net自动肿瘤分割方法。方法 模型的编码器部分用ImageNet上预训练的VGG19编码器代替;引入基于Jaccard距离的损失函数满足对样本重新加权的需要;引入了DropBlock取代传统的正则化方法,有效避免过拟合。结果 PET数据库共包含1 309幅图像,专业的放射科医师提供了肿瘤的掩模、肿瘤的轮廓和高斯平滑后的轮廓作为模型的金标准。实验结果表明,本文方法对PET图像中的肿瘤分割具有较高的性能。Dice系数、Hausdorff距离、Jaccard指数、灵敏度和正预测值分别为0.862、1.735、0.769、0.894和0.899。最后,给出基于分割结果的3维可视化,与金标准的3维可视化相对比,本文方法分割结果可以达到金标准的88.5%,这使得在PET图像中准确地自动识别和连续测量肿瘤体积成为可能。结论 本文提出的肿瘤分割方法有助于实现更准确、稳定、快速的肿瘤分割。  
      关键词:深度学习;正电子发射型断层成像;分割;肿瘤;U-Net   
      14
      |
      5
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693949 false
      更新时间:2024-05-07

      遥感图像处理

    • 全卷积神经网络下的多光谱遥感影像分割

      姚建华, 吴加敏, 杨勇, 施祖贤
      2020, 25(1): 180-192. DOI: 10.11834/jig.190157
      全卷积神经网络下的多光谱遥感影像分割
      摘要:目的 传统的遥感影像分割方法需要大量人工参与特征选取以及参数选择,同时浅层的机器学习算法无法取得高精度的分割结果。因此,利用卷积神经网络能够自动学习特征的特性,借鉴处理自然图像语义分割的优秀网络结构,针对遥感数据集的特点提出新的基于全卷积神经网络的遥感影像分割方法。方法 针对遥感影像中目标排列紧凑、尺寸变化大的特点,提出基于金字塔池化和DUC(dense upsampling convolution)结构的全卷积神经网络。该网络结构使用改进的DenseNet作为基础网络提取影像特征,使用空间金字塔池化结构获取上下文信息,使用DUC结构进行上采样以恢复细节信息。在数据处理阶段,结合遥感知识将波段融合生成多源数据,生成植被指数和归一化水指数,增加特征。针对遥感影像尺寸较大、采用普通预测方法会出现拼接痕迹的问题,提出基于集成学习的滑动步长预测方法,对每个像素预测14次,每次预测像素都位于不同图像块的不同位置,对多次预测得到的结果进行投票。在预测结束后,使用全连接条件随机场(CRFs)对预测结果进行后处理,细化地物边界,优化分割结果。结果 结合遥感知识将波段融合生成多源数据可使分割精度提高3.19%;采用基于集成学习的滑动步长预测方法可使分割精度较不使用该方法时提高1.44%;使用全连接CRFs对预测结果进行后处理可使分割精度提高1.03%。结论 针对宁夏特殊地形的遥感影像语义分割问题,提出基于全卷积神经网络的新的网络结构,在此基础上采用集成学习的滑动步长预测方法,使用全连接条件随机场进行影像后处理可优化分割结果,提高遥感影像语义分割精度。  
      关键词:遥感影像;语义分割;全卷积神经网络;DUC结构;空间金字塔池化;上下文信息;多尺度特征   
      14
      |
      4
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55693986 false
      更新时间:2024-05-07
    • 嵌入式深度神经网络高光谱图像聚类

      邱云飞, 潘博, 张睿, 王万里, 魏宪
      2020, 25(1): 193-205. DOI: 10.11834/jig.190129
      嵌入式深度神经网络高光谱图像聚类
      摘要:目的 高光谱图像的高维特性和非线性结构给聚类任务带来了"维数灾难"和线性不可分问题,以往的工作将特征提取过程与聚类过程互相剥离,难以同时优化。为了解决上述问题,提出了一种新的嵌入式深度神经网络模糊C均值聚类方法(EDFCC)。方法 EDFCC算法为了提取更加有效的深层特征,联合优化高光谱图像的特征提取和聚类过程,将模糊C均值聚类算法嵌入至深度自编码器网络中,可以保持两任务联合优化的优势,同时利用深度自编码器网络降维以及逼近任意非线性函数的能力,逐步将原始数据映射到潜在特征空间,提取数据的深层特征。所提方法采用模糊C均值聚类算法约束特征提取过程,学习适用于聚类的高光谱数据深层特征,动态调整聚类指示矩阵。结果 实验结果表明,EDFCC算法在Indian Pines和Pavia University两个高光谱数据集上的聚类精度分别达到了42.95%和60.59%,与当前流行的低秩子空间聚类算法(LRSC)相比分别提高了3%和4%,相比于基于自编码器的数据聚类算法(AEKM)分别提高了2%和3%。结论 EDFCC算法能够从高光谱图像的高维光谱信息中提取更加有效的深层特征,提升聚类精度,并且由于EDFCC算法不需要额外的训练过程,大大提升了聚类效率。  
      关键词:嵌入式学习;深度神经网络;自适应特征提取;聚类;高光谱图像   
      14
      |
      5
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55694004 false
      更新时间:2024-05-07
    • SAR图像舰船目标检测的信息几何方法

      张荫华, 杨萌
      2020, 25(1): 206-213. DOI: 10.11834/jig.190131
      SAR图像舰船目标检测的信息几何方法
      摘要:目的 舰船目标检测是合成孔径雷达(SAR)图像在海事监测领域中的一项重要应用。由于海面微波散射的复杂性,SAR图像中海杂波分布具有非均匀性、非平稳性等特点,传统的基于恒虚警率(CFAR)的SAR图像舰船检测算法难以适应复杂多变的海杂波环境,无法实现实时有效的智能检测任务。鉴于此,本文提出了基于信息几何的SAR图像船舰目标检测方法,旨在分析统计流形及其在参数空间中的几何结构,探讨信息几何在SAR图像目标检测应用中的切入点,从新的角度提升该应用领域的理论与技术水平。方法 首先,运用威布尔分布族对SAR图像中的海杂波进行统计建模,利用最大似然方法估计SAR图像局部邻域像素的分布参数,并将不同参数下的统计分布作为威布尔流形上的不同点;其次,融合高斯分布的费歇耳度量来构造威布尔流形空间中概率分布之间的测度,实现目标与背景区域的差异性表征;最后,利用最大类间方差法,实现SAR图像舰船目标检测。结果 实验和分析表明,相比于传统的基于恒虚警率的检测算法,信息几何方法可以有效地区分舰船目标和海杂波背景,降低虚警率,实现舰船目标显著性表示与检测。结论 由于舰船目标的复杂后向散射特性,如何有效地表征这一差异,是统计类检测算法的关键所在。本文依据信息几何理论,将概率分布族的参数空间视为微分流形,在参数流形上构造合适的黎曼度量,对SAR图像中各像素局部邻域进行测度表征,可以显著性表示目标与背景杂波之间的统计差异,实现舰船目标检测。  
      关键词:SAR图像;目标检测;信息几何;统计流形;黎曼度量   
      25
      |
      7
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55694014 false
      更新时间:2024-05-07
    0