最新刊期

    2019 24 11

      学者观点

    • 结合深度学习和半监督学习的遥感影像分类进展

      谭琨, 王雪, 杜培军
      2019, 24(11): 1823-1841. DOI: 10.11834/jig.190348
      结合深度学习和半监督学习的遥感影像分类进展
      摘要:本文以结合深度学习的遥感影像特征提取和不充足样本下地物识别与分类作为出发点,对2017—2019年用于遥感图像处理中小样本训练的深度学习方法进行归类总结,介绍如何结合深度学习技术解决遥感影像在样本不充分情况下的有效训练问题,从深度生成模型、迁移学习以及一些高效特征提取网络3个方面进行全面剖析。首先,探讨了以GAN(generative adversarial network)和VAE(variational autoencoder)及其衍生结构在遥感技术中分类、变化检测上的应用;然后,在基于知识复用的辅助训练策略——迁移学习中主要从基于网络的迁移和基于数据结构的迁移两大类应用展开讨论;最后探讨了结合半监督学习和主动学习等思想的深度学习算法以及一些新颖的网络结构的应用。虽然深度学习在遥感技术领域发挥了极大的优势,性能也普遍超过了浅层的学习器,但结合物理模型的分析和高性能的实用性遥感应用仍需进一步发展与研究。  
      关键词:遥感影像分类;深度学习;深度生成模型;半监督学习;迁移学习   
      61
      |
      93
      |
      15
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691553 false
      更新时间:2024-05-07

      综述

    • 光场数据压缩研究综述

      刘宇洋, 朱策, 郭红伟
      2019, 24(11): 1842-1859. DOI: 10.11834/jig.190035
      光场数据压缩研究综述
      摘要:光场数据体量大,为存储和压缩带来巨大困难。由于光场数据格式与传统图像视频数据不同,现有图像视频编码工具难以高效压缩光场数据。因此,光场数据高效压缩研究对降低存储消耗和传输带宽具有重要意义。目前,光场压缩的研究越来越深入,提出的方法种类也越来越丰富。本文对现阶段光场压缩进行系统综述,为后续研究者提供研究基础。本文简要介绍了光场的基本理论及四类光场采集设备,分析了4类采集设备的优缺点,阐明了光场采集方式对光场数据格式的影响;介绍了国际标准组织联合图像专家组(JPEG)在光场压缩标准化方面的最新进展,对JPEG Pleno光场编码器的每个模块做了详细介绍;在广泛文献调研的基础上,将光场压缩算法分成3类:基于变换的压缩方法、基于伪视频序列的压缩方法和基于预测的压缩方法,对每类算法进行详细梳理和总结,并做了详细地对比分析。通过系统地梳理,凝练出光场压缩近期的进展和尚存在的问题,并对未来光场压缩的研究趋势进行展望。实现光场的高效压缩非常具有挑战性,虽然光场压缩研究近期迅猛发展,但是压缩性能仍有待进一步提高。  
      关键词:光场;光场压缩;光场成像;JPEG Pleno;变换;伪视频序列   
      53
      |
      62
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691556 false
      更新时间:2024-05-07
    • 绘画图像美学研究方法综述

      白茹意, 郭小英, 贾春花, 耿海军
      2019, 24(11): 1860-1881. DOI: 10.11834/jig.190118
      绘画图像美学研究方法综述
      摘要:图像美学作为当前情感计算和计算机视觉领域的研究热点,为数字化绘画图像的美学研究提供了理论基础和有效方法,而且在人类绘画艺术作品的研究与保护方面具有重要的应用价值。为了更好地研究绘画图像的美学特性,本文主要针对现阶段国内外的绘画美学研究相关文献,进行详细的整理与分析。以大量文献研究为基础,分析中西方绘画的不同表现形式及形成原因;归纳总结了两种绘画图像美学研究方法:实验美学与计算美学,并概述两类方法的相关性。概括了当前绘画图像研究中的常用数据集;然后,以绘画图像样本数量、受试者人数、审美等级及眼动指标等为依据,详细归纳了绘画图像实验美学方法的研究现状及发展;基于图像数量、特征、分类数量、分类算法和准确率,主要从绘画图像分类的角度(包括情感、复杂度、画家和风格等)详细综述了绘画图像计算美学方法的研究现状及发展;其次,简要梳理了绘画图像美学研究中常用的评价方法,并分析了当前研究中的常用评价指标;最后,提出了当前绘画图像美学研究中存在的问题和挑战,并探讨了存在问题的应对之策。  
      关键词:中西方绘画图像;实验美学;计算美学;机器学习;评估方法   
      76
      |
      575
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691559 false
      更新时间:2024-05-07

      图像处理和编码

    • 采用训练策略实现的快速噪声水平估计

      徐少平, 林珍玉, 李崇禧, 刘婷云, 杨晓辉
      2019, 24(11): 1882-1892. DOI: 10.11834/jig.190064
      采用训练策略实现的快速噪声水平估计
      摘要:目的大多数图像降噪算法都属于非盲降噪算法,其获得良好降噪性能的前提是能够准确地获知图像的噪声水平值。然而,现有的噪声水平估计(NLE)算法在噪声水平感知特征(NLAF)提取和噪声水平值映射两个核心模块中分别存在特征描述能力不足和预测准确性有待提高的问题。为此,提出了一种基于卷积神经网络(CNN)自动提取NLAF特征,并利用增强BP(back propagation)神经网络将其映射为相应噪声水平值的改进算法。方法在训练阶段,首先通过训练卷积神经网络模型并以全连接层中若干与噪声水平值相关系数较高的输出值构成NLAF特征矢量;然后,在AdaBoost技术的支撑下,利用多个映射能力相对较弱的BP神经网络构建一个非线性映射能力更强的增强BP神经网络预测模型,将NLAF特征矢量直接映射为噪声水平值。在预测阶段,首先从给定噪声图像中随机选取若干个图块输入到卷积神经网络模型中,提取每个图块的若干维NLAF特征值后,利用预先训练的BP网络模型将其映射为对应的噪声水平值,然后以估计值的中值作为图像噪声水平值的最终估计结果。结果对于具有不同噪声水平和内容结构的噪声图像,利用所提算法估计出的噪声水平值与真实值之间的估计误差小于0.5,均方根误差小于0.9,表现出良好的预测准确性和稳定性。此外,所提算法具有较高的执行效率,估计一幅512×512像素的图像的噪声水平值仅需约13.9 ms。结论实验数据表明,所提算法在高、中、低各个噪声水平下都具有稳定的预测准确性和较高的执行效率,与现有的主流噪声水平估计算法相比综合性能更佳,可以很好地应用于要求噪声水平作为关键参数的实际应用中。  
      关键词:噪声水平估计;基于训练策略;图块级;噪声水平值感知特征;噪声水平值映射;中值估计   
      39
      |
      55
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691558 false
      更新时间:2024-05-07
    • 融合GF-MSRCR和暗通道先验的图像去雾

      刘万军, 白宛司, 曲海成, 赵庆国
      2019, 24(11): 1893-1905. DOI: 10.11834/jig.190089
      融合GF-MSRCR和暗通道先验的图像去雾
      摘要:目的针对雾天图像高亮和雾浓区域中容易出现场景透射率值求取不准确,导致复原后的图像细节丢失、出现光晕现象、对比度和色彩难以满足人眼的视觉特性等问题,提出了一种融合引导滤波优化的色彩恢复多尺度视网膜算法(GF-MSRCR)和暗通道先验的图像去雾算法。方法首先利用加权四叉树方法从最小通道图中快速搜索全局大气光值,再从图像增强角度应用GF-MSRCR算法初步估计场景透射率值,依据暗通道先验原理对最小通道图进行二次估测,根据两次求取结果按一定比例进行像素级图像融合,得到场景透射率估计值;利用变差函数修正估计值,经中值滤波进一步优化得到场景透射率的精确值,最后通过大气散射模型恢复雾天图像,调整对比度和恢复颜色后,得到了轮廓完整且细节清晰的无雾图像。结果理论分析和实验结果表明,经本文算法去雾处理后的图像信息熵、对比度、平均梯度、结构相似性分别平均提升了7.87%、21.95%、47.73%和15.58%,同时运行时间缩短了53.22%,对近景、含小部分天空区域、含大片天空区域和含白色物体场景的多种类型雾天图像显示出较好的复原效果。结论融合GF-MSRCR和暗通道先验的图像去雾算法能快速有效保留图像的细节信息、消除光晕,满足了人眼的视觉特性,具有一定的实用性以及普适性。  
      关键词:加权四叉树;GF-MSRCR;暗通道先验;图像融合;变差函数;中值滤波   
      145
      |
      156
      |
      6
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691557 false
      更新时间:2024-05-07

      图像分析和识别

    • 利用感知模型的长期目标跟踪

      张博, 江沸菠, 刘刚
      2019, 24(11): 1906-1917. DOI: 10.11834/jig.190059
      利用感知模型的长期目标跟踪
      摘要:目的传统相关滤波目标跟踪算法存在两个问题,其一,使用循环移位产生的虚假负样本训练分类器,导致分类器分类能力受到限制;其二,当目标被严重遮挡时,由遮挡引起的一些不正确的样本(预测的目标图像)用于更新分类器,随着遮挡时间的增加,分类器将包含较多噪声信息并逐渐失去判别力,使得跟踪失败。针对上述问题,提出一种基于感知模型的长期目标跟踪算法,通过引入背景感知策略解决传统相关滤波器缺乏真实负样本问题,通过引入遮挡感知策略来有效跟踪被遮挡的目标。方法首先,所提算法通过扩大采样区域,增加所产生训练样本数量,并引入裁剪矩阵,裁取移位后的样本以获得完整有效的样本,同时克服了由循环移位产生样本导致的边界效应问题;然后,利用无遮挡情况下一定帧数目标图像各自对应的分类器构建分类池;最后,在严重遮挡情况下利用最小化能量函数从分类池中选择最佳分类器进行重检测,以实现长期目标跟踪。结果使用公开数据集对所提算法进行性能评估,结果表明,所提算法成功率为0.990,精确度为0.988。其较背景感知相关滤波(BACF)算法分别提升2.7%和2.5%。结论所提算法在目标被遮挡、形变、尺度变化以及复杂背景下仍能较准确跟踪目标,具备较高的精确度和鲁棒性。  
      关键词:目标跟踪;循环卷积;背景感知;严重遮挡;分类池   
      17
      |
      21
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691652 false
      更新时间:2024-05-07
    • 多尺度特征图融合的目标检测

      姜文涛, 张驰, 张晟翀, 刘万军
      2019, 24(11): 1918-1931. DOI: 10.11834/jig.190021
      多尺度特征图融合的目标检测
      摘要:目的自然场景图像中,特征提取的质量好坏是决定目标检测性能高低的关键因素。大多数检测算法都是利用卷积神经网络(CNN)强大的学习能力来获得目标的先验知识,并根据这些知识进行目标检测。卷积神经网络的低层次特征缺乏特征的代表性,而高层次的特征则对小尺度目标的监测能力弱。方法利用原始SSD(single shot multiBox detector)网络提取特征图,通过1×1卷积层将提取的特征图统一为256维;通过反卷积操作增加自顶向下特征图的空间分辨率;通过对应元素相加的操作,将两个方向的特征图进行融合。将融合后的特征图采用3×3的卷积核进行卷积操作,减小特征图融合后的混叠效应。根据以上步骤构建具有较强语义信息的特征图,同时保留原有特征图的细节信息;对预测框进行聚合,利用非极大抑制(NMS)实现最终的检测效果。结果在PASCAL VOC 2007和PASCAL VOC 2012数据集上进行实验测试,该模型的mAP(mean average precision)为78.9%和76.7%,相对于经典的SSD算法,分别提高了1.4%和0.9%;此外,本文方法在检测小尺度目标时相较于经典SSD模型mAP提升了8.3%。结论提出了一种多尺度特征图融合的目标检测算法,以自顶向下的方式扩展了语义信息,构造了高强度语义特征图用于实现精确目标检测。  
      关键词:计算机视觉;深度学习;卷积神经网络;目标检测;多尺度特征图   
      44
      |
      78
      |
      9
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691654 false
      更新时间:2024-05-07
    • 多形状局部区域神经网络结构的行人再识别

      陈亮雨, 李卫疆
      2019, 24(11): 1932-1941. DOI: 10.11834/jig.190042
      多形状局部区域神经网络结构的行人再识别
      摘要:目的目前,行人再识别领域将行人图像的全局和局部特征相结合的方法已经成为基本的解决方法。现有的基于局部特征的方法更多的是侧重于定位具有特定的语义区域,这样增加了学习难度,并且对于差异较大的图像场景不具有鲁棒性。为了解决上述问题,通过对网络结构进行改进提出一种多形状局部区域网络(MSPN)结构,它具有多分支并将横向和纵向条状的特征作为局部特征,能够端到端进行训练。方法网络的多个分支设计可以同时获得多粒度和多形状的局部特征,其中一个分支表示全局特征的学习,两个分支表示横条状不同粒度的局部特征学习,最后一个分支表示竖条状局部特征学习。网络不再学习定位具有特定语义的区域,而是将图像提取的特征切分成横向和竖向的若干条作为局部特征。不同分支条的形状和数量不一致,最后获得不同粒度或不同形状的局部特征信息。因为切分方向的不同,多粒度多形状的局部特征缓解了行人在不同图像中无法对齐的问题。结果在包括Market-1501、DukeMTMC-ReID和CUHK03在内的主流评估数据集上的综合实验表明,多形状局部区域神经网络和现有的主要方法相比具有更好的表现。其中在数据集Market-1501上达到84.57%的平均准确率(mAP)和94.51%的rank-1准确率。结论多形状局部区域网络能够学习得到判别能力更强的深度学习模型,从而有效地提升行人再识别的准确率。  
      关键词:公共安全;监控;行人再识别;卷积神经网络;深度学习;局部区域特征   
      15
      |
      12
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691741 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 普通话发音过程中的舌3维运动控制模型

      刘蝉, 张少川, 钱兆鹏, 牛海军
      2019, 24(11): 1942-1951. DOI: 10.11834/jig.180644
      普通话发音过程中的舌3维运动控制模型
      摘要:目的言语发音过程中发音器官及其运动形态的精确可视化对发音机制的理解、言语疾病的诊断和治疗以及人机言语交互研究都具有重要意义。舌作为言语产生的重要器官,因其运动速度快、变形复杂、发音过程中不可见等原因,可视化比较困难。为此,提出一种基于统计模型法研究汉语普通话元辅音发音时舌的3维动态控制模型。方法首先采集普通话元辅音发音过程中讲话人的磁共振图像(MRI),采用手动标记法提取舌轮廓并建立静态3维网格模型;其次以模型顶点为变量,通过线性主成分分析法提取控制参数并建立舌运动控制方程;最后对发音过程中舌运动控制仿真效果进行评估。结果共提取含舌尖、舌体、舌背和下颌在内的6个3维模型运动控制参数,下颌参数控制下颌张合引起的舌旋转运动,舌体和舌背参数分别控制舌前后、拱起和凹陷运动,舌尖参数分别控制舌尖上下、前后和上翘运动,所提取的6个参数可以表达87.4%的舌3维运动变化,仿真效果优于其他语言的运动控制结果。结论本文方法可以有效应用于汉语普通话发音的舌建模与3维运动控制,降低舌3维运动建模的复杂性,研究结果可以为汉语普通话发音过程中的器官可视化提供有用信息。  
      关键词:发音器官可视化;舌;磁共振成像;统计模型;汉语普通话   
      11
      |
      4
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691792 false
      更新时间:2024-05-07
    • 图像序列的增量式运动结构恢复

      高天寒, 杨子艺
      2019, 24(11): 1952-1961. DOI: 10.11834/jig.190066
      图像序列的增量式运动结构恢复
      摘要:目的传统增量式运动结构恢复算法中,初始图像对选择鲁棒性差,增量求解过程效率较低,捆绑调整策略存在计算冗余,模型修正后仍存在较大误差。为解决上述问题,以基于图像序列的3维重建为基础,提出一种新的增量式运动结构恢复算法(SFM-Y)。方法首先,采用改进的自适应异常值过滤方法增强初始图像对选择的鲁棒性,得到用于初始重建的初始图像对;其次,通过增量迭代重建丰富点云模型,采用改进的EPNP(efficient perspective-$n$-point)解算方法提高增量添加过程的计算效率和精确度;最后,采用优化的捆绑调整策略进行模型修正,解决模型漂移问题,修正重投影误差。结果实验选取不同数据规模的数据集,在本文方法及传统方法间进行测试对比,以便更加全面地分析算法性能。实验结果表明,SFM-Y算法相比传统的增量式运动结构恢复算法,在计算效率和结果质量方面均有所提高,根据性能分析对比的结果所示,本文方法较传统方法在计算效率和重建精度上约有10%的提升。结论提出的增量式运动结构恢复算法能够高效准确地实现基于图像序列的3维重建优于传统方法,计算效率较高,初始重建鲁棒性强,生成模型质量较好。  
      关键词:增量式运动结构恢复算法;3维重建;图像序列;PNP问题;捆绑调整   
      13
      |
      5
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691804 false
      更新时间:2024-05-07
    • 平滑约束与三角网比例剖分像对稠密匹配

      贾迪, 吴思, 赵明远, 杨宁华
      2019, 24(11): 1962-1971. DOI: 10.11834/jig.190079
      平滑约束与三角网比例剖分像对稠密匹配
      摘要:目的像对稠密匹配是视觉定位、影像融合、超分辨率重建等高级图像处理技术的基础,由于像对可能受多种摄影条件的影响,导致难以获得高效的稠密匹配结果,为此提出一种结合密度聚类平滑约束与三角网等比例剖分的像对稠密匹配方法。方法为了快速获得同名点集,采用ORB(oriented FAST and rotated BRIEF)算法获取稀疏匹配点集,利用积分图筛选出以该特征点为中心的邻域中密度直达的特征点数目,计算像对间每个特征点对的偏移角、位置信息以及欧氏距离后进行密度估计聚类,通过平滑约束条件扩充聚类中的特征点对,从而快速获得内点集。证明了三角剖分在仿射变换下的等比例性质,以内点集为基础构建三角网,利用该性质分别计算像对中对应三角网内部等比例点的位置,并利用这些等比例点校验两个三角区域的相似性,进一步提纯内点集。最后,利用提纯后的内点集计算稠密匹配点位置,作为最后的稠密匹配结果。结果在多个具有尺度缩放、重复纹理、旋转的公共数据集上进行像对匹配实验,实验结果表明,本文方法具备一定的抗旋转、尺度变化与重复纹理能力,能够较好地避免由于某些局部外点造成仿射变换矩阵估计不准确而影响整体平面稠密匹配准确率的情况,同时保证快速获得足够稠密的匹配结果。结论实验结果验证了本文方法的有效性与实用性,其结果可应用于后期高级图像处理技术中。  
      关键词:局部一致性估计;稠密匹配;等比例三角剖分;仿射变换;平滑约束   
      13
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691831 false
      更新时间:2024-05-07
    • 理想投影椭圆约束下的鱼眼镜头内部参数标定

      黄明益, 吴军
      2019, 24(11): 1972-1984. DOI: 10.11834/jig.190061
      理想投影椭圆约束下的鱼眼镜头内部参数标定
      摘要:目的鱼眼镜头是发展轻、小型全方位视觉系统的理想光学传感器,但由于镜头焦距短、视场大及光学原理约束,鱼眼图像存在严重畸变,为此提出一种高精度、应用方式灵活的鱼眼镜头内部参数标定方法,以期将鱼眼图像转换成符合人眼视觉习惯的平面透视投影图像。方法从球面透视投影模型出发,首先分析给出空间直线在水平面上的理想投影椭圆约束,进而结合椭圆严格几何特性建立误差方程对鱼眼相机等效焦距$f$,纵横比$A$及径向畸变参数$k$1$k$2进行最小二乘估计,最后利用估计参数对鱼眼图像进行立方盒展开实现平面透视纠正目的。结果对某型号定焦鱼眼相机的棋盘格影像多视标定及网上鱼眼图像单视自标定结果表明,本文方法标定参数对鱼眼图像不同区域的平面透视纠正效果稳健、精度高。多视标定参数均方根误差(RMSE)约0.1像素,纠正影像上直线拟合误差RMSE约0.2像素,总体效果略优于对比文献方法;单视自标定参数误差RMSE约0.3像素,影像纠正范围、直线透视特性保持明显优于对比文献方法及商业软件DXO(DXO Optics Pro)。结论本文方法标定参数少、计算过程简单且对标定参照物要求不高,对于具有大量直线的人工场景理论上可实现自标定,应用价值较高。  
      关键词:鱼眼镜头标定;鱼眼相机标定;鱼眼图像矫正;球面透视投影;理想投影椭圆约束   
      11
      |
      4
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691847 false
      更新时间:2024-05-07
    • 同态滤波下RGB-D点云配准方法

      苏本跃, 储小玉, 盛敏
      2019, 24(11): 1985-1997. DOI: 10.11834/jig.190011
      同态滤波下RGB-D点云配准方法
      摘要:目的为了提高彩色物体配准的精度,针对3维点云颜色信息易受光照条件影响的问题,提出一种基于光照补偿的RGB-D(RGB Depth)点云配准方法。方法引入同态滤波算法,并将模型对象的3维点云转化成线性点序列,从而对颜色信息进行光照补偿,以提高颜色信息的一致性;获取模型的颜色和几何特征并加权组合成混合特征,以此定义源点云的特征点,并运用K近邻算法搜索其对应点;用奇异值分解(SVD)得到配准的刚性变换矩阵。结果进行传统的迭代最近点法(ICP)算法、深度信息与色调相结合的算法以及本文算法在不同的光照强度组合的模型配准对比实验,结果显示,在网面凹凸均匀的大卫模型上,配准时间及特征点匹配平均误差方面均约减少到对比方法的1/2;在网面光滑的barrel模型和网面凹凸不一致的阿基米德模型上,特征点匹配平均误差约分别减少到对比方法的1/6和1/8。此外,与Super 4-Points Congruent Set(Super 4PCS)、彩色点云配准算法在不同组合光照强度下进行对比实验,针对4种不同的网面结构模型,本文算法的SIFT特征点距离平均误差全距约减少到对比方法的1/5。结论利用同态滤波算法抑制光照影响,提高了颜色信息的一致性,在一定效果上消除了光照强度不均匀对3维点云配准精度的干扰。  
      关键词:RGB-D数据;光照补偿;HSV空间;同态滤波;混合特征;点云配准   
      15
      |
      7
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691849 false
      更新时间:2024-05-07

      计算机图形学

    • 插值给定对角曲线的能量极小Bézier曲面造型

      朱雨凡, 徐岗, 凌成南, 李博剑, 许金兰
      2019, 24(11): 1998-2008. DOI: 10.11834/jig.190003
      插值给定对角曲线的能量极小Bézier曲面造型
      摘要:目的曲面造型是计算机辅助几何设计中的重要研究内容,张量积类型曲面的对角曲线是衡量曲面性质的重要度量,与曲面的几何形状密切相关。基于输入对角曲线的曲面设计方法在实际应用中具有一定的价值,因此提出一种插值给定对角曲线的能量极小Bézier曲面造型的方法。方法给定一条对角曲线时,修正用户输入的对角曲线及边界曲线的几何信息,然后运用拉格朗日乘数法,结合曲面内部能量函数,求解待定的内部控制顶点,构造曲面。给定两条对角曲线时,在上述内容基础上加入了两条对角曲线必有交点的考量,增加对对角曲线控制顶点的修正。结果增加了对角曲线这一约束条件,从对比实验曲线图可以看出,随着横坐标曲面阶数升高,纵坐标修正曲线和用户曲线间的差值越来越小,结果表明曲面阶数越高,修正曲线与用户曲线偏差越小,造型效果越好。结论该曲面造型方法简单,基于修正后的对角曲线和边界曲线构造的曲面具有极小内部能量,可满足曲面造型方面的相关需求。  
      关键词:曲面造型;对角曲线;拉格朗日乘数法;弯曲能量;拟调和能量;Dirichlet能量   
      16
      |
      49
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691913 false
      更新时间:2024-05-07

      医学图像处理

    • 多通道融合可分离卷积神经网络下的脑部磁共振图像分割

      郭彤宇, 王博, 刘悦, 魏颖
      2019, 24(11): 2009-2020. DOI: 10.11834/jig.190043
      多通道融合可分离卷积神经网络下的脑部磁共振图像分割
      摘要:目的卷积神经网络方法可以提取到图像的深层次信息特征,在脑部磁共振图像(MRI)分割领域展现出优秀的性能。但大部分深度学习方法都存在参数量大,边缘分割不准确的问题。为克服上述问题,本文提出一种多通道融合可分离卷积神经网络(MFSCNN)模型分割脑图像。方法首先,在训练集中增加待分割脑结构及其边缘像素点的权重,强制使网络学习如何分割脑结构边缘部分,从而提升整体脑结构分割的准确率。其次,引入残差单元,以避免梯度弥散,同时使用深度可分离卷积代替原始的卷积层,在不改变网络每个阶段特征通道数的情况下,减少了网络训练的参数数量和训练时间,降低了训练成本。最后,将不同阶段的特征信息合并在一起,进行通道混洗,得到同时包含深浅层次信息的增强信息特征,加入到网络中进行训练,每个阶段的输入特征信息更丰富,学习特征的速度和收敛速度更快,显著地提升了网络的分割性能。结果在IBSR(internet brain segmentation repositor)数据集上的分割结果表明,MFSCNN的分割性能相对于普通卷积神经网络(CNN)方法要明显提高,且在边缘复杂的部分,分割效果更理想,Dice和IOU(intersection over union)值分别提升了0.9% 6.6%,1.3% 9.7%。在边缘平滑的部分,MFSCNN方法比引入残差块的神经网络模型(ResCNN)和引入局部全连接模块的神经网络模型(DenseCNN)分割效果要好,而且MFSCNN的参数量仅为ResCNN的50%,DenseCNN的28%,在提升分割性能的同时,也降低了运算复杂度,缩短了训练时间。同时,在IBSR、Hammer67n20、LPBA40这3个数据集上,MFSCNN的分割性能比现有的其他主流方法更出色。结论本文提出的MFSCNN方法,加强了网络特征的信息量,提升了网络模型的训练速度,在不同数据集上均获得更精确的MR脑部图像分割结果。  
      关键词:MR脑部图像分割;卷积神经网络;深度可分离卷积;多通道融合;通道混洗   
      17
      |
      54
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55691914 false
      更新时间:2024-05-07

      遥感图像处理

    • 应用级联多分类器的高光谱图像分类

      邱云飞, 王星苹, 王春艳, 孟令国
      2019, 24(11): 2021-2034. DOI: 10.11834/jig.190047
      应用级联多分类器的高光谱图像分类
      摘要:目的高光谱分类任务中,由于波段数量较多,图像中存在包含噪声以及各类地物样本分布不均匀等问题,导致分类精度与训练效率不能平衡,在小样本上分类精度低。因此,提出一种基于级联多分类器的高光谱图像分类方法。方法首先采用主成分分析方法将高度相关的高维特征合成无关的低维特征,以加快Gabor滤波器提取纹理特征的速度;然后使用Gabor滤波器提取图像在各个尺寸、方向上的纹理信息,每一个滤波器会生成一张特征图,在特征图中以待分类样本为中心取一个$ d×d $的邻域,计算该邻域内数据的均值和方差来作为待分类样本的空间信息,再将空间信息和光谱信息融合,以降低光线与噪声的影响;最后将谱—空联合特征输入级联多分类器中,得到预测样本关于类别的概率分布的平均值。结果实验采用Indian Pines、Pavia University和Salinas 3个数据集,与经典算法如支持向量机和卷积神经网络进行比较,并利用总体分类精度、平均分类精度和Kappa系数作为评价标准进行分析。本文方法总体分类精度在3个数据集上分别达到97.24%、99.57%和99.46%,相对于基于径向基神经网络(RBF)核函数的支持向量机方法提高了13.2%、4.8%和5.68%,相对于加入谱—空联合特征的RBF-SVM(radial basis function-support vector machine)方法提高了2.18%、0.36%和0.83%,相对于卷积神经网络方法提高了3.27%、3.2%和0.3%;Kappa系数分别是0.968 6、0.994 3和0.995 6,亦有提高。结论实验结果表明,本文方法应用于高光谱图像分类具有较优的分类效果,训练效率较高,无需依赖GPU,而且在小样本上也具有较高的分类精度。  
      关键词:高光谱图像;Gabor滤波器;级联多分类器;主成分分析;谱—空联合特征;小样本   
      23
      |
      18
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55692021 false
      更新时间:2024-05-07
    • 改进型DeepLab的极化SAR果园分类

      王云艳, 罗冷坤, 周志刚
      2019, 24(11): 2035-2044. DOI: 10.11834/jig.190094
      改进型DeepLab的极化SAR果园分类
      摘要:目的针对农作物种植趋向集中化、机械化和庄园化的现状,高分辨率遥感影像精准识别技术已广泛应用于农作物分类。研究表明,采用先进的深度学习算法挖掘高分辨率农作物影像信息,有利于高效地分析农作物长势和参量预测,为此,提出一种改进型深度神经网络(DeepLab)的高分辨率果园遥感图像分割算法。方法首先提取原始数据的极化特征和基于相干/非相干分解的特征组成高维特征空间,然后选用流行学习降维方式获得最优3通道特征向量构成伪彩图,利用深度可分离网络(xception)、空洞卷积网络(atrous convolution)、多孔空间金字塔(ASPP)和上采样(upsample)搭建DeepLab的编码解码过程(encoder-decoder),最后将伪彩训练集和标签导入搭建的DeepLab进行训练并保存模型,利用模型对目标数据进行有效分类。结果利用本算法对中国海南某地的Ⅰ期芒果、Ⅱ期芒果、Ⅲ期芒果、槟榔、龙眼5类水果进行分类,针对不同时期的同一种水果分类错误率下降了8%左右,相比传统的果园分类算法,本算法的kappa系数提高了约0.1,总体分类精度(OA)也有一定程度的提高。结论本算法在保证不同类别水果分类准确率的基础上,提高了不同时期的同一类水果的分类准确率,在一定程度上提高了农作物长势分析的准确性,保证了高分辨率果园数据分析的可靠性。  
      关键词:高分辨率;空洞卷积;深度学习;多孔空间金字塔;深度可分离网络   
      14
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55692007 false
      更新时间:2024-05-07
    • 李泽, 汪玲, 胡长雨
      2019, 24(11): 2045-2056. DOI: 10.11834/jig.190078
      融合深度学习和凸优化迭代求解策略的逆合成孔径雷达成像方法
      摘要:目的针对基于压缩感知(CS)的逆合成孔径雷达(ISAR)成像方法的成像质量和应用一直受到目标场景稀疏性好坏和迭代重建耗时长限制的问题,提出一种基于交替方向乘子法网络(ADMMN)的ISAR成像方法。方法根据交替方向乘子法(ADMM)求解稀疏假设下CS ISAR成像模型时采取的分裂变量的策略,将凸优化迭代求解过程映射到一个多级的深度神经网络,构建出ADMMN。ADMMN通过训练学习欠采样的ISAR测量数据与高质量目标图像之间的映射关系,借此实现ISAR欠采样数据成像。结果实验采用仿真卫星数据和实测飞机数据,两种数据的采样率分别为25%和10%。实验结果表明,相较于典型的CS ISAR正交匹配追踪(OMP)成像方法和贪婪卡尔曼滤波(GKF)成像方法,ADMMN成像方法能够更准确地重建目标区域散射点,在虚警(FA)、漏检(MD)和相对均方根误差(RRMSE)等成像质量评估指标上均有改善。在卫星数据成像实验中,相比于OMP和GKF,ADMMN在RRMSE指标上分别降低了49.8%和26.5%。在飞机数据成像实验中,相比于OMP和GKF,ADMMN在RRMSE指标上分别降低了68.7%和74.9%。此外,在验证ADMMN先验信息依赖性的实验中,分别采用卫星训练数据和飞机训练数据训练好的两种ADMMN,都能够对10%的飞机目标测量数据成像。结论融合深度学习和凸优化迭代求解策略的ADMMN ISAR成像方法能够使用非常少的数据获得高质量的成像结果,且成像效率高。  
      关键词:成像;压缩感知;逆合成孔径雷达;凸优化;深度神经网络;深度交替方向乘子法网络   
      12
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55692020 false
      更新时间:2024-05-07
    0