最新刊期

    2019 24 7

      学者观点

    • 近年目标跟踪算法短评——相关滤波与深度学习

      孟琭, 李诚新
      2019, 24(7): 1011-1016. DOI: 10.11834/jig.190111
      摘要:目的目标跟踪是计算机视觉领域的重要组成部分。近年来,基于相关滤波和深度学习的目标跟踪算法层出不穷,本文拟对经典的若干目标跟踪算法进行阐述与分析。方法首先,对基于相关滤波跟踪算法的基础理论进行介绍,针对相关滤波算法在特征改进类、尺度改进类、消除边界效应类、图像分块类与目标响应自适应类方面进行总结;接下来,从3个方面对基于深度学习的目标跟踪算法进行阐述与分析:目标分类、结构化回归、孪生网络,并对有代表性的跟踪算法的优势与缺陷进行较深层次的解读。结果通过列举跟踪算法在相关滤波阶段、深度学习阶段针对不同的改进机制的改进算法,总结各阶段算法的优缺点。对目标跟踪算法的最新进展进行阐述,最终对目标跟踪算法的未来发展方向进行总结。结论基于相关滤波的目标算法在实时性方面表现优秀,但对于复杂背景干扰、相似物遮挡等情况仍然需要优化。深层的卷积特征对于目标有强大的表示力,通过使相关滤波算法与深度学习结合,大幅度提升了算法表现力。基于深度学习的跟踪算法则更侧重于跟踪的性能,大多无法满足实时性。孪生神经网络的使用对于基于深度学习类目标跟踪算法产生了很大的推动,兼顾了算法的性能和实时性。  
      关键词:目标跟踪;相关滤波;深度学习;孪生神经网络   
      76
      |
      420
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685181 false
      更新时间:2024-05-07

      综述

    • 主动目标几何建模研究方法综述

      孔研自, 朱枫, 郝颖明, 吴清潇, 鲁荣荣
      2019, 24(7): 1017-1027. DOI: 10.11834/jig.180607
      主动目标几何建模研究方法综述
      摘要:目的目标建模是机器视觉领域的主要研究方向之一,主动目标建模是在保证建模完整度的情况下,通过有计划地调节相机的位姿参数,以更少的视点和更短的运动路径实现目标建模的智能感知方法。为了反映主动目标建模的研究现状和最新进展,梳理分析了2004年以来的相关文献,对国内外研究方法做出概括性总结。方法以重构模型类型和规划视点所用信息作为划分依据,将无模型的主动目标建模方法分为基于表面的主动目标建模方法、基于搜索的目标建模方法和两者相结合的方法3大类,重点对前两类方法进行综述,首先解释了每类方法的基本思想,总结每类方法涉及的问题,然后对相关问题的主要研究方法进行归纳和分析,最后将各个问题的解决方法进行合理的搭配组合,形成不同的主动目标建模方法,并对各类方法的优势和局限性进行了总结。结果各类主动目标建模算法在适用场景范围、计算复杂度等方面存在差异,但相对于传统的被动目标建模方法,当前的主动目标建模算法已经能够极大程度地提高建模任务的质量和降低建模所需代价。结论基于表面的主动目标建模方法思想相对简单,但仅适用于表面简单的目标建模。基于搜索的目标建模方法能够量化地评价每一个候选视点,适用广泛且涉及的问题相对于基于表面的方法有更大的解决空间,有更多的研究成果产生。将二者涉及问题的不同研究方法相搭配,可以构成不同的主动目标建模方法子类。  
      关键词:主动目标建模;主动视觉;视点规划;传感器规划;智能感知   
      66
      |
      39
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685193 false
      更新时间:2024-05-07
    • 3D打印模型版权保护技术研究进展

      冯小青, 李黎, 王继林, 董克明, 刘亚楠, 严素蓉
      2019, 24(7): 1028-1041. DOI: 10.11834/jig.180512
      3D打印模型版权保护技术研究进展
      摘要:目的近年来3D打印模型的版权标注和保护引起了研究者的关注,为了全面反映3D打印模型版权保护研究的现状和最新进展,本文对国内外公开发表的主要文献进行了梳理和分析。方法首先在广泛文献调研的基础上,描述3D打印模型文件和3D打印模型攻击类型,分析3D打印和扫描过程对模型的影响。然后对3D打印模型的版权保护策略进行分类,详细阐述每类方法的基本框架和相关技术特征。最后根据相关文献,将3D打印数字水印方法与传统网格水印算法和抗3D打印—扫描攻击的性能进行比较。结果基于物理特性的3D模型版权保护技术能对3D打印后的模型嵌入有效的具有一定隐蔽性的版权标识,但在提取微结构体等信息时需要借助一些专用设备,不具有普适性。基于数字水印的方法既能抵抗传统的数字模态下的相似性变换、剪切、噪声、细分、量化、光顺等攻击,又能有效抵抗3D模型的数/模等模态转换攻击,并且高精度的3D打印机和扫描仪能有效提高水印的检测率。结论3D打印产品是设计者和生产企业的智慧和心血的结晶,包含知识产权。随着3D打印在工业领域的广泛应用,3D打印模型版权保护有着广阔的应用前景和研究价值,但目前针对3D打印模型的版权保护的检测和评估机制存在一些局限性,未来需要构建统一的3D打印模型测试库和3D打印模型水印评测体系。  
      关键词:3D打印;3D扫描;版权保护;数字水印;评估指标   
      59
      |
      174
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685192 false
      更新时间:2024-05-07

      图像处理和编码

    • 两阶段多层感知的随机脉冲噪声比例预测

      于海雯, 易昕炜, 徐少平, 张贵珍, 刘婷云
      2019, 24(7): 1042-1054. DOI: 10.11834/jig.180534
      两阶段多层感知的随机脉冲噪声比例预测
      摘要:目的基于卷积神经网络(CNN)在图块级上实现的随机脉冲噪声(RVIN)降噪算法在执行效率方面较经典的逐像素点开关型降噪算法有显著优势,但降噪效果如何取决于能否对降噪图像受噪声干扰程度(噪声比例值)进行准确估计。为此,提出一种基于多层感知网络的两阶段噪声比例预测算法,达到自适应调用CNN预训练降噪模型获得最佳去噪效果的目的。方法首先,对大量无噪声图像添加不同噪声比例的RVIN噪声构成噪声图像集合;其次,基于视觉码本(visual codebook)采用软分配(soft-assignment)编码法提取并筛选若干能反映噪声图像受随机脉冲噪声干扰程度的特征值构成特征矢量;再次,将从噪声图像上提取的特征矢量及对应的噪声比例分别作为多层感知网络的输入和输出训练噪声比例预测模型,实现从特征矢量到噪声比例值的映射(预测);最后,采用粗精相结合的两阶段实现策略进一步提高RVIN噪声比例的预测准确性。结果针对不同RVIN噪声比例的失真图像,从预测准确性、实际降噪效果和执行效率3个方面验证提出算法的性能和实用性。实验数据表明,本文算法在大多数噪声比例下的预测误差小于2%,降噪效果(PSNR指标)较其他主流降噪算法高24 dB,处理一幅大小为512×512像素的图像仅需3 s左右。结论本文提出的RVIN噪声比例预测算法在各个噪声比例下具有鲁棒的预测准确性,在降噪效果和执行效率两个方面较经典的开关型RVIN降噪算法有显著提升,更具实用价值。  
      关键词:降噪;随机脉冲噪声;噪声比例预测;噪声比例感知特征;多层感知网络;计算效率   
      17
      |
      39
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685191 false
      更新时间:2024-05-07
    • 相似匹配块组的稀疏表示图像修复

      楼幸欣, 唐向宏, 张越
      2019, 24(7): 1055-1066. DOI: 10.11834/jig.180567
      相似匹配块组的稀疏表示图像修复
      摘要:目的传统多样本块稀疏表示的图像修复过程中,容易因为匹配样本块的错误,重构出不正确的填充块,致使在边缘部分产生不连贯的现象,然而单样本匹配填充又容易产生明显的伪影,不能保证与周围结构保持连续,以致产生明显的修复痕迹,为此,本文提出一种改进的基于相似匹配块组的稀疏表示方法。方法首先,采用颜色信息与余弦距离结合的方法定义图像块匹配准则,在目标邻域范围内获得结构变化趋势更相似的匹配块组;然后,在稀疏重构过程中,同时考虑已知信息和估计的未知信息,利用相似块与目标块的匹配程度,对稀疏系数增加不同的权重,以此来增强筛选匹配块的能力,减少纹理模糊现象;最后,根据结构稀疏度自适应地在各结构复杂度不同的区域确定样本块尺寸,减少图像修复过程中的错误传播现象。结果实验结果表明,本文算法改善了在边缘修复过程中产生断裂或者纹理延伸的现象,不仅在主观视觉有明显的提升,其修复结果的峰值信噪比(PSNR)相较于其他相关稀疏表示修复算法提高了0.53 dB。结论本文算法实现了对不同结构特征的彩色破损图像的修复,在结构边缘处有理想的修复效果,并且对各种形状的破损也具有良好的修复效果。  
      关键词:彩色图像修复;匹配准则;相似块组;稀疏约束;自适应样本块大小   
      66
      |
      229
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685190 false
      更新时间:2024-05-07

      图像分析和识别

    • 结合聚合通道特征和双树复小波变换的手势识别

      鲍文霞, 解栋文, 朱明, 梁栋
      2019, 24(7): 1067-1075. DOI: 10.11834/jig.180504
      结合聚合通道特征和双树复小波变换的手势识别
      摘要:目的针对目前手势识别方法受环境、光线、旋转、缩放、肤色等因素的影响,导致手势识别精度下降的问题,提出一种结合聚合通道特征(ACF)的手势检测和双树复小波变换(DTCWT)的复杂背景下手势识别方法。方法在手势图像预处理过程中引入聚合通道特征,采用Adaboost分类器和非极大值抑制算法(NMS)进行目标手势的检测;利用DTCWT对目标手势图像进行多尺度多方向分解,对高低频系数的每一块分别提取方向梯度直方图(HOG)和局部二值模式(LBP)特征;最后融合各个方向上的高低频特征并通过支持向量机(SVM)进行分类识别。结果选取多个场景、多个对象、不同角度和距离的图像作为训练集,并标注区分前背景,对20种手势进行识别实验,并与传统的肤色检测、HOG特征手势识别、类-Hausdorff距离的手势识别算法进行了实验对比。在任意可承受范围内的光照、距离等情况下,该方法能够更准确实时地实现手势识别,平均精度达到95.1%。结论在图像预处理的情况下,聚合通道特征的引入能够准确检测手势,同时基于DTCWT的手势图像频域特征提取和再融合的方法有效地解决了传统普通图像的单特征识别方法在光线和复杂背景下识别精度不高的问题。  
      关键词:聚合通道特征;双树复小波变换(DTCWT);方向梯度直方图(HOG)特征;二值模式(LBP)特征;特征融合;支持向量机(SVM)   
      19
      |
      45
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685242 false
      更新时间:2024-05-07
    • 结合加权局部旋度模式的3维人脸表情识别

      余璟, 达飞鹏
      2019, 24(7): 1076-1085. DOI: 10.11834/jig.180473
      结合加权局部旋度模式的3维人脸表情识别
      摘要:目的3维人脸的表情信息不均匀地分布在五官及脸颊附近,对表情进行充分的描述和合理的权重分配是提升识别效果的重要途径。为提高3维人脸表情识别的准确率,提出了一种基于带权重局部旋度模式的3维人脸表情识别算法。方法首先,为了提取具有较强表情分辨能力的特征,提出对3维人脸的旋度向量进行编码,获取局部旋度模式作为表情特征;然后,提出将ICNP(interactive closest normal points)算法与最小投影偏差算法结合,前者实现3维人脸子区域的不规则划分,划分得到的11个子区域保留了表情变化下面部五官和肌肉的完整性,后者根据各区域对表情识别的贡献大小为各区域的局部旋度模式特征分配权重;最后,带有权重的局部旋度模式特征被输入到分类器中实现表情识别。结果基于BU-3DFE 3维人脸表情库对本文提出的局部旋度模式特征进行评估,结果表明其分辨能力较其他表情特征更强;基于BU-3DFE库进行表情识别实验,与其他3维人脸表情识别算法相比,本文算法取得了最高的平均识别率,达到89.67%,同时对易混淆的“悲伤”、“愤怒”和“厌恶”等表情的误判率也较低。结论局部旋度模式特征对3维人脸的表情有较强的表征能力;ICNP算法与最小投影偏差算法的结合,能够实现区域的有效划分和权重的准确计算,有效提高特征对表情的识别能力。试验结果表明本文算法对3维人脸表情具有较高的识别率,并对易混淆的相似表情仍具有较好的识别效果。  
      关键词:3维人脸表情识别;局部特征;旋度特征;3维人脸划分;特征权重   
      14
      |
      7
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685300 false
      更新时间:2024-05-07
    • 结合迁移学习的轻量级指纹分类模型

      甘俊英, 戚玲, 秦传波, 何国辉
      2019, 24(7): 1086-1095. DOI: 10.11834/jig.180499
      结合迁移学习的轻量级指纹分类模型
      摘要:目的目前的指纹分类模型存在操作繁琐、参数较多、所需数据规模大、无法充分利用指纹特征信息等问题,而进行快速准确的指纹分类在大型指纹识别系统中至关重要。方法传统的机器学习方法大多假设已标注数据与未标注数据的分布是相同的,而迁移学习允许源空间、任务空间在测试集和训练集中的分布是不同的,并且迁移学习仅专注目标任务的训练,使得网络模型根据需求更具个性化。因此,本文提出一种基于迁移学习的轻量级指纹分类模型。该模型结合迁移学习,首先采用梯度估计的方法求取指纹图像的方向场图并且做增强处理;然后将扩展的指纹方向场图数据集用于本文提出的轻量级Finger-SqueezeNet的预训练,使其达到一定的分类效果,从而初步实现网络模型参数的调整;最后保留预训练模型部分的网络参数不变,使用指纹图像数据集NIST-DB4对Finger-SqueezeNet网络进行参数微调(fine tuning)。结果在使用相同的指纹数据集在本文提出的纯网络模型进行分类训练后发现,未采用迁移学习方法对网络模型进行预训练得到的平均分类结果为93%,而通过预训练后的网络模型可以达到98.45%,最终采用单枚指纹测试的方法得到的测试结果达到95.73%。对比同种类型的方法以及验证标准后可知,本文的指纹分类模型在大幅度减少网络参数的同时仍能达到较高的准确率。结论采用指纹类内迁移学习方法和轻量级神经网络相结合进行分类,适当利用了指纹特征信息,而且有望使指纹分类模型拓展到移动端。  
      关键词:指纹分类;迁移学习;Finger-SqueezeNet;轻量型神经网络;方向场   
      16
      |
      9
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685312 false
      更新时间:2024-05-07
    • 融合深度特征和多核增强学习的显著目标检测

      张晴, 李云, 李文举, 林家骏, 肖莽, 陈飞云
      2019, 24(7): 1096-1105. DOI: 10.11834/jig.180224
      融合深度特征和多核增强学习的显著目标检测
      摘要:目的针对现有基于手工特征的显著目标检测算法对于显著性物体尺寸较大、背景杂乱以及多显著目标的复杂图像尚不能有效抑制无关背景区域且完整均匀高亮显著目标的问题,提出了一种利用深度语义信息和多核增强学习的显著目标检测算法。方法首先对输入图像进行多尺度超像素分割计算,利用基于流形排序的算法构建弱显著性图。其次,利用已训练的经典卷积神经网络对多尺度序列图像提取蕴含语义信息的深度特征,结合弱显著性图从多尺度序列图像内获得可靠的训练样本集合,采用多核增强学习方法得到强显著性检测模型。然后,将该强显著性检测模型应用于多尺度序列图像的所有测试样本中,线性加权融合多尺度的检测结果得到区域级的强显著性图。最后,根据像素间的位置和颜色信息对强显著性图进行像素级的更新,以进一步提高显著图的准确性。结果在常用的MSRA5K、ECSSD和SOD数据集上与9种主流且相关的算法就准确率、查全率、F-measure值、准确率—召回率(PR)曲线、加权F-measure值和覆盖率(OR)值等指标和直观的视觉检测效果进行了比较。相较于性能第2的非端到端深度神经网络模型,本文算法在3个数据集上的平均F-measure值、加权F-measure值、OR值和平均误差(MAE)值,分别提高了1.6%,22.1%,5.6%和22.9%。结论相较于基于手工特征的显著性检测算法,本文算法利用图像蕴含的语义信息并结合多个单核支持向量机(SVM)分类器组成强分类器,在复杂图像上取得了较好的检测效果。  
      关键词:显著目标检测;显著性检测;深度特征;多核增强学习;多尺度检测   
      41
      |
      9
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685376 false
      更新时间:2024-05-07
    • 结合连续卷积算子的自适应加权目标跟踪算法

      罗会兰, 石武
      2019, 24(7): 1106-1115. DOI: 10.11834/jig.180586
      结合连续卷积算子的自适应加权目标跟踪算法
      摘要:目的在视觉跟踪领域中,特征的高效表达是鲁棒跟踪的关键,观察到在相关滤波跟踪中,不同卷积层表达了目标的不同方面特征,提出了一种结合连续卷积算子的自适应加权目标跟踪算法。方法针对目标定位不准确的问题,提出连续卷积算子方法,将离散的位置估计转换成连续位置估计,使得位置定位更加准确;利用不同卷积层的特征表达,提高跟踪效果。首先利用深度卷积网络结构提取多层卷积特征,通过计算相关卷积响应大小,决定在下一帧特征融合时各层特征所占的权重,凸显优势特征,然后使用从不同层训练得到的相关滤波器与提取得到的特征进行相关运算,得到最终的响应图,响应图中最大值所在的位置便是目标所在的位置和尺度。结果与目前较流行的3种目标跟踪算法在目标跟踪基准数据库(OTB-2013)中的50组视频序列进行测试,本文算法平均跟踪成功率达到85.4%。结论本文算法在光照变化、尺度变化、背景杂波、目标旋转、遮挡和复杂环境下的跟踪具有较高的鲁棒性。  
      关键词:目标跟踪;相关滤波跟踪;连续卷积算子;自适应加权;卷积特征;响应图   
      12
      |
      7
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685460 false
      更新时间:2024-05-07
    • 注意力迁移的联合平衡领域自适应

      汪荣贵, 姚旭晨, 杨娟, 薛丽霞
      2019, 24(7): 1116-1125. DOI: 10.11834/jig.180497
      注意力迁移的联合平衡领域自适应
      摘要:目的现有的图像识别方法应用于从同一分布中提取的训练数据和测试数据时具有良好性能,但这些方法在实际场景中并不适用,从而导致识别精度降低。使用领域自适应方法是解决此类问题的有效途径,领域自适应方法旨在解决来自两个领域相关但分布不同的数据问题。方法通过对数据分布的分析,提出一种基于注意力迁移的联合平衡自适应方法,将源域有标签数据中提取的图像特征迁移至无标签的目标域。首先,使用注意力迁移机制将有标签源域数据的空间类别信息迁移至无标签的目标域。通过定义卷积神经网络的注意力,使用关注信息来提高图像识别精度。其次,基于目标数据集引入网络参数的先验分布,并且赋予网络自动调整每个领域对齐层特征对齐的能力。最后,通过跨域偏差来描述特定领域的特征对齐层的输入分布,定量地表示每层学习到的领域适应性程度。结果该方法在数据集Office-31上平均识别准确率为77.6%,在数据集Office-Caltech上平均识别准确率为90.7%,不仅大幅领先于传统手工特征方法,而且取得了与目前最优的方法相当的识别性能。结论注意力迁移的联合平衡领域自适应方法不仅可以获得较高的识别精度,而且能够自动学习领域间特征的对齐程度,同时也验证了进行域间特征迁移可以提高网络优化效果这一结论。  
      关键词:迁移学习;领域自适应;注意力机制;无监督学习;图像识别;卷积神经网络   
      27
      |
      8
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685499 false
      更新时间:2024-05-07
    • 联合标签预测与判别投影学习的半监督典型相关分析

      周凯伟, 万建武, 王洪元, 马宏亮
      2019, 24(7): 1126-1135. DOI: 10.11834/jig.180553
      联合标签预测与判别投影学习的半监督典型相关分析
      摘要:目的典型相关分析是一种经典的多视图学习方法。为了提高投影方向的判别性能,现有典型相关分析方法通常采用引入样本标签信息的策略。然而,获取样本的标签信息需要付出大量的人力与物力,为此,提出了一种联合标签预测与判别投影学习的半监督典型相关分析算法。方法将标签预测与模型构建相融合,具体地说,将标签预测融入典型相关分析框架中,利用联合学习框架学得的标签矩阵更新投影方向,进而学得的投影方向又重新更新标签矩阵。标签预测与投影方向的学习过程相互依赖、交替更新,预测标签不断地接近其真实标签,有利于学得最优的投影方向。结果本文方法在AR、Extended Yale B、Multi-PIE和ORL这4个人脸数据集上分别进行实验。特征维度为20时,在AR、Extended Yale B、Multi-PIE和ORL人脸数据集上分别取得87%、55%、83%和85%识别率。取训练样本中每人2(3,4,5)幅人脸图像为监督样本,提出的方法识别率在4个人脸数据集上均高于其他方法。训练样本中每人5幅人脸图像为监督样本,在AR、Extended Yale B、Multi-PIE和ORL人脸数据集上分别取得94.67%、68%、83%和85%识别率。实验结果表明在训练样本标签信息较少情况下以及特征降维后的维数较低的情况下,联合学习模型使得降维后的数据最大限度地保存更加有效的信息,得到较好的识别结果。结论本文提出的联合学习方法提高了学习的投影方向的判别性能,能够有效地处理少量的有标签样本和大量的无标签样本的情况以及解决两步学习策略的缺陷。  
      关键词:典型相关分析;标签预测;判别投影;联合学习;半监督   
      16
      |
      7
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685498 false
      更新时间:2024-05-07
    • 多模态深度神经网络的固废对象分割

      张剑华, 陈嘉伟, 张少波, 郭建双, 刘盛
      2019, 24(7): 1136-1147. DOI: 10.11834/jig.180560
      多模态深度神经网络的固废对象分割
      摘要:目的对城市发展过程中产生的建筑固废进行处理,并将之转换为资源和能源,是极佳的保护环境的经济发展模式。然而人工分拣处理存在效率低、污染严重、对人身危害大等问题。目前工业界在探索一种有效的基于机械臂自动抓取的建筑固废自动分拣系统,其中图像分割技术是非常必要的一个环节。但是工业现场的环境因素造成固废对象的颜色严重退化,会影响最终的固废对象分割。本文针对建筑固废图像分割难度大的现状,提出一种基于多模态深度神经网络的方法来解决固废对象分割问题。方法首先,在颜色退化严重的场景下,把RGB图像和深度图一起作为深度卷积神经网络的输入,利用深度卷积神经网络进行高维特征学习,通过softmax分类器获得每个像素的标签分配概率。其次,基于新的能量函数建立全连接条件随机场,通过最小化能量函数寻找全局最优解来分割图像,从而为每一类固废对象产生一个独立的分割块。最后,利用局部轮廓信息计算深度梯度,实现同一类别的不同实例的固废对象精确分割。结果在固废图像测试集上,该方法取得了90.02%均像素精度和89.03%均交并比(MIOU)。此外,与目前一些优秀的语义分割算法相比,也表现出了优越性。结论本文方法能够对每一个固废对象同时进行有效的分割和分类,为建筑垃圾自动分拣系统提供准确的固废对象轮廓和类别信息,从而方便实现机械臂的自动抓取。  
      关键词:多模态信息;固废对象分割;卷积神经网络;条件随机;深度梯度   
      17
      |
      7
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685541 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 利用点弦距离递归的图像角点检测算法

      李云红, 何亚瑞, 章为川, 周小计
      2019, 24(7): 1148-1159. DOI: 10.11834/jig.180564
      利用点弦距离递归的图像角点检测算法
      摘要:目的传统的基于边缘轮廓的角点检测算法需要计算每一个边缘像素点的曲率,对噪声和局部变化敏感,极易造成检测结果的不稳定。针对这一问题,提出一种利用点弦距离递归的角点检测算法。方法首先,利用Canny边缘检测器提取边缘轮廓线。其次,用3个不同尺度的高斯核对边缘线进行平滑,对每一个高斯尺度平滑后的边缘线,连接首尾端点形成一条弦,计算边缘轮廓上每个边缘像素点到弦的距离,将点弦距离最长的像素点标为候选角点,该像素点将原边缘轮廓线分成两条边缘,然后将该像素点与首尾端点连接成两条弦,重新计算点弦距离,将所有距离大于设定阈值的点作为候选角点。最后,利用多尺度技术对候选角点进行判决并得到最终角点。结果与现有的基于曲率计算的角点检测算法相比,本文算法不需要计算一、二阶导数,有效避免了局部变化带来的计算误差。通过计算得到4个角点检测器的平均排名依次为Harris(4.0)、He&Yung(2.67)、CPDA(1.83)、本文算法(1.5)。与其他3种经典的角点检测算法相比,本文提出的检测算法排名第一,因此表现出了更好的检测性能。结论提出了一种新的利用点弦距离递归的角点检测算法。从实验结果看,本文提出的角点检测器在图像仿射变换、JPEG质量压缩和高斯噪声条件下有更好的平均重复性和定位误差。  
      关键词:角点检测;多尺度;点到弦距离;曲率;仿射变换;平均重复性;定位误差   
      12
      |
      9
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685600 false
      更新时间:2024-05-07
    • 李青松, 张旭东, 张骏, 高欣健, 高隽
      2019, 24(7): 1160-1175. DOI: 10.11834/jig.180620
      RGB-D结构相似性度量下的多边自适应深度图像超分辨率重建
      摘要:目的深度相机能够对场景的深度信息进行实时动态捕捉,但捕获的深度图像分辨率低且容易形成空洞。利用高分辨率彩色图像作为引导,是深度图超分辨率重建的重要方式。现有方法对彩色边缘与深度不连续区域的不一致性问题难以有效解决,在深度图超分辨率重建中引入了纹理复制伪影。针对这一问题,本文提出了一种鲁棒的彩色图像引导的深度图超分辨率重建算法。方法首先,利用彩色图像边缘与深度图像边缘的结构相关性,提出RGB-D结构相似性度量,检测彩色图像与深度图像共有的边缘不连续区域,并利用RGB-D结构相似性度量自适应选取估计像素点邻域的最优图像块。接着,通过提出的定向非局部均值权重,在图像块区域内建立多边引导下的深度估计,解决彩色边缘和深度不连续区域的结构不一致性。最后,利用RGB-D结构相似性度量与图像平滑性之间的对应关系,对多边引导权重的参数进行自适应调节,实现鲁棒的深度图超分辨率重建。结果在Middlebury合成数据集、ToF和Kinect数据集以及本文自建数据集上的实验结果表明,相比其他先进方法,本文方法能够有效抑制纹理复制伪影。在Middlebury、ToF和Kinect数据集上,本文方法相较于次优算法,平均绝对偏差平均降低约63.51%、39.47 %和7.04 %。结论对于合成数据集以及真实场景的深度数据集,本文方法均能有效处理存在于彩色边缘和深度不连续区域的不一致性问题,更好地保留深度边缘的不连续性。  
      关键词:深度图像;超分辨率;RGB-D结构相似性度量;多边引导;自适应模型   
      16
      |
      32
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685607 false
      更新时间:2024-05-07
    • 面向像对直线特征匹配的线特征矫正与提纯方法

      贾迪, 李玉秀, 赵明远, 朱宁丹
      2019, 24(7): 1176-1187. DOI: 10.11834/jig.180665
      面向像对直线特征匹配的线特征矫正与提纯方法
      摘要:目的像对直线特征匹配是计算机视觉的重要研究内容,现有这类匹配方法均存在不同程度的误匹配问题。导致此问题的主要因素包括直线检测结果没有位于图像的真正边缘处、缺乏匹配线对的一致性校验。为此本文提出一种面向像对直线特征匹配的线特征矫正与提纯方法。方法首先提取像对的边缘特征获得二值化边缘图,通过边缘梯度图及梯度矢量图(GVF)建立梯度引力图。其次,采用直线检测方法提取像对的直线特征,并通过梯度引力图矫正直线位置。最后,采用点特征匹配结果计算像对极线,并结合直线匹配结果确定最后的局部校验特征区域,通过随机抽样一致小邻域范围内特征相似性校验直线匹配结果,从而剔除误匹配直线。结果对一组宽基线像对进行匹配实验,与直接采用直线匹配算法获得的匹配结果相比,矫正后的匹配结果剔除了大部分误匹配线对,将匹配准确率从50%提高到84%,继续提纯该匹配结果获得了100%的匹配准确率。在另一组宽基线像对的匹配实验中,经本文方法处理后的匹配准确率提高近30%。与前两组实验相比,第3组实验的像对摄影姿态变化不大,仅在尺度上有所区别,经本文方法处理后配准率从92%提高到100%。结论采用本文方法可以大幅提高像对直线特征匹配的准确率,同时该方法可以很容易对其他直线匹配结果进行校正与提纯,具备较高的实用性。  
      关键词:直线特征;梯度矢量图;梯度引力图;对极线;随机抽样一致   
      14
      |
      9
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685609 false
      更新时间:2024-05-07
    • 结合颜色属性的分层结构直方图

      岳晨晨, 侯志强, 余旺盛, 马素刚
      2019, 24(7): 1188-1196. DOI: 10.11834/jig.180617
      结合颜色属性的分层结构直方图
      摘要:目的为克服单一颜色特征易受光照变化影响,以及图像的空间结构特征对目标形变较为敏感等问题,提出一种结合颜色属性的分层结构直方图。方法首先,鉴于使用像素灰度值对图像进行分层易受光照变化影响,本文基于颜色属性对图像进行分层,即将输入的彩色图像从RGB空间映射到颜色属性空间,得到11种概率分层图;之后,将图像中的每一个像素仅投影到其概率值最大的分层中,使得各分层之间像素的交集为空,并集为整幅图像;对处理后的每一个分层,通过定义的结构图元来统计像素分布情况,得到每一分层的空间分布信息;最后,将每一分层的像素空间分布信息串联作为输入图像的分层结构直方图,以此来表征图像。结果为证明本文特征的有效性,将该特征用于图像匹配和视觉跟踪,与参考特征相比,利用本文特征进行图像匹配时,峰值旁瓣比均值提升1.347 9;将本文特征用于视觉跟踪时,采用粒子滤波作为跟踪框架,成功率相对上升4%,精度相对上升4.6%。结论该特征将图像的颜色特征与空间结构信息相结合,有效解决了单一特征分辨性较差的问题,与参考特征相比,该特征具有更强的分辨性和鲁棒性,因此本文特征可以更好地应用于图像处理应用中。  
      关键词:图像匹配;视觉跟踪;颜色属性;空间结构信息;分层结构直方图   
      19
      |
      8
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685615 false
      更新时间:2024-05-07

      遥感图像处理

    • 区域筛选与多级特征判别相结合的PolSAR图像飞机目标检测

      韩萍, 宋厅华
      2019, 24(7): 1197-1206. DOI: 10.11834/jig.180503
      区域筛选与多级特征判别相结合的PolSAR图像飞机目标检测
      摘要:目的针对全极化、复杂场景下飞机目标检测问题,提出了区域筛选与多级特征判别相结合的PolSAR飞机目标检测方法。方法首先对原始PolSAR图像进行滤波及去取向预处理,消除相干斑和随机取向对检测效果的影响;其次对图像进行基于功率值的区域分割,提取感兴趣区域;然后对感兴趣区域进行区域筛选,提取疑似飞机目标;最后以功率交叉熵、背景匀质性、功率差异度为特征对疑似飞机目标进行筛选,得到最终的检测结果。结果利用美国NASA实验室的AIRSAR和UVASAR系统采集的Half-Moon-Bay、Kahului及Kona地区的实测数据进行实验,并与其他方法进行了对比。在实验1中,本文方法和对比方法均能准确检测出场景中存在的2架飞机目标,本文方法产生了7个虚警,对比方法产生了22个虚警;在实验2中,本文方法和对比方法都检测出了4架飞机目标,本文方法产生了4个虚警,对比方法产生了17个虚警;在实验3中,本文方法检测出了15架飞机中的13架,产生了6个虚警,对比方法检测出了6个待测目标,产生了17个虚警。结论本文方法在提取出疑似飞机目标的前提下,利用多种特征对疑似飞机目标进行筛选,不需要提取出机场跑道和停机坪区域,避免了由于跑道和停机坪区域提取不完整导致的检测不准确的问题,相比于对比方法,本文方法在降低虚警和漏警的同时,提高了运算效率。  
      关键词:PolSAR图像;飞机目标检测;区域筛选;极化交叉熵;匀质性;功率差异度   
      19
      |
      7
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55685665 false
      更新时间:2024-05-07
    0