最新刊期

    2017 22 12

      综述

    • 图像处理中的格子玻尔兹曼方法研究综述

      刘应乾, 严壮志
      2017, 22(12): 1623-1639. DOI: 10.11834/jig.170193
      摘要:格子玻尔兹曼(LB)方法作为一种兼具建模与快速求解偏微分方程(PDE)功能的方法已被成功应用于图像去噪、修复和分割。考虑到国内外尚未有LB方法在图像处理中研究进展的综述论文,为使即将进入该研究领域的学者比较全面地了解该方法的研究现状,本文对其进行系统综述。 着重分析了与图像去噪、修复、分割和3维图像处理密切相关的文献,将LB图像处理模型的构建分为自上而下和自下而上两种途径,对图像处理中的LB模型从宏观和微观两个角度进行分类。对模型的计算机实现算法、算法时间复杂度以及模型的具体应用进行分析与总结。最后,讨论了LB方法与PDE方法的本质区别,并指出几个尚未解决的问题。 第一,LB方法在图像处理中具有清晰的物理意义,像素值可视被为粒子密度值,像素值的改变可被视为受松弛时间和源项影响的粒子的重新分布;第二,各向异性扩散模型、非线性扩撒模型、线性扩散模型之间的微观区别在于松弛时间的差异,以上模型的时间复杂度依次降低,含源项扩散模型的时间复杂度除松弛时间以外还受外力项的影响;第三,自上而下的建模方法仅仅将LB视为PDE的一种解法,自下而上的建模方法从LB方法的物理意义出发,直接设计演化方程的关键参数,相对于第一种方法更为灵活;第四,LB算法固有并行,编程简单,当该方法被应用于并行平台时,图像数据量越大,GPU/CPU加速比越明显;第五,各向异性、非线性扩散模型可用于图像去噪、修复,含源项扩散模型中外力项的设计对图像分割质量有较大影响。 尽管LB方法作为一种固有的并行算法在3维图像去噪、配准和分割等快速图像处理领域具有极高的应用价值,但仍然存在边界条件处理、并行平台选择及优化等几个值得继续研究的问题。  
      关键词:图像处理;格子玻尔兹曼方法;图像扩散格子玻尔兹曼模型;并行算法;时间复杂度   
      4454
      |
      594
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110408 false
      更新时间:2024-05-08
    • 机器视觉表面缺陷检测综述

      汤勃, 孔建益, 伍世虔
      2017, 22(12): 1640-1663. DOI: 10.11834/jig.160623
      摘要:工业产品的表面缺陷对产品的美观度、舒适度和使用性能等带来不良影响,所以生产企业对产品的表面缺陷进行检测以便及时发现并加以控制。机器视觉的检测方法可以很大程度上克服人工检测方法的抽检率低、准确性不高、实时性差、效率低、劳动强度大等弊端,在现代工业中得到越来越广泛的研究和应用。 以机器视觉表面缺陷检测为研究对象,在广泛调研相关文献和发展成果的基础上,对基于机器视觉在表面缺陷检测领域的应用进行了综述。分析了典型机器视觉表面缺陷检测系统的工作原理和基本结构,阐述了表面缺陷视觉检测的研究现状、现有视觉软件和硬件平台,综述了机器视觉检测所涉及到的图像预处理算法、图像分割算法、图像特征提取及其选择算法、图像识别等相关理论和算法研究,并对每种主要方法的基本思想、特点和存在的局限性进行了总结,对未来可能的发展方向进行展望。 机器视觉表面缺陷检测系统中,图像处理和分析算法是重要内容,算法各有优缺点和其适应范围。如何提高算法的准确性、实时性和鲁棒性,一直是研究者们努力的方向。 机器视觉是对人类视觉的模拟,机器视觉表面检测涉及众多学科和理论,如何使检测进一步向自动化和智能化方向发展,还需要更深入的研究。  
      关键词:机器视觉;表面缺陷;检测算法;图像处理;图像识别   
      25047
      |
      1531
      |
      70
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110823 false
      更新时间:2024-05-08

      图像处理和编码

    • 图像分区选择的像素值排序可逆数据隐藏

      李蓉, 李向阳
      2017, 22(12): 1664-1676. DOI: 10.11834/jig.170101
      摘要:基于像素值排序(PVO)的数据隐藏算法因其高保真的优越性受到广泛重视,并不断得到改进。本文提出一种图像分区选择思想,以进一步充分利用图像的嵌入空间,改善PVO算法的嵌入性能,提高载秘图像的信噪比。 原始PVO算法通常采用预测差值“1”进行数据隐藏,对平滑像素组有较好的利用率和隐蔽性,而对毛躁像素组隐秘性能明显下降,算法性能与图像像素分布情况密切相关。本文在PVO算法基础上提出图像分区选择的思想,首先,将原始图像分为若干区域,然后按移位率从小到大的顺序依次选择图像区域;其次,在每个区域中选择合适的嵌入预测误差;最后,按顺序在被选区域利用该区域的最优嵌入差值完成信息嵌入。 假设将图像划分为8×8个区域,对本文算法与原始PVO算法进行比较,当嵌入量为1×10 bit时,Elaine图像的移位率由81.59%降为74.40%,载秘图像的峰值信噪比(PSNR)值由55.388 2提高为56.996 9,提高了1.608 7,采用其他图像并就不同嵌入量进行实验,各图像PSNR值均表现出不同程度的提高。其次,将图像分别划分为2×2、4×4、8×8、16×16个分区,当嵌入量为1×10 bit时,Lena图像PSNR由原始PVO的59.204 6逐渐增加至60.846 9,其他图像在不同嵌入量时PSNR均随着分区数的增加而有不同程度的提高。 本文提出的基于图像分区选择的改进PVO算法,可根据像素分布情况增加对嵌入空间的利用,在相同嵌入量情况下,改进后的算法能够获得更高的PSNR值;在一定分区数量条件范围内,分区数量与图像PSNR值表现出正相关性,随着分区数量的增加,图像PSNR值随之增加;本文方法在一定程度上改善了嵌入容量,弥补了因分区数量增加带来的辅助信息增加的问题。  
      关键词:像素值排序;分区选择;嵌入预测误差;可逆数据隐藏;移位率;信噪比   
      3914
      |
      410
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110762 false
      更新时间:2024-05-08
    • 自适应残差图像的分数阶全变分去噪算法

      祝严刚, 张桂梅
      2017, 22(12): 1677-1689. DOI: 10.11834/jig.170198
      摘要:全变分(TV)去噪模型具有较好的去噪效果,但对于图像的弱边缘和纹理细节的保持不够理想。自适应分数阶全变分(AFTV)模型根据图像局部信息,区分图像的纹理区域和非纹理区域,自适应计算投影算法中的软阈值,可较好地保持图像的弱边缘和纹理细节,但该方法当噪声增大时“阶梯”效应比较明显,弱边缘和纹理细节保持效果不够理想。针对该问题,提出一种改进的分数阶全变分去噪算法。 该算法在计算残差图像时,用分数阶全变分模型替代整数一阶全变分模型,并根据较精确的残差图像的局部方差区分图像纹理区域和平坦区域,使保真项参数的自适应选取更加合理,提高了算法的去噪性能。 针对3种不同类型的噪声图像,将本文模型与TV模型和AFTV模型进行对比实验,并采用峰值信噪比(PSNR)和结构相似性(SSIM)评定去噪效果和纹理保持能力。对于高斯噪声图像,本文算法在PSNR方面比TV模型和AFTV模型分别可平均提高2.72 dB和1.38 dB,SSIM分别可平均提高0.047和0.020。对于椒盐噪声图像,本文算法结合中值滤波算法在PSNR和SSIM方面比传统中值滤波算法分别可平均提高1.308 dB和0.011。对于泊松噪声图像,本文算法在PSNR、SSIM方面与AFTV较接近,比TV分别可提高1.59 dB和0.005。 通过对添加不同类型的噪声图像进行实验,结果表明提出的算法在去噪性能上与TV和AFTV相比均有较大提高,尤其对于噪声较大的图像效果更为显著,在去噪效率上与AFTV的时间复杂度相当,时耗接近略有降低。且本文算法普适性较好,能有效去除多种典型类型的噪声。  
      关键词:图像去噪;分数阶微分;全变分;残差图像;弱边缘;弱纹理   
      3299
      |
      479
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112490 false
      更新时间:2024-05-08

      图像理解和计算机视觉

    • 多通道卷积的图像超分辨率方法

      李云飞, 符冉迪, 金炜, 纪念
      2017, 22(12): 1690-1700. DOI: 10.11834/jig.170325
      摘要:超分辨率技术在实际生活中具有较为广泛的应用。经典的基于卷积神经网络的超分辨率(SRCNN)方法存在重建图像纹理结构模糊以及网络模型训练收敛过慢等问题。针对这两个问题,在SRCNN的基础上,提出一种多通道卷积的图像超分辨率(MCSR)算法。 通过增加残差链接,选择MSRA初始化方法对网络权值进行初始化,加快模型收敛;引入多通道映射提取更加丰富的特征,使用多层3×3等小卷积核代替单层9×9等大卷积核,更加有效地利用特征,增强模型的超分辨率重构效果。 MCSR迭代4×10次即可收敛,在Set5与Set14数据集上边长放大3倍后的平均峰值信噪比分别是32.84 dB和29.28 dB,与SRCNN相比提升显著。 MCSR收敛速度更快,并且可以生成轮廓清晰的高分辨率图像,超分辨率效果更加优秀。  
      关键词:图像超分辨率;深度学习;卷积神经网络;多通道卷积;残差学习   
      4217
      |
      433
      |
      6
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112546 false
      更新时间:2024-05-08
    • 图像亮度线索下的单目深度信息提取

      冯帆, 马杰, 岳子涵, 沈亮
      2017, 22(12): 1701-1708. DOI: 10.11834/jig.170001
      摘要:深度信息的获取是3维重建、虚拟现实等应用的关键技术,基于单目视觉的深度信息获取是非接触式3维测量技术中成本最低、也是技术难度最大的手段。传统的单目方法多基于线性透视、纹理梯度、运动视差、聚焦散焦等深度线索来对深度信息进行求取,计算量大,对相机精度要求高,应用场景受限,本文基于固定光强的点光源在场景中的移动所带来的物体表面亮度的变化,提出一种简单快捷的单目深度提取方法。 首先根据体表面反射模型,得到光源照射下的物体表面的辐亮度,然后结合光度立体学推导物体表面辐亮度与摄像机图像亮度之间的关系,在得到此关系式后,设计实验,依据点光源移动所带来的图像亮度的变化对深度信息进行求解。 该算法在简单场景和一些日常场景下均取得了较好的恢复效果,深度估计值与实际深度值之间的误差小于10%。 本文方法通过光源移动带来的图像亮度变化估计深度信息,避免了复杂的相机标定过程,计算复杂度小,是一种全新的场景深度信息获取方法。  
      关键词:单目视觉;光度立体学;表面辐亮度;图像亮度变化;深度恢复   
      3204
      |
      927
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111816 false
      更新时间:2024-05-08
    • 自适应成本量的抗遮挡光场深度估计算法

      熊伟, 张骏, 高欣健, 张旭东, 高隽
      2017, 22(12): 1709-1722. DOI: 10.11834/jig.170324
      摘要:光场相机通过一次成像同时记录场景的空间信息和角度信息,获取多视角图像和重聚焦图像,在深度估计中具有独特优势。遮挡是光场深度估计中的难点问题之一,现有方法没有考虑遮挡或仅仅考虑单一遮挡情况,对于多遮挡场景点,方法失效。针对遮挡问题,在多视角立体匹配框架下,提出了一种对遮挡鲁棒的光场深度估计算法。 首先利用数字重聚焦算法获取重聚焦图像,定义场景的遮挡类型,并构造相关性成本量。然后根据最小成本原则自适应选择最佳成本量,并求解局部深度图。最后利用马尔可夫随机场结合成本量和平滑约束,通过图割算法和加权中值滤波获取全局优化深度图,提升深度估计精度。 实验在HCI合成数据集和Stanford Lytro Illum实际场景数据集上展开,分别进行局部深度估计与全局深度估计实验。实验结果表明,相比其他先进方法,本文方法对遮挡场景效果更好,均方误差平均降低约26.8%。 本文方法能够有效处理不同遮挡情况,更好地保持深度图边缘信息,深度估计结果更准确,且时效性更好。此外,本文方法适用场景是朗伯平面场景,对于含有高光的非朗伯平面场景存在一定缺陷。  
      关键词:深度估计;光场;遮挡;重聚焦;成本量   
      3381
      |
      641
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110514 false
      更新时间:2024-05-08

      图像分析和识别

    • 自适应增强卷积神经网络图像识别

      刘万军, 梁雪剑, 曲海成
      2017, 22(12): 1723-1736. DOI: 10.11834/jig.170079
      摘要:为了进一步提高卷积神经网络的收敛性能和识别精度,增强泛化能力,提出一种自适应增强卷积神经网络图像识别算法。 构建自适应增强模型,分析卷积神经网络分类识别过程中误差产生的原因和误差反馈模式,针对分类误差进行有目的地训练,实现分类特征基于迭代次数和识别结果的自适应增强以及卷积神经网络权值的优化调整。自适应增强卷积神经网络与多种算法在收敛速度和识别精度等性能上进行对比,并在多种数据集上检测自适应卷积神经网络的泛化能力。 通过对比实验可知,自适应增强卷积神经网络算法可以在很大程度上优化收敛效果,提高收敛速度和识别精度,收敛时在手写数字数据集上的误识率可降低20.93%,在手写字母和高光谱图像数据集上的误识率可降低11.82%和15.12%;与不同卷积神经网络优化算法对比,误识率比动态自适应池化算法和双重优化算法最多可降低58.29%和43.50%;基于不同梯度算法的优化,误识率最多可降低33.11%;与不同的图像识别算法对比,识别率也有较大程度提高。 实验结果表明,自适应增强卷积神经网络算法可以实现分类特征的自适应增强,对收敛性能和识别精度有较大的提高,对多种数据集有较强的泛化能力。这种自适应增强模型可以进一步推广到其他与卷积神经网络相关的深度学习算法中。  
      关键词:深度学习;卷积神经网络;图像处理;分类识别;特征提取;特征自适应增强   
      3683
      |
      479
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112232 false
      更新时间:2024-05-08
    • 结合像素模式和特征点模式的实时表情识别

      梁华刚, 易生, 茹锋
      2017, 22(12): 1737-1749. DOI: 10.11834/jig.170251
      摘要:目前2D表情识别方法对于一些混淆性较高的表情识别率不高并且容易受到人脸姿态、光照变化的影响,利用RGBD摄像头Kinect获取人脸3D特征点数据,提出了一种结合像素2D特征和特征点3D特征的实时表情识别方法。 首先,利用3种经典的LBP(局部二值模式)、Gabor滤波器、HOG(方向梯度直方图)提取了人脸表情2D像素特征,由于2D像素特征对于人脸表情描述能力的局限性,进一步提取了人脸特征点之间的角度、距离、法向量3种3D表情特征,以对不同表情的变化情况进行更加细致地描述。为了提高算法对混淆性高的表情识别能力并增加鲁棒性,将2D像素特征和3D特征点特征分别训练了3组随机森林模型,通过对6组随机森林分类器的分类结果加权组合,得到最终的表情类别。 在3D表情数据集Face3D上验证算法对9种不同表情的识别效果,结果表明结合2D像素特征和3D特征点特征的方法有利于表情的识别,平均识别率达到了84.7%,高出近几年提出的最优方法4.5%,而且相比单独地2D、3D融合特征,平均识别率分别提高了3.0%和5.8%,同时对于混淆性较强的愤怒、悲伤、害怕等表情识别率均高于80%,实时性也达到了10~15帧/s。 该方法结合表情图像的2D像素特征和3D特征点特征,提高了算法对于人脸表情变化的描述能力,而且针对混淆性较强的表情分类,对多组随机森林分类器的分类结果加权平均,有效地降低了混淆性表情之间的干扰,提高了算法的鲁棒性。实验结果表明了该方法相比普通的2D特征、3D特征等对于表情的识别不仅具有一定的优越性,同时还能保证算法的实时性。  
      关键词:多特征提取;实时表情识别;随机森林;Kinect深度传感器;多表情分类   
      2337
      |
      323
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112037 false
      更新时间:2024-05-08
    • 融合视觉感知特性的场景分类算法

      史静, 朱虹, 王栋, 杜森
      2017, 22(12): 1750-1757. DOI: 10.11834/jig.170232
      摘要:目前对于场景分类问题,由于其内部结构的多样性和复杂性,以及光照和拍摄角度的影响,现有算法大多通过单纯提取特征进行建模,并没有考虑场景图像中事物之间的相互关联,因此,仍然不能达到一个理想的分类效果。本文针对场景分类中存在的重点和难点问题,充分考虑人眼的视觉感知特性,利用显著性检测,并结合传统的视觉词袋模型,提出了一种融合视觉感知特性的场景分类算法。 首先,对图像进行多尺度分解,并提取各尺度下的图像特征,接着,检测各尺度下图像的视觉显著区域,最后,将显著区域信息与多尺度特征进行有机融合,构成多尺度融合窗选加权SIFT特征(WSSIFT),对场景进行分类。 为了验证本文算法的有效性,该算法在3个标准数据集SE、LS以及IS上进行测试,并与不同方法进行比较,分类准确率提高了约3%~17%。 本文提出的融合视觉感知特性的场景分类算法,有效地改善了单纯特征描述的局限性,并提高了图像的整体表达。实验结果表明,该算法对于多个数据集都具有较好的分类效果,适用于场景分析、理解、分类等机器视觉领域。  
      关键词:视觉感知;场景分类;多尺度;特征融合;WSSIFT特征   
      2725
      |
      342
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112621 false
      更新时间:2024-05-08
    • 融入邻域作用的高斯混合分割模型及简化求解

      石雪, 李玉, 李晓丽, 赵泉华
      2017, 22(12): 1758-1768. DOI: 10.11834/jig.170255
      摘要:基于高斯混合模型(GMM)的图像分割方法易受噪声影响,为此采用马尔可夫随机场(MRF)将像素邻域关系引入GMM,提高算法抗噪性。针对融入邻域作用的高斯混合分割模型结构复杂、参数估计困难,难以获得全局最优分割解等问题,提出一种融入邻域作用的高斯混合分割模型及其简化求解方法。 首先,构建融入邻域作用的GMM。为了提高GMM的抗噪性,采用MRF建模混合模型权重系数的先验分布。然后,利用贝叶斯理论建立图像分割模型,即品质函数;由于品质函数中参数较多(包括权重系数,均值,协方差)、函数结构复杂,导致参数求解困难。因此,将品质函数中的均值和协方差定义为权重系数的函数,由此简化模型结构并方便其求解;虽然品质函数中仅包含参数权重系数,但结构比较复杂,难以求得参数的解析式。最后,采用非线性共轭梯度法(CGM)求解参数,该方法仅需利用品质函数值和参数梯度值,降低了参数求解的复杂性,并且收敛快,可以得到全局最优解。 为了有效而准确地验证提出的分割方法,分别采用本文算法和对比算法对合成图像和高分辨率遥感图像进行分割实验,并定性和定量地评价和分析了实验结果。实验结果表明本文方法的有效抗噪性,并得到很好的分割结果。从参数估计结果可以看出,本文算法有效简化了模型参数,并获得全局最优解。 提出一种融入邻域作用的高斯混合分割模型及其简化求解方法,实验结果表明,本文算法提高了算法的抗噪性,有效地简化了模型参数,并得到全局最优参数解。本文算法对具有噪声的高分辨率遥感影像广泛适用。  
      关键词:高分辨率遥感图像分割;高斯混合模型;马尔可夫随机场;共轭梯度法;全局最优解   
      1893
      |
      328
      |
      7
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111702 false
      更新时间:2024-05-08

      计算机图形学

    • 群体动力学的群组行为仿真

      杨善雯, 何武, 饶云波
      2017, 22(12): 1769-1778. DOI: 10.11834/jig.170183
      摘要:许多群体动画算法侧重从宏观或微观角度模拟人群运动,而结合两种方法模拟群组动态的算法较少,为解决这个问题,提出一种基于群体动力学的群组行为仿真算法。 首先,采用连续模型构建动态势能场,为个体计算运动初始速度;然后,基于群体动力学模拟组内跟随和组间避让行为;在组内跟随行为中采用“Car-following”模型为个体计算跟随加速度;在组间避让行为中提出群组的凸包表示方法,并引入局部势能场;最后,结合动态势能场和局部势能场实现群组行为仿真。 在每个仿真循环中动态更新全局势能场信息,对比不同群体规模及网格精度的人群仿真效率。实验结果表明本文算法能用于模拟规模较大的多样性群组运动。在网格分辨率为80×80像素的场景中对5 000个个体的运动进行仿真,平均帧速率为35.7 ms(约28帧/s),与传统的连续模型相比产生了更多的群组行为。采用快速行进法构建全局动态势能场,即使在粗糙网格中也能得到较为平滑的路径。 提出算法适用于多样性群组行为仿真,同时结合全局规划和局部控制,无需额外碰撞检测便能真实地模拟组内跟随和组间避让行为,仿真效果具有高效性和多样性。  
      关键词:群体动力学;群体动画;势能场;碰撞避免;群组行为;组内跟随;组间避让   
      3233
      |
      401
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111492 false
      更新时间:2024-05-08

      医学图像处理

    • 血液红细胞图像自适应标记分水岭分割算法

      王娅
      2017, 22(12): 1779-1787. DOI: 10.11834/jig.170330
      摘要:显微细胞的精确分割是计算机辅助诊断的前提和关键,为精确分割含有粘连重叠红细胞及病变红细胞的彩色显微图像,基于HSI模型,提出了一种自适应标记分水岭分割算法。 首先结合红细胞无核特点提取反光细胞的中心,从图像的S与I分量的梯度图中提取图像前景低频成分的局部极值点,两部分相结合作为初始标记,标记细胞前景;然后根据标记特点去除伪标记点,以确保所有粘连细胞的重叠区域不被标记;接着采用主成分分析从S与I分量梯度图中提取梯度信息重构梯度图,最后结合背景标记,应用标记分水岭变换实现分割。 选取美国社会血液学数据库中含病变和粘连的红细胞图像进行分割实验,采用平均欠分割率、平均过分割率、平均准确率3个指标对分割结果进行评价。本文算法的欠分割率为2.23%,过分割率为1.67%,均明显低于文献中两种现有分水岭算法;分割精度高达96.10%,准确度高;平均运行时间6.06 s,可保证一定的时效性。 提出了一种对病变粘连红细胞彩色图像的分割算法,利用饱和度与亮度信息,自适应地标记出前景细胞,提高了分割精度;采用主成分分析法,更好地保留了重叠细胞的原有边界。算法具有较好的鲁棒性,可广泛用于包括血液红细胞在内的含有类圆形的重叠、粘连细胞的显微染色图像的分割。  
      关键词:标记分水岭变换;HSI模型;低通滤波;主成分分析;细胞图像分割   
      3613
      |
      396
      |
      12
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111134 false
      更新时间:2024-05-08

      遥感图像处理

    • 韩洁, 郭擎, 李安
      2017, 22(12): 1788-1797. DOI: 10.11834/jig.170222
      摘要:目前针对复杂场景高分辨率遥感影像道路提取多采用监督分类方法,但需要人工选择样本,自动化程度低且具有不稳定性。基于像元级的方法,提取完整度低且易产生椒盐噪声;面向对象的方法易产生粘连问题。为了提高道路提取的完整度、准确度和自动化程度,提出一种基于非监督分类和几何—纹理—光谱特征的道路提取方法。 首先考虑光谱特征利用非监督分类进行初步分割,结合基于纹理特征分类的结果得到初始道路区域。然后根据道路特征建立一套完整的非道路区域滤除体系:边缘滤波断开道路和非道路的连接、纹理滤波滤除大面积非道路区域、形状滤波去除剩余小面积非道路区域。最后利用张量投票算法得到连贯、平滑的道路中心线。 选择复杂场景下的高分辨率IKONOS影像和QuickBird影像进行实验,与国内外基于像素和面向对象的两种有代表性的道路提取方法进行对比,采用完整率、正确率、检测质量3个评价指标进行定量评价。实验结果表明该方法相比于其他算法在完整率、正确率和检测质量上平均提高26.61%、5.57%和26.77%。定性分析结果表明,本文方法可以有效改善椒盐噪声和粘连现象。此外本文方法的自动化程度更高。 提出了一种基于非监督分类和几何—纹理—光谱特征的高分辨遥感影像道路提取方法,非监督相对于监督分类的方法有更高的自动化程度,复杂场景下的道路提取融合几何—纹理—光谱特征有效避免了基于像元级道路提取易产生的椒盐噪声现象和面向对象道路提取易产生的粘连现象。该方法适用于高分辨率遥感影像城市道路提取,能够得到较高的完整度、准确度以及自动化程度。非监督分类和多特征结合的道路提取方法有广阔的应用前景。  
      关键词:非监督分类;纹理特征分类;边缘滤波;形状滤波;道路提取   
      2480
      |
      405
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112412 false
      更新时间:2024-05-08
    • 多特征融合的高分辨率遥感影像建筑物分级提取

      林雨准, 张保明, 王丹菂, 陈小卫, 徐俊峰
      2017, 22(12): 1798-1808. DOI: 10.11834/jig.170346
      摘要:针对高分辨率遥感影像普遍存在的同谱异物和同物异谱问题,提出一种综合利用光谱、形状、空间上下文和纹理特征的建筑物分级提取方法。 该方法基于单幅高分辨率遥感影像,首先利用多尺度多方向梯度算子构造的建筑物指数和形状特征提取部分分割完整的矩形建筑物目标;然后由多方向线性结构元素和形态学膨胀运算确定投票矩阵,从而获取光照方向,并利用光照方向和阴影特征对已提取建筑物进行筛选,剔除非建筑物对象,完成建筑物初提取;最后借助初提取建筑物对象的纹理特征向量建立概率模型,取得像素级建筑物提取结果,将该结果与影像分割相结合实现建筑物提取。 选取两幅高分辨率遥感影像进行实验,在建筑物初提取实验中,将本文方法与邻域总变分法和Sobel算子进行对比,实验结果表明,本文方法适用性强,为后提取提供的建筑物样本可靠性更高。在建筑物提取实验中,采用查准率、查全率和F分数3个指标进行定量分析,与形态学建筑物指数结合形态学阴影指数算法、邻域总变分结合混合高斯模型和贝叶斯判决算法相比,各项精度指标均得到显著提升,其中查准率提高了2.90个百分点,查全率提高了12.49个百分点,F分数则提升了8.84。 本文提出的建筑物分级提取方法具备一定抗干扰能力,且提取准确性高,适用性强。  
      关键词:高分辨率遥感影像;建筑物提取;多特征融合;建筑物指数;高斯模型   
      2772
      |
      413
      |
      9
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112111 false
      更新时间:2024-05-08
    0