最新刊期

    2017 22 8

      综述

    • 相关滤波目标跟踪进展综述

      张微, 康宝生
      2017, 22(8): 1017-1033. DOI: 10.11834/jig.170092
      摘要:目标跟踪是计算机视觉中的关键问题,在人机交互、行为识别等领域有着非常广泛的应用。最近,相关滤波理论由于其高效性和鲁棒性,被用于目标跟踪领域,取得了一系列新的进展,成为目标跟踪领域的研究热点,得到越来越多的关注。为使更多国内外研究者对相关滤波目标跟踪理论及其发展进行探索,本文对该领域研究现状进行综述。 首先介绍相关滤波跟踪的一般框架,在此基础上,给出相关滤波理论,并重点对经典相关滤波跟踪算法——核相关滤波(KCF)跟踪算法进行详细描述,然后讨论目标跟踪中常见问题的处理——特征的有效表示和尺度变化的适应,并进一步从3个方面分析当前研究现状,指出未来可能的发展趋势。 采用目标跟踪基准数据库(OTB-2013)中的50组视频序列进行实验,分析比较45种不同跟踪算法的性能,包括14种代表性相关滤波跟踪算法。在总体性能评估中给出排名前15位的跟踪算法,其中相关滤波跟踪算法占11个,充分体现此类算法的优越性。 相关滤波理论在目标跟踪领域的研究取得了显著的进展,具有广阔的应用前景,但受复杂场景及目标外观剧烈变化等因素影响,目标跟踪仍是一个极具挑战的问题。研究高效、鲁棒的相关滤波目标跟踪算法具有非常重要的意义。  
      关键词:相关滤波跟踪;特征表示;尺度自适应;分块模型   
      5656
      |
      572
      |
      47
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112298 false
      更新时间:2024-05-08

      图像处理和编码

    • 强边缘导向的盲去模糊算法

      陈华华, 鲍宗袍
      2017, 22(8): 1034-1044. DOI: 10.11834/jig.170020
      摘要:在图像的获取过程中,成像设备与拍摄场景发生了相对位移,导致获取的实际图像存在信息丢失、模糊退化的现象,这极大地影响了图像的质量和人们的视觉体验,也影响了图像的后续处理。盲去卷积旨在从观测图像中估计模糊核并获得清晰图像,为此提出了一种基于强边缘的运动图像盲去模糊算法。 结合图像梯度稀疏性,采用自适应l范数约束待估计图像梯度的强边缘;针对模糊核稀疏性和连续性,以l-l范数分别约束模糊核的像素和梯度,同时把模糊核归一化先验作为正则项引入模型中,以强边缘指导模糊核估计。在去模糊阶段,结合全变分与超拉普拉斯正则化方法的优点,将两种方法复原的图像取平均,以减轻复原图像中的振铃效应,同时保留更多的图像细节。 为了检验本文算法的有效性,对Levin测试集和实际拍摄的模糊图像分别进行仿真,并同现有算法进行比较。Levin测试集上的实验结果表明,提出的盲反卷积成功率为100%且在对比算法中具有最高PSNR;实际彩色图像的盲反卷积实验表明,相比于其他算法,本文算法获得的模糊核具有更准确的支撑和较少的噪点,获得的清晰图像具有较优的视觉效果。 该方法从定量和定性比较上都体现了较好的去运动模糊能力,可适用于遥感、医学等领域。  
      关键词:盲去模糊;强边缘;模糊核;振铃效应;稀疏性   
      4569
      |
      377
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111687 false
      更新时间:2024-05-08

      图像分析和识别

    • 拱序列的曲线描述与匹配

      危辉, 李俐瑢
      2017, 22(8): 1045-1055. DOI: 10.11834/jig.170041
      摘要:曲线匹配是计算机视觉和图像处理中的一个重要问题;判定几何图形形状相似性,得到与人类认知一致的结果,是目前的曲线描述与分类算法不能很好解决的问题。针对曲线匹配和几何图形形状的相似性判定,提出一种有效快速的基于拱序列的曲线匹配与相似性判定算法。 提取曲线的角点,将曲线表示为一连串相互重叠的拱序列。对于拱序列中的每一个拱,使用拱描述子进行描述。利用拱描述子,使用动态规划方法,实现对拱序列的匹配和相似性判定。 为了验证本文算法,将基于拱序列的曲线描述与匹配方法应用于轮廓的拼接与几何图形的相似性比较。在轮廓拼接实验中,基于拱序列的曲线描述与匹配方法准确完成碎片轮廓的拼接和地图轮廓的拼接。在几何图形相似性的交叉度量实验中,基于拱序列的曲线描述与匹配方法可以准确反映出图形的相似程度,正确判断两幅图像是否属于同一类型。在判定不同相似程度的形状对的实验中,本文算法可以给出与人类判断相同的结果,相比较基于链码特征、多尺度不变量、形状上下文和GCT(geometry complex transform)变换算法,本文算法的距离值更好地反映出图像的相似程度。 理论和实验表明,该算法可有效地描述曲线、匹配曲线,及准确判断几何图形的相似性,给出与人类视觉判定一致的结果。该算法可用于基于轮廓的图像拼接和几何图形相似性的判定。  
      关键词:曲线描述;曲线匹配;形状相似性;拱序列;动态规划   
      3183
      |
      365
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112371 false
      更新时间:2024-05-08
    • 非局部加权邻域三角滤波TV-L

      张聪炫, 陈震, 汪明润, 黎明
      2017, 22(8): 1056-1067. DOI: 10.11834/jig.160594
      摘要:针对非刚性运动、运动遮挡与间断、大位移以及复杂边缘结构等困难场景图像序列光流计算的准确性与鲁棒性问题,提出一种基于加权邻域三角滤波的非局部TV-L光流计算方法。 首先设计非平方惩罚函数L模型与梯度守恒假设相结合的数据项,然后引入基于L模型与基于图像梯度自适应变化权重相结合的平滑项,并根据提出的鲁棒数据项与图像-光流联合控制平滑项建立TV-L光流计算能量函数模型。最后采用基于加权邻域三角的非局部约束项,通过引入图像金字塔分层变形计算策略,在每层图像光流计算时对光流计算结果进行基于加权邻域三角网格的中值滤波优化,提出基于加权邻域三角滤波的非局部TV-L光流计算模型。 分别采用MPI与Middlebury数据库测试图像序列对本文方法和LDOF、CLG-TV、SOF、Classic+NL等代表方法进行实验对比。本文方法光流计算结果的平均角误差(AAE)和平均端点误差(AEE)相对其他对比方法平均下降28.45%和28.42%,时间消耗相对传统方法增长5.16%。 相对于传统的光流计算方法,本文方法针对非刚体运动、运动遮挡与间断、大位移运动以及复杂边缘等困难场景具有较好的适用性,光流估计结果具有较高的精度和较好的鲁棒性。  
      关键词:光流;加权邻域三角;中值滤波;非局部约束;困难场景   
      2631
      |
      346
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113397 false
      更新时间:2024-05-08
    • 形状的不变量特征提取与识别

      徐浩然, 杨剑宇, 黄伟国, 尚丽
      2017, 22(8): 1068-1078. DOI: 10.11834/jig.170080
      摘要:形状作为图像检索、目标识别等任务中的一种重要线索,一直是计算机视觉领域研究的重点课题。形状识别在实际应用中经常受到视角变化、非线性形变等因素的干扰,导致识别精度较低。针对这一状况,提出一种多尺度的不变量形状描述。 方法首先在多个尺度下对形状轮廓进行计算,提取5种不变量特征,以构建对形状的有效描述,然后利用动态时间规整(DTW)算法对形状描述进行匹配,计算形状之间的相似度,以完成形状的匹配与识别。 基于不变量多尺度的形状描述对于旋转、缩放、局部遮挡、铰接形变、类内差异,以及噪声等干扰具有很强的鲁棒性。同时,方法被用于对MPEG-7、Kimia99、Kimia216以及铰接形状数据库中的形状进行识别,取得了较高的识别精度,分别为91.79%、95.27%、91.33%,以及89.75%。此外,在MPEG-7数据库中进行形状识别的平均耗时为65 ms,优于大多数同类方法。 提出了一种基于不变量多尺度的形状描述方法。该方法能提取形状在不同尺度下的多种不变量特征,对形状进行有效描述,提高了形状描述对几何变换和非线性形变等干扰的鲁棒性以及形状匹配识别精度,适用于大多数应用场景下的目标识别任务。尤其是在旋转、缩放、类内差异、局部遮挡和铰接变形等干扰存在的情况下也能保持较高的识别正确率。  
      关键词:特征提取;不变量;形状描述;形状匹配;目标识别;模式识别   
      3535
      |
      386
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111230 false
      更新时间:2024-05-08
    • 食材数据库统计与对比实验性能分析

      郭礼华, 罗材
      2017, 22(8): 1079-1088. DOI: 10.11834/jig.160603
      摘要:计算机智能分析用户的饮食是一项有意义的研究课题。传统的分析方法侧重于分析食物类型,可是中国是个美食之国,食物类型在各个区域间表现出极大的多样性,造成很难实现通用的食物自动分类方法。为此尝试针对食物的原材料,即食材进行自动分析收集并建立了一个真实环境下的食材图像数据库(FOOD-SCUT),此数据库包括目前中国市面上常见的70种食材类别,共8 015幅图片。 基于此数据库,本文尝试性地利用不同的传统特征和分类方法,对此食材图像数据库进行自动分类,以此来分析对比各种特征和分类方法的性能。对比性实验中所选用的特征包括:SIFT特征、颜色直方图特征、梯度直方图、SURF特征、LBP特征和Gabor特征等。除颜色直方图外其他特征都会利用词袋模型进行特征编码,而所选用分类方法包括:支持向量机(SVM)、朴素贝叶斯、随机森林、K-最近邻(KNN)算法。另外本文还尝试采用最近流行的深度神经网络方法对数据库进行特征学习和分类。 通过实验验证基于各种传统特征分类方法的实验性能,其中各种特征包括单特征和多特征组合两种方式,通过不断调整不同特征组合和分类识别算法及其参数,得到基于传统特征分类方法的最好分类性能。同时通过实验验证深度卷积神经网络模型的实验性能,深度卷积神经网络模型使用直接训练和预训练两种不同训练模式,并调整不同的网络层数和权重初始化方法后获得最好的分类识别性能。本食材数据库基于传统特征分类方法的最好分类准确率为88.98%,而基于深度神经网络分类方法上可以获得最佳的实验性能,即95.7%,这个准确率比基于传统特征分类方法高出6.72%。 数据库的统计结果表明此食材图像数据库类内数据具有极大的差异,可以作为分析食材的一个基础数据库。此数据库具有极高的应用价值,可以为后续各种基于食材分析应用提供相关分析数据,并且本文实验分析结果,对于后续用户开发相关的各种相关应用中,提供了模型和参数选择的建议,节省了用户选择模型和调参的实验过程。  
      关键词:食材分类;精细图像分类;图像识别;深度学习;卷积神经网络;图像分类   
      2731
      |
      301
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110946 false
      更新时间:2024-05-08
    • 自适应K-means聚类的散乱点云精简

      陈龙, 蔡勇, 张建生
      2017, 22(8): 1089-1097. DOI: 10.11834/jig.160582
      摘要:点云精简是曲面重建等点云处理的一个重要前提,针对以往散乱点云精简算法的精简结果存在失真较大、空洞及不适用于片状点云的问题,提出一种自适应K-means聚类的点云精简算法。 首先,根据邻域计算每个数据点的曲率、点法向与邻域点法向夹角的平均值、点到邻域重心的距离、点到邻域点的平均距离,据此运用多判别参数混合的特征提取方法识别并保留特征点,包括曲面尖锐点和边界点;然后,对点云数据建立自适应八叉树,为K-means聚类提供与点云密度分布相关的初始化聚类中心以及K值;最后,遍历整个聚类,如果聚类结果中含有特征点则剔除其中的特征点并更新聚类中心,计算更新后聚类中数据点的最大曲率差,将最大曲率差大于设定阈值的聚类进行细分,保留最终聚类中距聚类中心最近的数据点。 在聚类方面,将传统的K-means聚类和自适应K-means聚类算法应用于bunny点云,后者在聚类的迭代次数、评价函数值和时间上均优于前者;在精简方面,将提出的精简算法应用于封闭及片状两种不同类型的点云,在精简比例为1/5时fandisk及saddle模型的精简误差分别为0.29×10、-0.41×10和0.037、-0.094,对于片状的saddle点云模型,其边界收缩误差为0.030 805,均小于栅格法和曲率法。 本文提出的散乱点云精简算法可应用于封闭及片状点云,精简后的数据点分布均匀无空洞,对片状点云进行精简时能够保护模型的边界数据点。  
      关键词:点云精简;八叉树;K-means聚类;片状点云;边界点   
      6701
      |
      425
      |
      9
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111120 false
      更新时间:2024-05-08
    • 构建近邻上下文的拷贝图像检索

      杨醒龙, 姚金良, 王小华, 方小飞
      2017, 22(8): 1098-1105. DOI: 10.11834/jig.160562
      摘要:以词袋模型为基础的拷贝图像检索方法是当前最有效的方法。然而,由于局部特征量化存在信息损失,导致视觉词汇区别能力不足和视觉词汇误匹配增加,从而影响了拷贝图像检索效果。针对视觉词汇的误匹配问题,提出一种基于近邻上下文的拷贝图像检索方法。该方法通过局部特征的上下文关系消除视觉词汇歧义,提高视觉词汇的区分度,进而提高拷贝图像的检索效果。 首先,以距离和尺度关系选择图像中某局部特征点周围的特征点作为该特征点的上下文,选取的上下文中的局部特征点称为近邻特征点;再以近邻特征点的信息以及与该局部特征的关系为该局部特征构建上下文描述子;然后,通过计算上下文描述子的相似性对局部特征匹配对进行验证;最后,以正确匹配特征点的个数衡量图像间的相似性,并以此相似性选取若干候选图像作为返回结果。 在Copydays图像库进行实验,与Baseline方法进行比较。在干扰图像规模为100 k时,相对于Baseline方法,mAP提高了63%。当干扰图像规模从100 k增加到1 M时,Baseline的mAP值下降9%,而本文方法下降3%。 本文拷贝图像检索方法对图像编辑操作,如旋转、图像叠加、尺度变换以及裁剪有较高的鲁棒性。该方法可以有效地应用到图像防伪、图像去重等领域。  
      关键词:局部特征;视觉词汇;拷贝图像检索;词袋模型;图像检索   
      2299
      |
      310
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111576 false
      更新时间:2024-05-08

      图像理解和计算机视觉

    • 动作切分和流形度量学习的视频动作识别

      罗会兰, 赖泽云, 孔繁胜
      2017, 22(8): 1106-1119. DOI: 10.11834/jig.170032
      摘要:为了提高视频中动作识别的准确度,提出基于动作切分和流形度量学习的视频动作识别算法。 首先利用基于人物肢体伸展程度分析的动作切分方法对视频中的动作进行切分,将动作识别的对象具体化;然后从动作片段中提取归一化之后的全局时域特征和空域特征、光流特征、帧内的局部旋度特征和散度特征,构造一种7×7的协方差矩阵描述子对提取出的多种特征进行融合;最后结合流形度量学习方法有监督式地寻找更优的距离度量算法提高动作的识别分类效果。 对Weizmann公共视频集的切分实验统计结果表明本文提出的视频切分方法具有很好的切分能力,能够作好动作识别前的预处理;在Weizmann公共视频数据集上进行了流形度量学习前后的识别效果对比,结果表明利用流形度量学习方法对动作识别效果提升2.8%;在Weizmann和KTH两个公共视频数据集上的平均识别率分别为95.6%和92.3%,与现有方法的比较表明,本文提出的动作识别方法有更好的识别效果。 多次实验结果表明本文算法在预处理过程中动作切分效果理想,描述动作所构造协方差矩阵对动作的表达有良好的多特征融合能力,而且光流信息和旋度、散度信息的加入使得人体各部位的运动方向信息具有了更多细节的描述,有效提高了协方差矩阵的描述能力,结合流形度量学习方法对动作识别的准确性有明显提高。  
      关键词:动作识别;动作切分;流形学习;度量学习;特征协方差;视频分析   
      2708
      |
      349
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113225 false
      更新时间:2024-05-08

      医学图像处理

    • 颅骨点云模型的局部特征配准方法

      赵夫群, 周明全, 耿国华
      2017, 22(8): 1120-1127. DOI: 10.11834/jig.170003
      摘要:点云配准是计算机视觉领域里的一个研究热点,其应用领域涉及3维重建、目标识别、颅面复原等多个方面。颅骨配准是颅面复原的一个重要步骤,其配准的正确与否将直接影响到颅面复原的结果。为了提高颅骨配准的精度和收敛速度,提出一种基于局部特征的颅骨点云模型配准方法。 首先提取颅骨点云模型的局部深度、法线偏角和点云密度等局部特征;然后计算局部特征点集的相关性,得到相关候选点集,并通过删减外点实现颅骨点云的粗配准;最后采用基于高斯概率模型和动态迭代系数的改进迭代最近点 (ICP) 算法实现颅骨的细配准。 通过对公共点云数据模型以及颅骨点云数据模型分别进行配准实验,结果表明,基于局部特征的点云配准算法可以完成点云模型的精确配准,特别是对颅骨点云模型具有较好的配准效果。在颅骨细配准阶段,跟ICP算法相比,改进ICP算法的配准精度和收敛速度分别提高了约30%和60%;跟概率迭代最近点 (PCP) 算法相比,其配准精度差异不大,收敛速度提高了约50%。 基于局部特征的点云配准算法不仅可以用于公共点云数据模型的精确配准,而且更适用于颅骨点云数据模型的配准,是一种精度高、速度快的颅骨点云模型配准方法。  
      关键词:颅面复原;颅骨配准;局部特征;迭代最近点;高斯概率模型;动态迭代系数   
      2783
      |
      446
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111948 false
      更新时间:2024-05-08

      遥感图像处理

    • 大场景SAR图像中提取小型港口区域技术研究

      周强, 曲长文, 李健伟, 姚力波
      2017, 22(8): 1128-1134. DOI: 10.11834/jig.170008
      摘要:漫长的海岸线上有很多由简单码头和突堤组成的小型港口,它们不像大型港口那样时刻被监视着,但其作为舰船的临时停靠场所,也是需要重点关注的区域,有必要对其区域进行自动检测。 本文在充分分析小型港口特征的基础之上,根据其海岸线轮廓在不同尺度下均能表现出丰富角点的特点,构造了提取小型港口区域的完整流程,包括采用多尺度角点检测提取港口潜在区域、采用新型突堤检测方法精提取港口区域、采用改进的岸线封闭性测度法鉴别去除虚假港口3个环节,通过实际SAR图像仿真验证了方法的优越性。 利用本文所提出的方法,处理两幅典型的港口区域SAR图像:Radarsat-2烟台港1 m分辨率的SAR图像和TerraSAR-X印度维沙卡帕特南港1 m分辨率的SAR图像,并与文献4中所述的方法进行对比,发现经过本文方法处理之后,虚警率从10%降到了6.6%,准确率从91.9%提高到了93.3%,但是由于计算流程较复杂,导致处理时间从11.58 s增加到了13.26 s。 本文针对小型港口的特点,提出了港口检测的完整的流程。实验结果表明,该方法的虚警率更低、准确性更高,但是存在运算速度慢的缺点,这是下一步需要优化的地方。该方法适用于大场景SAR图像中快速准确地检测出小型港口区域,可用于监视那些由简单码头和突堤组成的舰船临时停靠场所。  
      关键词:SAR图像;小型港口提取;角点;突堤;岸线封闭性算法   
      2260
      |
      306
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111031 false
      更新时间:2024-05-08
    • 模糊神经网络高分辨率遥感影像监督分类

      王春艳, 徐爱功, 赵雪梅, 姜勇
      2017, 22(8): 1135-1143. DOI: 10.11834/jig.160596
      摘要:针对高分辨率带来的像素类属不确定性增大及各类属间相关性增强引起的影像分类问题,提出一种模糊神经网络高分辨遥感影像监督分类方法。 提出的模型为包含输入层,隐含层(隶属函数层)及输出层的三层前向模糊神经网络,输入层用于接收来自训练样本的灰度值;隐含层每个神经元节点的模糊隶属函数为对各类别定义的高斯隶属函数模型,以实现对输入变量隶属程度的不确定表达;输出层的输入变量为隐含层各神经元节点输出变量的线性组合,激活函数为分段线性函数,该层实现输入变量隶属程度的相关性表达。以训练数据直方图作为期望输出,梯度下降法求解模型参数,最后按最大隶属度准则实现分类决策。 利用本文算法和经典算法对合成影像进行实验,本文方法总体精度达到0.931,相对于高斯隶属函数方法总体精度提高了5.3%,相对于最大似然法提高了4.2%,相对于FCM方法提高了5.9%,对真实WorldView-2全色影像的实验中文中方法分割精度也高于传统方法。 提出的模糊神经网络模型可以更加精确的拟合高分辨率遥感影像复杂的分布特征,有效处理高分辨率遥感影像的上述分类问题。  
      关键词:高分辨率遥感影像;分类;模糊神经网络;高斯隶属函数;监督学习;直方图拟合   
      2471
      |
      365
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111635 false
      更新时间:2024-05-08
    • 深度卷积神经网络特征提取用于地表覆盖分类初探

      张伟, 郑柯, 唐娉, 赵理君
      2017, 22(8): 1144-1153. DOI: 10.11834/jig.170139
      摘要:地表覆盖监测是生态环境变化研究、土地资源管理和可持续发展的重要基础,在全球资源监测、全球变化检测中发挥着重要作用。提高中等分辨率遥感影像地表覆盖分类的精度具有非常重要的意义。 近年来,深度卷积神经网络在图像分类、目标检测和图像语义分割等领域取得了一系列突破性的进展,相比于传统的机器学习方法具有更强的特征学习和特征表达能力。基于其优越的特性,本文进行了深度卷积神经网络对中分辨率遥感影像进行特征提取和分类的探索性研究。以GF-1的16 m空间分辨率多光谱影像为实验数据,利用预训练好的AlexNet深度卷积神经网络模型进行特征提取,以SVM为分类器进行分类。分析了AlexNet不同层的特征以及用于提取特征的邻域窗口尺寸对分类结果的影响,并与传统的单纯基于光谱特征和基于光谱+纹理特征的分类结果进行对比分析。 结果表明在用AlexNet模型提取特征进行地表覆盖分类时,Fc6全连接层是最有效的特征提取层,最佳的特征提取窗口尺寸为9×9像素,同时利用深度特征得到的总体分类精度要高于其他两种方法。 深度卷积神经网络可以提取更精细更准确的地表覆盖特征,得到更高的地表覆盖分类精度,为地表覆盖分类提供了参考价值。  
      关键词:卷积神经网络;AlexNet;特征提取;地表覆盖分类;支持向量机   
      5884
      |
      433
      |
      13
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111464 false
      更新时间:2024-05-08
    • 利用混合特征的多视角遥感图像配准

      吴芳青, 杨扬, 潘安宁, 杨昆
      2017, 22(8): 1154-1161. DOI: 10.11834/jig.160542
      摘要:多视角遥感图像配准是遥感图像处理领域的一项关键技术,其目的是精确获取图像间被测区域发生的几何变换关系。由于航拍视角变化以及地物的空间分布和几何形状的复杂度,多视角遥感图像间会产生非刚性畸变问题,增加了图像配准的难度,为此本文提出一种利用遥感图像SIFT(scale-invariant feature transform)特征点阵的全局和局部几何结构特征进行多视角遥感图像配准的算法。 通过增加对SIFT点阵的几何结构特征描述以及利用SIFT点阵间全局与局部几何结构特征的互补关系,提升存在非刚性畸变的多视角遥感图像配准精度。 实验使用谷歌地球的卫星影像数据以及无人机航拍遥感数据对本文算法进行了测试,并与3种同类算法(SIFT、SURF(speeded-up robust features)、CPD(coherent point drift))进行对比实验,本文算法在存在非刚性畸变的多视角遥感图像配准中能够有效地提升SIFT特征点阵的配准精度,从而获得更加准确的多视角遥感图像配准结果。 本文实现了一种结合SIFT特征点阵的全局和局部几何结构特征进行多视角遥感图像配准的算法,实验结果表明了该方法对存在非刚性畸变的多视角遥感图像能够有效地进行配准,可适用于同源多视角情况下的遥感图像配准问题。  
      关键词:多视角;遥感图像;非刚性畸变;混合特征;图像配准   
      3681
      |
      324
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112473 false
      更新时间:2024-05-08
    • 利用格式塔的高分辨率遥感影像建筑物提取

      李青, 李玉, 王玉, 赵泉华
      2017, 22(8): 1162-1174. DOI: 10.11834/jig.160588
      摘要:格式塔心理学的理论基础为通过对事物的部分感知,实现对事物整体的认识。本文将该思想应用到建筑物提取中,提出一种兼顾目标细节及整体几何特征的高分辨率遥感影像建筑物提取方法。 首先,利用SIFT算法提取特征点作为候选边缘点;然后定义格式塔序列连续性原则判别边缘点,从而得到边缘点点集;并由边缘点点集拟合边缘,实现遥感影像建筑物提取。 利用提出算法,对WorldView-2遥感影像进行建筑物提取实验。通过与基于多尺度分割和区域合并的建筑物提取算法对比可以看出,提出算法能够更加准确、完整地提取出建筑物。采用分支因子、遗漏因子、检测率和完整性4个定量化指标对实验结果的定量评价,本文算法的检测率和完整性均大于对比算法,且本文算法的检测率均在95%以上,验证了提出基于格式塔理论的高分辨率遥感影像建筑物提取算法的有效性和准确性。 基于格式塔的高分辨率遥感影像建筑物提取算法能够准确刻画建筑物细节特征,同时兼顾建筑物整体几何轮廓,准确提取高分辨率遥感影像中的建筑物。本文算法针对高分辨率遥感影像,适用于提取边缘具有直线特征的建筑物。使用本文算法进行遥感影像建筑物提取时,提取精度会随分辨率降低而降低,建议实验影像分辨率在5 m以上。  
      关键词:格式塔;建筑物提取;SIFT算法;序列连续性;边缘提取   
      3487
      |
      454
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110496 false
      更新时间:2024-05-08
    0