最新刊期

    2016 21 1

      图像处理和编码

    • 空时形状预测与高效编码

      朱仲杰, 王玉儿, 蒋刚毅
      2016, 21(1): 1-7. DOI: 10.11834/jig.20160101
      摘要:形状是视觉对象的关键特征,形状编码是对象基图像和视频处理中的关键技术,但现有无损形状编码方法压缩效率普遍不高.为此,提出一种基于链码表示和空时预测的高效无损形状编码新算法. 首先逐帧提取视觉对象的形状轮廓并转化为链码表示;然后基于对象轮廓的帧间活动性将形状视频序列分成帧内预测编码帧和帧间预测编码帧,并基于轮廓链码的空域相关性和时域相关性对二者分别进行空域和时域补偿与预测;最后基于链码的方向约束特性对预测后的位移矢量和预测残差进行高效编码压缩. 为了检验所提算法的性能,基于MPEG-4标准形状测试序列进行了编码实验测试.与现有主要方法相比本文算法能提高压缩效率6%到71.6%不等. 本文算法可广泛应用于对象基编码、基于内容的图像检索、图像分析与理解等领域.  
      关键词:视觉对象;形状编码;预测编码;高效编码   
      3019
      |
      378
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115287 false
      更新时间:2024-05-07
    • 第二小方向导数信息熵的兴趣点检测

      卢健, 黄杰, 潘峰
      2016, 21(1): 8-16. DOI: 10.11834/jig.20160102
      摘要:为了提高兴趣点检测的定位准确性和对噪声的鲁棒性,提出利用图像轮廓线及其邻域内像素点方向导数信息熵检测兴趣点的方法. 首先利用多方向Gabor虚部滤波器提取图像灰度变化信息得到第二小方向导数.然后利用Canny边缘检测器提取边缘映射,并填补断裂边缘映射提取边缘轮廓线.最后求解图像边缘轮廓线及其邻域内像素点对应的第二小方向导数所对应的信息熵归一化值并作为新的兴趣点测度.和直接由灰度变化信息及分析边缘轮廓形状或曲率提取兴趣点的方法相比,本文算法结合了两种算法的思想,利用轮廓线上及其邻域内的像素点梯度方向信息熵值作为兴趣点测度.同时不同于同质及边缘区域的梯度方向变化,兴趣点处的梯度方向变化信息呈现各向异性的特性,利用兴趣点第二小方向导数(第一小方向导数可能为零)对应的信息熵值作为新的兴趣点测度可提高算法的定位准确性. 通过对检测图像进行仿射变换和加入高斯噪声处理后,分别利用Harris算子、CSS算子、He&Yung算子和本文算法提取图像兴趣点,并比较各算法在仿射变换和高斯噪声情况下检测到的兴趣点的平均重复率和定位误差两个性能指标的平均值.其中本文算法的性能指标平均值为1.625,远高于Harris(3.25)、He&Yung(2.625)和CSS(2.5)三大兴趣点检测算子. 通过与典型的3种算法相对比,本文算法具有较好的平均重复率及噪声鲁棒性,尤其是图像在外界干扰的旋转变换和尺度变换下对兴趣点的定位性有着更好的检测性能.  
      关键词:兴趣点检测;Gabor虚部滤波器;灰度变化信息;第二小方向导数;信息熵   
      2828
      |
      283
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115318 false
      更新时间:2024-05-07
    • 采用面积采样的反走样字符旋转算法

      郑凯文, 刘文波
      2016, 21(1): 17-23. DOI: 10.11834/jig.20160103
      摘要:针对现有字符反走样算法中灰度分配不准确导致的字符抖动、实时性较差等问题,提出一种高效的反走样算法. 首先,算法基于面积采样原理,根据周围邻域的像素点来分配灰度,使像素点的坐标定位更加准确,从而解决了字符动态显示时抖动的问题;其次,通过反向坐标变换消除了字符旋转后出现的空洞现象;最后,算法充分利用了FPGA的并行计算能力,在时间和空间上都做到了优化. 实验结果表明,本文算法很好地解决了字符抖动问题,并且新算法的仿真速度约为传统算法的6倍以上,比五株排列算法提高了30%. 相比其他算法,新算法的优势体现在两个方面,一是字符的灰度过渡平滑,反走样效果更好;二是速度快,实时性高,新算法适用于工程中各种场合下点阵字符的显示,尤其是实时性要求高的环境.  
      关键词:反走样;面积采样;字符旋转;灰度分配;现场可编程门阵列   
      2895
      |
      233
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115298 false
      更新时间:2024-05-07

      图像分析和识别

    • 多尺度特征融合与极限学习机的玉米种子检测

      柯逍, 杜明智
      2016, 21(1): 24-38. DOI: 10.11834/jig.20160104
      摘要:玉米种子等农作物检测是农业信息化领域中一个关键问题,为了能够快速和准确地实现对其检测,提出基于多尺度特征融合与极限学习机的玉米种子无损检测算法. 首先对种子特征的描述采用局部特征和全局特征相结合的特点,局部特征采用多尺度方向梯度直方图特征,而在全局特征上则提取HSV颜色模型特征.其次,针对传统的BP神经网络以及SVM等存在训练时间长、检测速度慢的不足,采用极限学习机作为其检测算法.此外,为了避免样本在训练时带来的过多时间消耗,该检测模型上采用了并行训练算法.再次,针对原始图像分辨率过高问题所带来的检测时间以及内存消耗较大的问题,采用一种基于局部均值的图像缩小算法.最后,针对该文采用的滑动窗口扫描可能带来的同一对象多窗口重叠的问题,提出了一种基于模糊聚类的局部窗口融合算法. 仿真结果表明,提出的方法可实现对玉米种子的准确检测,对检测样本的测试精度达到97.66%,同时误差控制在0.1%. 相比传统的方法,提出的方法在检测速度、检测准确率上均有所改善,无需严格的硬件设备要求并且对玉米种子检测时不会产生任何损伤.  
      关键词:极限学习机;特征融合;目标检测;窗口融合;模糊聚类   
      2867
      |
      301
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114562 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 结合NSCT和压缩感知的红外与可见光图像融合

      陈木生
      2016, 21(1): 39-44. DOI: 10.11834/jig.20160105
      摘要:红外成像传感器只敏感于目标场景的辐射,对热目标的探测性能较好,但其对场景的成像清晰度低;可见光图像只敏感于目标场景的反射,场景图像较为清晰,但目标不易被清晰观察.因而将两者图像进行融合,生成具有较好目标指示特性和可见光图像的清晰场景信息,有利于提高目标识别的准确性和降低高分辨图像传感器研究的技术难度. 结合非下采样contourlet变换 (NSCT)和压缩感知的优点,研究一种新的红外与可见光图像融合方法.首先对两源图像进行NSCT变换,得到一个低频子带和多个不同方向、尺度的高频子带.然后对两低频子带采用压缩感知理论获得测量向量,利用方差最大的方法对测量向量进行融合,再进行稀疏重建;高频子带采用区域能量最大的方法进行融合.最后利用NSCT逆变换获得融合图像. 为了验证本文方法的有效性,与其他几种方法相比较,并利用主观和客观的方法对融合结果进行评价.提出的新方法融合结果的熵、空间频率、方差明显优于其他几种方法,运行时间居中.主观上可以看出,融合结果在较好地显示目标的基础上,能够较为清晰地保留场景图像的信息. 实验结果表明,该方法具有较好的目标检测能力,并且方法简单,具有较强的适应性,可应用于航空、遥感图像、目标识别等诸多领域.  
      关键词:图像融合;非下抽样contourlet变换;压缩感知;红外图像;可见光图像   
      3651
      |
      294
      |
      18
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114597 false
      更新时间:2024-05-07
    • Plücker直线描述的空间后方交会

      盛庆红, 陈姝文, 肖晖, 张斌, 王青, 费利佳
      2016, 21(1): 45-52. DOI: 10.11834/jig.20160106
      摘要:现有的空间后方交会方法没有充分利用成像光线的几何拓扑关系,共线条件的几何约束性弱,提出基于Plücker坐标的空间后方交会方法. 将成像光线用Plücker直线表示,通过Plücker成像光线在空间中的螺旋位移,使得物点在像点和投影中心所确定的Plücker直线上,建立基于Plücker成像光线的共线条件方程. 针对小倾角航空与近景影像,本文方法与传统的欧拉角法相比求解得到的外方位元素最大线元素误差分别从0.88 m降到0.53 m,从0.06 m降到0.01 m;最大角元素误差分别从0.016 2弧度降到0.002 9弧度,从0.087弧度降到0.066弧度.针对大倾角影像,欧拉角法不收敛而本文方法能正确解算. 本文方法由于增强了模型的几何强度,获得了更高的定位精度,且对于大倾角影像也同样能够获得正确而稳定的外方位元素解算结果.  
      关键词:直线摄影测量;空间后方交会;Plücker直线;共线条件;螺旋位移   
      3057
      |
      282
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114508 false
      更新时间:2024-05-07
    • 深度卷积神经网络的显著性检测

      李岳云, 许悦雷, 马时平, 史鹤欢
      2016, 21(1): 53-59. DOI: 10.11834/jig.20160107
      摘要:显著性检测问题是近年来的研究热点之一,针对许多传统方法都存在着特征学习不足和鲁棒检测效果不好等问题,提出一种新的基于深度卷积神经网络的显著性检测模型. 首先,利用超像素的方法聚类相似特征的像素点,仿人脑视皮层细胞提取目标边缘,得到区域和边缘特征.然后,通过深度卷积神经网络学习图像的区域与边缘特征,获取相应的目标检测显著度置信图.最后,将深度卷积神经网络输出的置信度融入到条件随机场,求取能量最小化,实现显著性与非显著性判别,完成显著性检测任务. 在两个常用的视觉检测数据库上进行实验,本文算法的检测精度与当前最好的方法相比,在MSAR数据库上检测精度相对提升大约1.5%,在Berkeley数据库上提升效果更加明显,达到了5%.此外,无论是自然场景还是人工建筑场景、大目标与小目标,检测的效果都是最好的. 本文融合多特征的深度学习方法与单一浅层人工特征的方法相比更有优势,它避免了手工标定特征所带来的不确定性,具有更好的鲁棒性与普适性,从主观视觉愉悦度和客观检测准确度两方面说明了算法的有效性.  
      关键词:显著性检测;超像素;卷积神经网络;条件随机场   
      6911
      |
      448
      |
      28
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115253 false
      更新时间:2024-05-07

      计算机图形学

    • 以优先点为中心的Delaunay三角网生长算法

      尤磊, 唐守正, 宋新宇
      2016, 21(1): 60-68. DOI: 10.11834/jig.20160108
      摘要:Delaunay三角网具备的优良性质使其得到广泛的应用,构建Delaunay三角网是计算几何的基础问题之一,为了高效、准确地构建大规模点集的Delaunay三角网,提出一种基于优先点的改进三角网生长算法. 算法以逆时针次序的一条凸包边为初始基边,使用基边对角最大化并按照逆时针次序选定第3点构建一个Delaunay三角形,通过待扩展边列表中的数据判断新生成的两条边是否需要扩展,采用先进先出的方式从待扩展边列表中取边作为基边,以优先点为中心构建局部Delaunay三角网使优先点尽快成为封闭点,再从点集中删除此封闭点. 对于同一测试点集,改进算法运行时间与经典算法运行时间的比率不超过1/3,且此比率随点集规模增长逐步下降.相比经典算法,改进算法在时间效率上有较大提升. 本文改进算法对点集规模具有较好的自适应性与较高的构网效率,可用于大规模场景下Delaunay三角网的构建.  
      关键词:计算几何;Delaunay三角网;生长算法;先进先出;封闭点;优先点   
      3908
      |
      284
      |
      6
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114438 false
      更新时间:2024-05-07

      医学图像处理

    • 快速数字影像重建的2维/3维医学图像配准

      刘坤, 吕晓琪, 谷宇, 于荷峰, 任国印, 张明
      2016, 21(1): 69-77. DOI: 10.11834/jig.20160109
      摘要:针对2D/3D医学图像配准过程中数字影像重建技术(DRR)生成图像和相似性程度测量两个步骤计算量大、耗时较长这一问题,提出了一种基于Bresenham直线生成算法改进的模式强度与梯度相结合的混合配准算法. 首先利用Bresenham直线生成算法原理改进传统光线投射算法(Ray-Casting),完成DRR图像的生成;其次模式强度与梯度相结合并引入多分辨率策略来降低相似性测度的计算复杂度;最终利用改进的鲍威尔优化算法对参数进行优化,完成整个配准过程. 实验结果表明,改进的混合配准算法与基于相关系数、互信息和模式强度的配准算法相比,配准效率大幅提升.模拟配准实验和临床配准实验完成时间分别为76.2 s和64.9 s,比传统配准算法效率提升3~6倍. 提出的算法在保证配准精度和高鲁棒性的前提下,大幅度地提高了2D/3D医学图像配准算法的运算速度,可以满足临床上精确引导手术进行的实时性要求.  
      关键词:2D/3D配准;光线投射算法;Bresenham直线生成算法;改进的模式强度;多分辨率策略;改进的鲍威尔算法   
      3959
      |
      347
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114573 false
      更新时间:2024-05-07
    • 小波-Lagrange方法进行医学图像层间插值

      武士想, 尚鹏, 王立功
      2016, 21(1): 78-85. DOI: 10.11834/jig.20160110
      摘要:医学图像3维重建通常需要进行层间插值.现有的插值方法虽然种类较多,但在进行医学断层图像插值时,很多方法并不能兼顾图像灰度和目标形状的变化,且计算过程过于复杂.鉴于此,提出一种基于小波与Lagrange多项式相结合的插值方法. 首先对原始图像进行小波变换,获得图像边缘对应小波系数的位置信息,在断层图像的相应小波系数之间运用Lagrange多项式进行强度和位置插值. 通过实验验证,采用本文方法插值得到的图像与线性、Cubic插值方法相比,不仅在灰度值不等点方面减少了10%~50%,均方误差平均下降了3%,而且目标组织轮廓特别是拐角剧烈变化处可改善伪轮廓现象,介于原始断层图像之间,能够满足医学图像层间插值的要求. 与线性插值方法、Cubic插值方法相比,新算法由于引入了小波变换这个工具,可将图像剧烈变换部分提取出来,因此,本文方法在处理图像剧烈变化的情况时略有优势.新算法得到的插值图像质量有所提高,计算误差有所降低,可有效用于医学图像目标组织的3维重建.  
      关键词:断层图像;层间插值;小波变换;Lagrange多项式   
      3288
      |
      415
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115264 false
      更新时间:2024-05-07

      遥感图像处理

    • 多主体框架下结合最大期望值和遗传算法的SAR图像分割

      张金静, 李玉, 赵泉华
      2016, 21(1): 86-94. DOI: 10.11834/jig.20160111
      摘要:SAR图像中固有的相干斑噪声增加了图像分割的困难.为此,提出一种分布式SAR图像分割算法. 首先假设图像中同质区域内像素满足同一独立的Gamma分布,依此建立SAR图像模型;为了刻画SAR图像中像素的类属性,建立标号场的MRF(Markov Random Field)模型;在Bayesian理论框架下建立图像分割模型;在多主体系统(MAS)框架下,结合MRF模型和遗传算法(GA)模拟分割模型.MAS结构由分割主体和协调主体组成,其中分割主体利用最大期望值( EM)算法估计MRF模型参数,从而实现全局分割;协调主体利用GA实现全局最优. 为了验证提出方法的有效性,分别对模拟和RADARSAT-I/II SAR图像进行实验,并与EM和RJMCMC算法比较.本文算法的用户精度、产品精度、总精度及kappa系数均高于EM算法.定性和定量分析结果验证了本文算法的鲁棒性和有效性. 实验结果表明提出的分布式MAS框架下SAR图像分割方法,能够提高分割精度.该方法适用于中高分辨率单极化的SAR图像,且具有很好的抗噪性.  
      关键词:多主体系统;马尔可夫随机场;最大期望值算法;遗传算法;SAR图像分割   
      2913
      |
      266
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114475 false
      更新时间:2024-05-07

      第十届图像图形技术与应用学术会议

    • 视差互信息引导下的立体航空影像与LiDAR点云自动配准

      吴军, 胡彦君, 饶云, 彭智勇
      2016, 21(1): 95-103. DOI: 10.11834/jig.20160112
      摘要:从视差图反映影像景物深度变化并与LiDAR系统距离量测信息"同源"这一认识出发,提出一种基于视差互信息的立体航空影像与LiDAR点云自动配准方法. 本文方法分为3个阶段:第一、通过半全局匹配SGM(semi-gdabal matching)生成立体航空影像密集视差图;第二、利用航空影像内参数及初始配准参数(外方位元素)对LiDAR点云进行"针孔"透视成像,生成与待配准的立体航空影像空间分辨率、几何形变相接近且具有相同幅面大小的模拟灰度影像-LiDAR深度影像,以互信息作为相似性测度依据估计航空影像视差图与LiDAR深度影像的几何映射关系,进而以之为基础实现LiDAR点云影像概略相关;第三、以LiDAR点云影像概略相关获得的近似同名像点为观测值,以视差互信息为权重,实施摄影测量空间后方交会计算获得优化的影像外方位元素,生成新的LiDAR深度影像并重复上述过程,直至满足给定的迭代计算条件. 选取重叠度约60%、幅面大小7 216×5 428像素、空间分辨率约0.5 m的立体航空像对与平均点间距约1.5 m、水平精度约25 cm的LiDAR"点云"进行空间配准实验,配准精度接近1个像素. 实验结果表明,本文方法自动化程度高且配准精度适中,理论上适用于不同场景类型、相机内参数已知立体航空影像,具有良好的应用价值.  
      关键词:影像地理配准;LiDAR;视差互信息;迭代配准   
      3168
      |
      260
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115367 false
      更新时间:2024-05-07
    • 双树复小波域的MRI图像去噪

      黄学优, 张长江
      2016, 21(1): 104-113. DOI: 10.11834/jig.20160113
      摘要:噪声会降低磁共振图像(MRI)的质量,影响视觉效果和计算机辅助诊断,针对MRI噪声的莱斯(Rician)分布特性,设计一种有效的MRI去噪算法. 在双树复小波(DT-CWT)域结合双边滤波器(BF)和基于Stein无偏误差估计的邻域收缩法(NeighShrinkSURE)、二变量收缩法(BivariateShrink)设计一种有效的磁共振图像MRI去噪算法.所设计的算法充分考虑了MRI的噪声分布特性以及小波系数的层间和层内相关性,其性能优劣主要取决于平方MRI的双树复小波系数的噪声标准差估计的准确程度,其次和双边滤波器的参数以及两种收缩方法的占比有关.为了使各算法的协同发挥最好的性能,以均方误差(MSE)、峰值信噪比(PSNR)和结构相似度(SSIM)作为图像质量评价指标,修正DT-CWT系数的噪声标准差,确定最佳双边滤波参数以及两种收缩方法的占比.在双树复小波域结合3种方法设计了一种有效的MRI去噪算法. 与现有几种算法进行图像去噪比较实验.在视觉效果、去噪指标PSNR和SSIM以及耗时方面,本文算法综合性能优于现有的几种MRI去噪算法,PSNR提高了约0.51~1dB,SSIM提高了约5%~10%. 双树复小波域的去噪优于基本小波去噪,利用层内和层间相关性的去噪算法很好去除了噪声,双边滤波器的使用增强了低频部分的图像,使得本文算法在MRI莱斯噪声的去除上获得了较好的表现,在去噪的同时能够保留边缘和细节信息.  
      关键词:MRI去噪;双树复小波;邻域收缩;二变量收缩;双边滤波   
      3428
      |
      291
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115308 false
      更新时间:2024-05-07
    • 快速定位图像尺度和区域的3维跟踪算法

      赵奇可, 孙延奎
      2016, 21(1): 114-121. DOI: 10.11834/jig.20160114
      摘要:传统的2维自然图像的增强现实算法,对模板图像的各个尺度下的整个图像提取特征点并保存到特征点数组中,跟踪阶段对模板图像提取出的所有特征点进行匹配,造成了大量的无效运算,降低了特征匹配的效率.为了解决这个问题,将模板各个尺度的图像进行区域划分,提出了一种快速定位图像尺度和区域的算法,缩小特征匹配的范围,加快3维跟踪的速度. 预处理阶段,通过对图像金字塔每一尺度图像分成小区域,对模板图像上的特征点进行分层次分区域的管理.在系统实时跟踪阶段,通过计算几何算法快速确定当前摄像机图像所对应的尺度和区域,从而减小了特征匹配的范围. 该方法大幅度缩小了特征匹配的范围,降低了特征匹配所消耗的时间,与传统算法相比,在模板图像分辨率较大的情况下特征匹配阶段时间可以缩短10倍左右,跟踪一帧图像的时间缩短1.82倍.系统实时跟踪过程中的帧率总体保持在15帧/s左右. 提出的快速定位图像尺度和区域算法适用于移动设备上对2维自然图像的跟踪,尤其在模板图像分辨率较大的情况下,算法能够显著减小特征匹配的范围,从而提升了实时3维跟踪算法的运行效率.  
      关键词:增强现实;3维跟踪;特征匹配;移动平台;快速定位;模板图像   
      3126
      |
      266
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115356 false
      更新时间:2024-05-07
    • 局部不变特征点的精度指标

      滕日, 周进, 蒋平, 崔雄文
      2016, 21(1): 122-128. DOI: 10.11834/jig.20160115
      摘要:作为计算机视觉的热门研究方向,局部不变特征算法的发展已趋于成熟、稳定,然而目前几乎所有特征点提取算法都没有给出特征点的精度指标.针对这一缺陷,提出一种特征点精度指标-特征点波动区间. 性质稳定的点在干扰条件下仍具有较好的精度,即小范围的波动区间,因此,以当前最热门的SIFT(scale-invariant feature transform)特征点为例,在图像加入噪声,发生光照变换,发生模糊变换以及同时进行噪声、光照及模糊处理这四种情况下分别分析同一算法提取的不同特征点的波动情况,进而得到不同特征点的波动区间. 实验得到16个稳定检出特征点,其中点2,3,4,11,13这5个点可以在不同干扰条件下的波动范围都较小,而点2则只在模糊条件下波动较小,在其余干扰下波动较大.特征点虽然已经过特征提取,但仍具有不同的波动区间,其优劣也不尽相同.不同的特征点的波动区间并不相同,但仍有一部分特征点在不同干扰条件下均保持较高的提取精度. 波动区间能很好地表征每个特征点的提取精度.由于此前只有针对特征点算法的评价指标,而没有针对特征点自身性质的评价方法,因此本文提出的特征点波动区间将为诸如设备标定、视觉测量、精简特征库等相关后续工作打下良好基础.  
      关键词:计算机视觉;局部不变特征;特征点;波动区间;尺度不变特征转换(SIFT)   
      3070
      |
      240
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114538 false
      更新时间:2024-05-07
    0