最新刊期

    2015 20 10

      图像处理和编码

    • 基于模式特征的H.264/AVC可逆视频水印

      李淑芝, 张翔, 邓小鸿, 吴晓燕
      2015, 20(10): 1285-1296. DOI: 10.11834/jig.20151001
      摘要:针对当前可逆视频水印隐蔽性和篡改定位能力不足问题,提出一种新颖的基于帧内预测模式的可逆视频水印算法。首先,深入分析I帧亮度分量的预测模式对不同类型篡改的敏感性,提取每个帧内编码宏块的预测模式,通过预测模式生成特征码。然后,结合H.264/AVC编码特性和误差补偿算法,在每个亮度4×4残差块中筛选出误差最小系数。最后,运用差值扩展的方法将特征信息作为水印可逆的嵌入到所选系数。在含水印视频未受到篡改时,解码端提取水印后可对原始视频进行无损恢复。当视频受到篡改时,算法能精确定位篡改区域并且篡改定位精度达到4×4子块级。由于水印嵌入在误差最小的系数中,能够有效地降低水印嵌入对于视频质量的影响,嵌入水印后图像的PSNR值比现有的基于H.264/AVC可逆水印方案平均提高10%,测试序列的码率增量平均降低了22%左右。本文算法较现有算法具有更好的嵌入率、隐蔽性、篡改检测精度, 适用于医学、军事、卫星等领域。  
      关键词:视频水印;H.264/AVC;可逆水印;差值扩展;帧内预测模式   
      3754
      |
      1112
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116535 false
      更新时间:2024-05-07
    • 二阶总广义变分小波修复模型

      许建楼, 郝岩, 张冀
      2015, 20(10): 1297-1303. DOI: 10.11834/jig.20151002
      摘要:针对全变分小波修复模型易导致阶梯效应的缺陷,提出一种加权的二阶总广义变分小波修复模型。不同于全变分小波修复模型,假设的新模型引入二阶导数项且能够自动地调解一阶和二阶导数项。另外,为有效地利用图像的局部结构信息,新模型引入了权函数,它既能保护图像的边缘又增强光滑区域的去噪能力。 为有效地计算新模型,利用交替方向法将该模型变为两个子模型, 然后对两个子模型分别给出相应的理论和算法推导。相比最近基于全变分正则小波修复模型(平均信噪比,平均绝对误差及平均结构相似性指标分别为21.884 4,6.857 8,0.827 2),新模型得到更好的修复效果(平均信噪比,平均绝对误差及平均结构相似性指标分别为22.313 8,6.626 1,0.831 8)。与全变分正则相比,二阶总广义变分正则更好地减轻阶梯效应。目前, 国内外学者对该问题的研究取得一些结果。由于原始-对偶算法需要较小的参数,所以运算的速度较慢,因此更快速的算法理论有待进一步研究。另外,该正则能应用于图像去噪、分割、放大等方面。  
      关键词:全变分;总广义变分;图像修复;交替方向法;原始-对偶算法   
      2885
      |
      281
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116484 false
      更新时间:2024-05-07
    • JPEG图像双重压缩偏移量估计的篡改区域自动检测定位

      赵洁, 郭继昌, 张艳, 张众维
      2015, 20(10): 1304-1312. DOI: 10.11834/jig.20151003
      摘要:为了解决现有图像区域复制篡改检测算法只能识别图像中成对的相似区域而不能准确定位篡改区域的问题,提出一种基于JPEG(joint photographic experts group)图像双重压缩偏移量估计的篡改区域自动检测定位方法。首先利用尺度不变特征变换(SIFT)算法提取图像的特征点和相应的特征向量,并采用最近邻算法对特征向量进行初步匹配,接下来结合特征点的色调饱和度(HSI)彩色特征进行优化匹配,消除彩色信息不一致引发的误匹配;然后利用随机样本一致性(RANSAC)算法对匹配对之间的仿射变换参数进行估计并消除错配,通过构建区域相关图确定完整的复制粘贴区域;最后根据对复制粘贴区域分别估计的JPEG双重压缩偏移量区分复制区域和篡改区域。与经典SIFT和SURF(speeded up robust features)的检测方法相比,本文方法在实现较高检测率的同时,有效降低了检测虚警率。当第2次JPEG压缩的质量因子大于第1次时,篡改区域的检出率可以达到96%以上。 本文方法可以有效定位JPEG图像的区域复制篡改区域,并且对复制区域的几何变换以及常见的后处理操作具有较强的鲁棒性。  
      关键词:JPEG图像;双重压缩;偏移量估计;区域复制;篡改检测   
      2898
      |
      564
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114705 false
      更新时间:2024-05-07

      图像分析和识别

    • 基于非对称局部梯度编码的人脸表情识别

      胡敏, 程轶红, 王晓华, 任福继, 许良凤, 黄晓音
      2015, 20(10): 1313-1321. DOI: 10.11834/jig.20151004
      摘要:针对局部梯度编码算子(LGC)只能在固定大小邻域内提取图像纹理特征的不足,提出了一种非对称邻域LGC算子(AR-LGC)多尺度融合的表情特征提取方法。首先,对归一化的表情图像进行Gauss滤波处理;然后,对图像进行分块,对每个子块图像中每一像素点,采用不同邻域大小的AR-LGC算子得到两个二进制序列,将两个序列作按位逻辑异或得到一个新的序列,对此序列进行编码,计算每个子块的直方图分布,级联各子块直方图构成人脸表情的特征;最后用SVM分类器进行表情分类识别。该算法在JAFFE库和CK库上进行实验,分别取得了95.24%和96.83%的平均识别率,并与CBP(中心化二值模式)、LBP(局部二值模式)、LGC和AR-LBP(非对称局部二值模式)算法进行了比较,在JAFFE库的平均识别率分别比CBP、LBP、LGC、AR-LBP高5.6%、4.85%、3.71%、2.40%,在CK库的平均识别率分别比CBP、LBP、LGC、AR-LBP高3.66%、2.50%、2.17%、1.66%,实验结果表明,该算法可以较准确地进行人脸表情识别。本文所提的表情特征提取方法通过融合不同梯度不同尺度子邻域间的强度关系,可以很好地表达图像的局部特征和全局特征,与典型的特征提取算法的对比实验也表明了本文算法的有效性,表明本文算法适用于静态人脸表情图像的识别。  
      关键词:表情识别;非对称局部梯度编码;特征提取;多尺度融合;支持向量机(SVM)   
      3215
      |
      448
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116454 false
      更新时间:2024-05-07
    • 采用积分图块间距离检测图像边缘

      贾迪, 孟琭, 孙劲光, 李思慧, 赵明远
      2015, 20(10): 1322-1330. DOI: 10.11834/jig.20151005
      摘要:边缘是图像的重要特征之一,是后续测量、基于形状配准的基础,为了更好地获得图像中的边缘信息,提出一种利用积分图块间距离检测图像边缘的方法。首先,分析欧氏距离图理论,给出采用局部区块内和距离的方式检测图像边缘的方法。其次,提出采用积分图完成高斯模板块内求和算法,并利用这种方法加速完成了图像块内像素求和,以此提高算法的执行速度。最后,给出了本文算法的执行流程。以人工标注模拟图像的边缘为标准,采用本文方法得到的边缘检测结果重叠率高于97%,Canny算法的重叠率为80%、高斯曼哈顿距离与欧式距离算法的重叠率分别低于63%和28%。从真实图像实验结果上看,随着图像尺寸的增加,Canny与本文方法的执行时间均略有增加,但幅度不大,在处理1024×768的图像时分别耗时1.7 s与4.6 s。由于本文方法增加了积分图及块内和的求解,因此耗时略高于Canny方法。综上,采用本文方法获得的边缘检测结果不仅具备较高的重叠率,而且执行时间较少,其执行速度不会随图像尺寸的增加而大幅度降低。由实验结果可见,本文提出的图像边缘检测方法具备较高的准确性与实用性。由于本文方法具备较高的执行速度,因此适用于所有以边缘检测结果为基础的后期图像处理技术,包括对于实时性要求较高的视频流边缘检测与分析。  
      关键词:边缘检测;欧氏距离;曼哈顿距离;积分图;距离图   
      3006
      |
      485
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115701 false
      更新时间:2024-05-07
    • 自适应属性加权2维FCM分割算法

      侯晓凡, 吴成茂
      2015, 20(10): 1331-1339. DOI: 10.11834/jig.20151006
      摘要:为了提高2维直方图模糊C均值聚类分割算法的抗噪性和普适性,提出了属性加权2维直方图模糊C均值聚类分割新方法。针对2维直方图模糊C均值聚类分割算法存在阈值参数选取不当导致抗噪性能差的不足,将属性加权引入2维直方图模糊C均值聚类并有效解决了每维属性聚类贡献度的问题。本文算法相比2维直方图模糊C均值聚类分割法抗椒盐和高斯噪声性能平均提高了2~3 dB;同时,相比模糊局部C均值聚类分割法抗椒盐噪声性能平均提高了2~3 dB且抗高斯噪声性能稍差大约1 dB,但本文算法相比模糊局部C均值聚类分割法的速度平均提高了大约40倍。实验结果表明,本文算法相比现有2维直方图模糊C均值聚类算法更适合噪声图像分割;同时,相比模糊局部C均值聚类算法更有利于实时性要求较高场合的目标跟踪和识别等需要。同时从大量图像测试得出,本文算法对于一般人工合成图像、智能交通图像及遥感图像等具有普遍适用性。  
      关键词:模糊C均值聚类;直方图;属性加权;图像分割   
      3249
      |
      293
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115469 false
      更新时间:2024-05-07
    • 利用层间相关性的岩心CT图像半自动分割方法

      徐永进, 滕奇志, 吴晓红, 卿粼波
      2015, 20(10): 1340-1345. DOI: 10.11834/jig.20151007
      摘要:由于岩心CT图像分辨率不高,目标边界较为模糊,无法完全自动化地对岩心CT图像的目标分割和提取。为保证效果,在分割过程中往往需要进行人为干预。但作为3维重建的岩心CT图像,图像数据规模较大,达到成百上千帧。如果对每一帧都进行人为干预,工作量将会很大。针对这种情况提出一种在保证分割效果的前提下只需进行少量人为干预的高效实用的分割方法。先对CT图像中的某一帧设定分割阈值,利用CT图像层间相关性对相邻帧自动计算合适的分割阈值,从而分割出整个CT图中的目标。并根据需要,选定其中分割效果较好的一帧,其他帧根据此帧进行自动区域生长修复,从而更加完善分割效果。还可以手工修复其中一帧中的目标,其余帧的所有相关目标将会自动进行识别和修复。通过对多组不同数据规模和分辨率的岩心CT图像进行实验测试,使用本文方法均可达到期望的分割效果,并且分割速度较大津分割法提高近1倍,与固定阈值分割方法速度相当。岩心CT图像分割方法充分利用图像层间相关性,可快速有效地批量提取具有连续性的序列图像中的目标。  
      关键词:直方图;岩石;CT图像;区域生长;阈值分割   
      3066
      |
      267
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56117053 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 在线特征选取的多示例学习目标跟踪

      周志宇, 彭小龙, 吴迪冲, 朱泽飞
      2015, 20(10): 1346-1357. DOI: 10.11834/jig.20151008
      摘要:传统的多示例学习跟踪在跟踪过程中使用了自学习过程,当目标跟踪失败时分类器很容易退化。针对这个问题,提出一种基于在线特征选取的多示例学习跟踪方法(MILOFS)。首先,该文使用稀疏随机矩阵来简化视频跟踪中图像特征的构建,使用随机矩阵投影来自高维度的图像信息。然后,利用Fisher线性判别模型构建包模型的损失函数,依照示例响应值直接在示例水平构建分类器的判别模型。最后,从梯度下降角度看待在线增强模型,使用梯度增强法来构建分类器的选取模型。对不同场景的图像序列进行对比实验,实验结果中在线自适应增强(OAB)、在线多实例学习跟踪(MILTrack)、加权多实例学习跟踪(WMIL)、在线特征选取多实例学习跟踪(MILOFS)的平均跟踪误差分别为36像素、23像素、24像素、13像素,本文算法在光照变化、发生遮挡,以及形变的情况下都能准确跟踪目标,且具有很高的实时性。基于在线特征选取的多示例学习跟踪,跟踪过程使用梯度增强法并直接在示例水平构建包模型的判别模型,可以有效克服传统多示例学习中的分类器退化问题。  
      关键词:目标跟踪;多示例学习;Fisher线性判别;梯度增强;判别模型   
      2873
      |
      815
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115548 false
      更新时间:2024-05-07
    • 融合外观和运动特征的在线目标分割

      张雷, 李成龙, 汤进, 高思晗
      2015, 20(10): 1358-1365. DOI: 10.11834/jig.20151009
      摘要:视频中的目标分割是计算机视觉领域的一个重要课题,有着极大的研究和应用价值。为此提出一种融合外观和运动特征的在线自动式目标分割方法。首先,融合外观和运动特征进行目标点估计,结合上一帧的外观模型估计出当前帧的外观模型。其次,以超像素为节点构建马尔可夫随机场模型,结合外观模型和位置先验把分割问题转化为能量最小化问题,并通过Graph Cut进行优化求解。最后,在两个数据集上与5种标准方法进行了对比分析,同时评估了本文方法的组成成分。本文算法在精度上至少比其他的目标分割算法提升了44.8%,且具有较高的分割效率。本文通过融合外观与运动特征实现在线的目标分割,取得较好的分割结果,且该方法在复杂场景中也具有较好的鲁棒性。  
      关键词:特征融合;MRF模型;在线分割;自动分割   
      3159
      |
      472
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116417 false
      更新时间:2024-05-07
    • 基于RGB-D深度相机的室内场景重建

      梅峰, 刘京, 李淳芃, 王兆其
      2015, 20(10): 1366-1373. DOI: 10.11834/jig.20151010
      摘要:重建包含真实纹理的彩色场景3维模型是计算机视觉领域重要的研究课题之一,由于室内场景复杂、采样图像序列长且运动无规则,现有的3维重建算法存在重建尺度受限、局部细节重建效果差的等问题。以RGBD-SLAM 算法为基础并提出了两方面的改进,一是将深度图中的平面信息加入帧间配准算法,提高了帧间配准算法的鲁棒性与精度;二是在截断符号距离函数(TSDF)体重建过程中,提出了一种指数权重函数,相比普通的权重函数能更好地减少相机深度畸变对重建的影响。本文方法在相机姿态估计中带来了比RGBD-SLAM方法更好的结果,平均绝对路径误差减少1.3 cm,能取得到更好的重建效果。本文方法有效地提高了相机姿态估计精度,可以应用于室内场景重建中。  
      关键词:RGB-D深度相机;同时定位与地图构建;相机姿态估计;3维重建   
      4375
      |
      393
      |
      7
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114864 false
      更新时间:2024-05-07

      计算机图形学

    • 带平台伸缩函数的参数曲线变形

      张莉, 余慧芳, 檀结庆
      2015, 20(10): 1374-1383. DOI: 10.11834/jig.20151011
      摘要:随着科学技术的快速发展,曲线的几何造型技术开始成为近来的热点研究方向.为了获得更多的变形效果,面向2维、3维参数曲线和自由曲线变形,提出一种带平台伸缩函数的变形方法。有别于现有的大多数自由变形算法,首先构造了一种形式简洁的多项式形式伸缩函数;其次借助于伸缩函数,构造了含有伸缩参数与光滑参数的新型伸缩因子,算法表明,这种新型伸缩因子具有单点峰值性、区间峰值性、对称性等优良性质;最后将伸缩因子所构造变形矩阵作用于待变形的曲线,通过控制变形区间、伸缩参数、光滑参数以及变形方向,可以获得整体的、局部的、周期的、伸缩的等各类丰富的图形效果。此变形操作对造型系统中的主流参数曲线(Bézier和NURBS)具有封闭性;通过大量数值实例表明了该方法计算量小,可控性强,重复使用可以得到形状多样、具有艺术效果的轮廓线等效果。与其他方法相比,本文算法不仅可以用于一般的平面与空间参数曲线,也可以用于自由型曲线,扩大了多数自由变形算法的适用范围;由于伸缩函数具备单点峰值性、区间峰值性、对称性等性质,从而能够产生以前变形方法无法产生各类角点、尖点的特殊曲线,在一定程度上极大丰富了曲线的变形效果。  
      关键词:自由曲线;平台伸缩函数;区间峰值;自由变形   
      2450
      |
      233
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56117731 false
      更新时间:2024-05-07
    • 视景建模中树木纹理图像的随机变形网格方法

      施冠羽, 欧阳清
      2015, 20(10): 1384-1389. DOI: 10.11834/jig.20151012
      摘要:视景建模中,采用“公告板”贴图法对同树种不同个体树建模时,需生成各种形态各异的树木纹理图像,为此提出一种新的生成树木纹理图像的随机变形网格方法。首先将树木的原始纹理图像进行网格划分,再对网格顶点进行随机变形,最后将生成的不规则网格中的图像映射到新图像中相应的规则网格上,得到变形后的纹理图像。应用随机参数控制树木图像的变形,模拟出成长环境因素对树木形态的影响。本文方法比采集多幅个体树图像贴图方法更简便,容易实现;比用同一幅图像进行多个个体贴图的视觉效果更真实。本文方法生成的树木纹理图像应用于“公告板”贴图时,在视景模型中能较好地模拟出同一树种的多个个体树情景。该方法基于图像的局部变形,仍然保持原始图像内容的整体基本形态和内部结构的连续性,因此,同样适用于其他不规则形状的自然景物(如山峦、河流、海浪等)的图像处理。  
      关键词:视景建模;树木纹理图像;随机变形;树木形态   
      2797
      |
      243
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116510 false
      更新时间:2024-05-07
    • 基于表情传输的交互式照片编辑

      刘锦云, 彭宏京
      2015, 20(10): 1390-1402. DOI: 10.11834/jig.20151013
      摘要:生活中照片拍摄时难以捕捉到所有人脸表情最佳的时刻,多次摆拍不仅费时,而且可能会错过某些场景,传统的后期编辑软件不具备针对性,且操作复杂。针对人物照片中部分人脸表情不佳的情况,提出一种基于表情传输的交互式照片编辑算法。首先将包含源人脸的照片与具有目标表情人脸的照片进行特征点检测,通过交互将指定人脸部分选出并将其姿态归正为眼睛在同一水平线上,如果目标人脸与源人脸身份相同,将目标人脸区域根据源人脸的轮廓以及左右半脸分布以扫描线变形得到替换目标;不相同时根据目标人脸特征点分布的几何特征计算源人脸中特征点的新位置,通过基于特征点变化的网格变形得到替换目标,最后利用二次光照与泊松融合将其无缝拼接到源图中。实验表明算法可以对人脸五官清晰且在宽容度内的人物照片进行表情编辑,处理结果只改变了人物的脸部表情,并且无明显拼接痕迹。提出了一种新型针对目标人脸不同身份信息的交互式表情传输模型,该模型可以适应不同的编辑条件与要求,效果出色。  
      关键词:表情映射;特征点检测;二次光照;泊松融合   
      2506
      |
      239
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115662 false
      更新时间:2024-05-07

      遥感图像处理

    • 结合张量投票和Snakes模型的SAR图像道路提取

      符喜优, 张风丽, 王国军, 邵芸
      2015, 20(10): 1403-1411. DOI: 10.11834/jig.20151014
      摘要:Snakes模型对曲线轮廓具有良好的拟合能力,被广泛应用于遥感图像的道路提取。但SAR图像受乘性斑点噪声影响严重,因此利用Snakes模型从SAR图像提取道路时,传统的以图像灰度负梯度为外部能量的方法难以取得理想结果。针对这一问题,利用计算机视觉中的张量投票算法可以从噪声掩盖的图像中提取显著结构特征的特点,将张量投票与Snakes模型结合从SAR图像提取道路。首先利用模糊C均值分割法从SAR图像中分割出道路类,然后对道路类进行张量投票获得每点的曲线显著性值,最后以该曲线显著性值的负值作为Snakes模型外部能量从SAR图像提取道路。在Snakes模型能量最小化阶段,提出了一种优化的拟合策略,一边内插节点一边最小化Snakes模型能量。利用机载和星载不同场景的SAR图像进行实验,与同类的基于Snakes模型的半自动方法相比,本文方法对曲率较大的道路仅需较少控制点即可取得较好的拟合效果;与基于MRF模型的自动方法相比,本文方法对道路提取的完整率、正确率、检测质量都优于基于MRF模型的方法,并且提取的时间远远快于基于MRF模型的方法,对于大范围的道路网提取将更为实用。本文方法充分考虑到道路的几何形态特征,利用张量投票算法对该特征进行量化,并利用优化的拟合策略来最小化Snakes模型能量来提取道路。基于机载和星载SAR图像的实验表明本文方法可以较好地提取不同场景中的主要道路目标和道路网。  
      关键词:张量投票;计算机视觉算法;显著性;Snakes模型;SAR图像;道路提取   
      3774
      |
      307
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115084 false
      更新时间:2024-05-07
    • GPU Tessellation全球地形可视化方法

      李尚林, 郑利平, 张迎凯, 李琳
      2015, 20(10): 1412-1421. DOI: 10.11834/jig.20151015
      摘要:目前全球大规模地形可视化问题基本都衍生于分块LOD(level of detail)方法,该方法在快速地表漫游中依然存在GPU-CPU的数据传输瓶颈,其基于裙边的缝隙修复方法既需要额外资源,还存在依然无法完全消除的痕迹。为解决这些问题,提出了一种GPU网格生成的地形可视化方法。结合GPU Tessellation方法、基于视点与屏幕空间误差的LOD方法、局部坐标系渲染等算法,使得全球地形可视化的生成效率有明显提高。实现了一个全球地形可视化系统GTVS,提供全球高精度地形数据与多分辨率高清卫星影像数据的调度与渲染等。论文对该系统进行了详实的实验和数据分析,相比传统基于GPU的分块LOD方法,FPS(frames per second)提升100%以上,很好地解决了系统瓶颈问题。结果表明所提方法实用、鲁棒、扩展性好,可广泛地适用于大规模的全球渲染系统中。  
      关键词:全球可视化;地形渲染;GPU渲染;GPU Tessellation;动态局部坐标系   
      3252
      |
      199
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114840 false
      更新时间:2024-05-07
    0