最新刊期

    2012 17 6

      综述

    • 人脸图像的年龄估计技术研究

      王先梅, 梁玲燕, 王志良, 胡四泉
      2012, 17(6): 603-618. DOI: 10.11834/jig.20120601
      摘要:年龄信息作为人体的一种重要生物特征,在安全监控、人机交互、视频检索等领域有着巨大的应用潜力,并且是人脸识别技术的主要瓶颈问题之一。基于人脸图像的年龄估计技术作为一种新兴的生物特征识别技术,目前已经成为计算机视觉、人机交互等领域的一个重要研究课题。为此对国内外近几年来在年龄估计技术方面的发展情况进行了综述,主要包括年龄特征提取与年龄分类模式两大部分。同时对常用的年龄数据库、性能评价指标进行了总结,并在此基础上对当前的一些年龄估计系统的性能进行了对比。最后,对基于人脸图像的年龄估计技术所面临的挑战以及可能的发展方向进行了讨论。  
      关键词:人脸衰老;年龄估计;年龄特征提取;年龄分类模式;年龄数据库   
      5041
      |
      300
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126969 false
      更新时间:2024-05-08
    • 图像统计模型参数估计中的期望最大值算法

      李旭超
      2012, 17(6): 619-629. DOI: 10.11834/jig.20120602
      摘要:期望最大值算法是近年来图像统计模型参数估计技术领域的研究热点之一。在对期望最大值算法分析的基础上,结合其在图像统计模型参数估计中的应用研究,对改变标准期望最大值算法的3种方式进行比较分析。结合图像恢复、分割、目标跟踪以及与其他优化算法的融合应用,从丢失数据集的选取、丢失数据集和不完全数据集统计模型的建立,以及统计模型参数估计3个方面,评述期望最大值算法优缺点。丢失数据的选取和不完全数据的描述形式直接决定期望最大值算法的结构和计算复杂度,以致算法的成败。最后,讨论期望最大值算法目前存在的问题及未来的发展方向,指出其在具有丢失数据统计模型参数估计中广泛应用。  
      关键词:期望最大值算法;图像统计模型;参数估计;进化算法   
      3575
      |
      151
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127206 false
      更新时间:2024-05-08

      图像处理和编码

    • 鲁棒的梯度驱动图像修复算法

      叶学义, 王靖, 赵知劲, 陈华华
      2012, 17(6): 630-635. DOI: 10.11834/jig.20120603
      摘要:数字图像形态特征的修复目前主要采用基于梯度驱动的偏微分方程(PDE)作为计算模型。虽然该类模型对较大区域的形态特征修复具有明显优势,但是修复过程中信息传播方向不确定使得它对修复对象具有选择性。在分析该类模型在图像修复中的计算本质和对应物理意义的基础上,结合典型仿真实验,认为保持信息传播方向始终指向待修复区域之外对修复结果具有决定性影响,并由此提出一种梯度驱动图像修复的新算法。实验结果表明,该算法能够保持信息传播方向的稳定,使得修复具有更强的鲁棒性。  
      关键词:数字图像修复;偏微分方程;梯度驱动;信息传播方向   
      3247
      |
      155
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126833 false
      更新时间:2024-05-08
    • 快速去块效应的线性规划方法

      金剑秋, 刘春晓, 王勋, 章志勇
      2012, 17(6): 636-643. DOI: 10.11834/jig.20120604
      摘要:许多现有的图像压缩算法在高压缩比下会产生恼人的块效应,消除块效应的后处理方法一直以来都是图像处理领域的重要研究方向。消除块效应可以认为是从不准确的采样数据出发,尽可能恢复原始图像,这也是压缩传感理论所做的。因此利用压缩传感理论,给出了一种新的去块效应方法,将去块效应问题归结为一个无需调校任何其他参数的线性规划问题,最终采用GPU实现,得以快速求解。大量的实验结果表明,该方法能快速有效地去除块效应,改善了图像的视觉效果,同时提高了图像的PSNR。  
      关键词:去块效应;压缩传感理论;图形处理单元(GPU);曲波变换;线性规划   
      2943
      |
      103
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126864 false
      更新时间:2024-05-08
    • DWT-SVD域全盲自嵌入鲁棒量化水印算法

      叶天语
      2012, 17(6): 644-650. DOI: 10.11834/jig.20120605
      摘要:引入自嵌入技术提出一种DWT-SVD域全盲鲁棒量化水印算法,只需借助攻击图像进行版权认证。对原始图像先进行DWT,将小波低频子带分成互不重叠的子块,对每个子块进行SVD,通过对比相邻两个子块最大奇异值的大小关系产生特征水印序列,然后将选定的自嵌入特征水印序列通过奇偶量化规则自嵌入原始图像小波低频子带每个子块的最大奇异值,最后进行SVD合成和IDWT产生含水印图像。算法具有良好的不可见性和安全性,并且通过结合自嵌入特征水印序列和盲提取认证水印序列达到全盲检测。实验结果表明,算法具有较强的抵抗添加高斯噪声、添加椒盐噪声、高斯低通滤波、中值滤波、剪切、JPEG压缩和混合攻击的鲁棒性。  
      关键词:数字水印;量化水印;全盲检测;自嵌入技术;鲁棒性   
      3329
      |
      99
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126745 false
      更新时间:2024-05-08
    • Mean-shift滤波和直方图增强的图像弱边缘提取

      冀峰, 高新波, 谢松云
      2012, 17(6): 651-656. DOI: 10.11834/jig.20120606
      摘要:准确定位大脑中的功能区域需要我们对fMRI图像中头骨等生物组织精确提取,但由于核磁共振仪等现有条件的限制,头骨等弱边缘信息难于提取。针对这一问题,提出一种弱边缘提取的有效方法。首先利用Mean-shift聚类特性,在不损失目标信息的情况下,削弱图像中的噪声干扰;根据滤波后像素灰度的区域分布特性,对头骨区域进行直方图增强,最后应用边缘检测算法将头骨边缘提取出来。实验的结果表明,该方法可以有效地将fMRI图像中的头骨弱边缘信息提取出来。  
      关键词:弱边缘提取;均值位移算法;直方图增强;功能核磁共振图像   
      3438
      |
      216
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126132 false
      更新时间:2024-05-08

      图像分析和识别

    • 梯度点对约束的结构化车道检测

      王永忠, 王晓云, 文成林
      2012, 17(6): 657-663. DOI: 10.11834/jig.20120607
      摘要:车道检测是无人驾驶车辆及车道偏离预警等系统的关键技术。针对复杂道路环境中,阴影、路面破损及车辆遮挡等常造成车道检测不准确的问题,提出利用结构化道路两侧车道线上常具有相反方向梯度的性质,将两侧车道线的检测转化为梯度点对约束下的车道中线及宽度检测。然后分别采用平行透视投影模型及线性双曲线模型,通过Hough变换获得了对车道消失点、宽度及车道中线等参数的估计,最终实现了对不同形状结构化车道的检测。比较了本文算法与其他两种车道检测算法在不同复杂道路环境下的车道线检测性能,结果表明了本文算法的有效性。  
      关键词:车道线检测;梯度点对约束;线性双曲线模型;平行透视模型;Hough变换   
      3525
      |
      99
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126006 false
      更新时间:2024-05-08
    • 多水平外区抑制的轮廓检测

      闫超, 张建州
      2012, 17(6): 664-670. DOI: 10.11834/jig.20120608
      摘要:提取自然图像中的物体轮廓是机器视觉研究的重要问题,主要困难在于自然图像中的纹理性边缘严重干扰了物体轮廓的提取。研究表明视皮层方位选择性神经元的非经典感受野机制使得人类视觉系统在处理自然图像时不仅能够抑制纹理性边缘,而且能够增强物体的轮廓。基于此人们提出多种仿生轮廓检测算法,但算法中被称为抑制水平的参量在取值较高时会漏检部分轮廓,而在其取值较低时又会引入过多的纹理性边缘。针对这一问题,提出多水平外区抑制轮廓检测算法,通过整合各级单水平外区抑制的检测信息,有效抑制了纹理性边缘和降低了漏检轮廓的可能性。实验结果表明,相对于传统算法,新算法在轮廓检测性能上提高了10%左右,并具有更好的稳健性。  
      关键词:轮廓检测;纹理性边缘;非经典感受野;多水平抑制   
      3055
      |
      108
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127298 false
      更新时间:2024-05-08
    • 基于局部投影与块LBP特征的图像检索

      邹彬, 潘志斌, 胡森
      2012, 17(6): 671-677. DOI: 10.11834/jig.20120609
      摘要:首先将投影方法运用于图像局部子块,并与矢量量化技术相结合,得到投影矢量索引直方图特征,能够有效提取图像的颜色分布、空间关系等信息;其次,提出基于块基元的LBP纹理特征算法,既能有效提取块基元的结构模式,又能避免传统基于单像素LBP模板的不稳定性,并大幅减少了计算量;最后,基于显著图提出了划分显著区域和非显著区域的特征提取方案,使得分别提取的特征更富于视觉意义。实验结果表明,本文算法相对于传统索引直方图方法在性能上有较大的提高,平均查准率平均提高幅度为6.39%。  
      关键词:图像检索;Bitmap特征;投影矢量;LBP特征;显著图   
      2972
      |
      153
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127434 false
      更新时间:2024-05-08

      图像理解和计算机视觉

    • 视觉陌生度驱动的增量自主式视觉学习算法

      瞿心昱, 姚明海, 顾勤龙
      2012, 17(6): 678-686. DOI: 10.11834/jig.20120610
      摘要:针对传统机器学习框架下设计智能机器人造成的视觉任务执行时学习主动性差、对不确定情况适应性差、知识与能力扩展性差等问题,立足近年来新提出的认知发育思想,提出一种由视觉陌生度驱动的增量自主式视觉学习算法。算法根据在线主成分分析(PCA)计算视觉陌生度,作为Q学习内部动机,以PCA子空间的更新作为知识的主动学习与积累,并由以视觉陌生度为内部动机的Q学习引导,使得机器人能根据所学知识与所"见"场景的陌生程度来决策下一步如何学习。实验结果表明,该算法具有自主探索与学习性能、主动引导机器人学习新知识的能力,以及在线、增量地获取积累知识并发育其智能的能力。  
      关键词:认知发育;内部动机;视觉陌生度;在线主成分分析;Q学习   
      3397
      |
      79
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127046 false
      更新时间:2024-05-08
    • 霍夫空间中多足球机器人协作目标定位算法

      许家铭, 解仑, 王志良, 倪善超
      2012, 17(6): 687-695. DOI: 10.11834/jig.20120611
      摘要:针对嵌入式仿人足球机器人提出一种霍夫空间中的多机器人协作目标定位算法。机器人利用实验场地中的标志物采用基于三角几何定位方法进行自定位,把机器人多连杆模型进行简化, 通过坐标系位姿变换把图像坐标系转换到世界坐标系中,实现机器人目标定位;在多机器人之间建立ZigBee无线传感器网络进行通信,把多个机器人定位的坐标点进行霍夫变换, 在霍夫空间中进行最小二乘法线性拟合, 获取最优参数,然后融合改进后的粒子滤波实现对目标小球的跟踪;最后在21自由度的仿人足球机器人上进行仿真和实验。数据结果表明, 这种多机器人协作的定位算法的精度提高了约48%, 在满足实时性的前提下, 对目标的跟踪效果也得到了改善。  
      关键词:仿人足球机器人;霍夫空间;目标定位;多机器人协作;粒子滤波   
      3255
      |
      96
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125872 false
      更新时间:2024-05-08

      计算机图形学

    • 虚拟CCD线阵星载光学传感器内视场拼接

      张过, 刘斌, 江万寿
      2012, 17(6): 696-701. DOI: 10.11834/jig.20120612
      摘要:以基于虚拟CCD线阵的多CCD影像重成像算法作为内视场拼接的技术手段,在对由地形起伏引起的多CCD影像的拼接误差进行理论分析和推导的基础上,提出无需数字高程模型(DEM)的虚拟CCD线阵多CCD影像重成像算法;并提出使用基于严密成像几何模型的空间前方交会的方法直接评价影像拼接对摄影测量生产的精度影响。研究表明,在虚拟CCD"安装"位置与真实CCD位置偏差不大的情况下,使用成像区域的平均高程进行拼接即可满足几何无缝拼接的需求;而在虚拟CCD"安装"位置与真实位置的偏离超过限差的情况下,可以用航天飞机雷达地形测绘DEM(SRTM-DEM)等一定精度的DEM数据校正地形起伏引起的拼接误差。使用先进陆地观测卫星(ALOS)卫星全色遥感立体测绘仪(PRISM)传感器三线阵影像作为实验数据,对前视、下视和后视的多CCD影像分别进行拼接。对拼接线的判读结果表明,影像拼接效果良好。另外,分别对拼接前和拼接后的前视、后视影像选取同名点进行空间前方交会,拼接后影像的空间前方交会精度与拼接前影像的空间前方交会精度一致。本文方法,可以无需DEM进行ALOS PRISM的内视场拼接,并使得拼接后影像的立体测图精度无损;拼接误差分析方法也可以在航空相机影像拼接中推广。  
      关键词:虚拟CCD线阵;内视场拼接;空间前方交会;先进陆地观测卫星(ALOS);全色遥感立体测绘图(PRISM)   
      4624
      |
      96
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126409 false
      更新时间:2024-05-08

      “第八届数字电视与无线多媒体通信国际论坛”会议栏目

    • 追踪盗版者的抗共谋数字指纹

      李晓强, 张煌, 赵洋洋, 汪晶晶
      2012, 17(6): 702-706. DOI: 10.11834/jig.20120613
      摘要:利用数字指纹能够追踪非法使用多媒体内容用户。为此提出一种结合OFFO(正交向量构造最优聚焦指纹)指纹和BIBD(均衡不完全区组设计)编码的数字指纹方案。该方案以连续型OFFO指纹为基向量原型,并在保持不同指纹码间距离不变的情况下把连续型指纹量化为二值指纹,然后利用BIBD编码构造出新的多层编码指纹方案。理论分析和实验结果表明,与同类指纹方案相比,新的指纹方案在用户容量相同的情况下有更好的抗共谋攻击能力。  
      关键词:数字指纹;OFFO;BIBD;盗版追踪;共谋攻击   
      4953
      |
      88
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127319 false
      更新时间:2024-05-08
    • LBP与鉴别模式结合的热红外人脸识别

      谢志华, 伍世虔, 方志军
      2012, 17(6): 707-711. DOI: 10.11834/jig.20120614
      摘要:为了提取具有鉴别能力的红外人脸图像局部结构特征,提出一种基于LBP(local binary pattern)鉴别模式的红外人脸识别方法。传统的LBP均匀模式,提取自然图像中占主导地位的信息用于识别,但占主导地位的信息不一定是最适合识别的。为了提取有效的鉴别模式特征,基于监督学习的思想,在LBP模式下引入可分性标准,对不同LBP模式进行有效的模式选择,从而抽取适合识别的鉴别模式。最后,为了利用人脸的空间位置信息,结合分块和直方图技术得到最后的识别特征。实验结果表明,本文鉴别模式可以提取更适合识别的特征,识别性能优于传统的基于均匀模式的LBP方法。  
      关键词:局部二进制模式(LBP);红外人脸识别;模式选择;可分性(SD);鉴别模式   
      4764
      |
      110
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126470 false
      更新时间:2024-05-08
    • 电影中复杂事件的检索与识别

      杜吉祥, 郭一兰, 翟传敏
      2012, 17(6): 712-716. DOI: 10.11834/jig.20120615
      摘要:提出一种基于局部时空兴趣点的电影中复杂事件检索与识别的方法。先将一个独立的事件视频序列表示成一个自组织映射像密度图,再将此密度图与支持向量机相结合用于识别事件。该方法使用局部时空特征描述子来捕捉视频中的局部事件,可以适应事件的模式的不同的大小和速度。为了验证该方法的有效性,使用公开的Hollywood视频数据库,其中的镜头序列收集自32部不同的Hollywood电影,包含了8个事件类别。综合实验,得到平均正确率、平均查准率和平均查全率分别为0.601、0.530和0.566。实验结果表明本文方法明显提高了平均正确率和平均查准率。  
      关键词:局部时空兴趣点;局部时空特征;自组织特征映射;事件识别   
      4420
      |
      82
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127359 false
      更新时间:2024-05-08
    • 方向特征和网格特征融合的离线签名鉴别

      杨丹凤, 吕岳
      2012, 17(6): 717-721. DOI: 10.11834/jig.20120616
      摘要:离线签名鉴别是一种重要的生物特征识别技术,提出了基于方向特征和网格特征融合的方法。网格特征广泛使用在图像的特征提取中,方向特征和网格特征结合不仅可以描述签名图像特殊点的方向和位置,还可以统计方向位置分布信息。两种特征组合会形成高维特征,然后使用主成分分析法进行降维,采用支持向量机作为分类器。该方法在签名数据库上进行评估,其结果表明,该方法能有效的提高离线签名鉴别的正确率。  
      关键词:离线签名鉴别;方向特征;网格特征;融合;支持向量机   
      4429
      |
      107
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126385 false
      更新时间:2024-05-08
    • 视觉关注度的立体图像质量评价

      张艳, 安平, 张秋闻, 张兆杨
      2012, 17(6): 722-725. DOI: 10.11834/jig.20120617
      摘要:立体图像质量评价对立体视频技术的发展起着非常重要的作用。常用的PSNR(峰值信噪比)方法不能反映人类视觉感知特性,也不能直接应用到立体图像质量评价中。针对人类视觉对立体图像深度感知和重点关注感兴趣区的特点,提出基于纹理图和深度图感兴趣区的质量评价方法。首先对纹理图和对应的深度图利用视觉关注度提取工具提取感兴趣区,然后在评价的过程中对各感兴趣区根据感兴趣程度分配基于像素的权重系数,最后将权重系数应用在立体图像的各个区域中进行评价。实验结果表明该方法得到的立体图像质量客观评价结果与主观评价结果之间具有更好的一致性,符合人眼视觉系统感知特性。  
      关键词:视觉关注度;立体图像质量评价;深度感知;感兴趣区   
      5115
      |
      116
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126623 false
      更新时间:2024-05-08
    • 低开销的异构数据交换

      赵凯, 赵正德
      2012, 17(6): 726-729. DOI: 10.11834/jig.20120618
      摘要:随着计算机技术与Internet的普及应用,数据库应用得到飞速发展。然而在计算机应用领域不断优化升级、更新换代和整合时,异构数据环境下的数据很难得到重用,形成不利于数据共享的"信息孤岛"。本文以XML(可扩展标记语言)作为异构数据交换的载体,采用Java平台环境J2EE和Java开源库Dom4j实现异构数据交换的方法,有效地解决了异构环境下关系数据库数据交换问题,在保证完整性的前提下,为用户提供灵活和低开销的异构数据管理方案。  
      关键词:异构数据;数据交换;可扩展标记语言(XML);关系数据库   
      3976
      |
      61
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126551 false
      更新时间:2024-05-08
    • 灵活的多视点视频编码预测结构

      张艳, 蔡灿辉
      2012, 17(6): 730-735. DOI: 10.11834/jig.20120619
      摘要:多视点视频的时空相关性不仅随着序列的变化而改变,而且视频序列内的相关性特征随着时间的推移也会发生变化,固定的预测结构难以适应复杂情况下多视点视频编码的各种要求。在分析分层B帧预测结构和多视点视频图像中当前帧及其参考帧之间时间相关性和视点间相关性的基础上,提出一种灵活的预测编码结构,根据该多视点视频的时间及视点间相关关系和当前帧与其时间参考帧之间的距离来确定该帧是否采用耗时的视点间预测。实验结果表明,与分层B帧的改进算法——可扩展性预测结构多视点编码算法相比,本文算法在保证编码效率基本不变的前提下,编码复杂度降低了约45%,随机访问性能提高28%,解码图像缓冲区要求降低46%左右。  
      关键词:多视点视频编码;预测结构;时空相关性;随机访问性能;解码图像缓冲区   
      4721
      |
      69
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126505 false
      更新时间:2024-05-08
    • 跨层反馈在无线视频自适应编码中的应用

      王垚中, 郑世宝, 张重阳, 刘勃
      2012, 17(6): 736-739. DOI: 10.11834/jig.20120620
      摘要:为提高压缩后视频在无线信道中的容错能力,结合当前无线通信系统中广泛使用的自适应调制编码(AMC)技术和自动重传请求(ARQ)技术,提出一种新的基于跨层反馈的自适应编码方案。利用该设计方案,应用层可以利用底层的反馈信息感知到当前的信道变化并调整相应的码控策略来提高视频传输的鲁棒性。实验结果表明,与没有利用跨层反馈的其他方法相比,本文编码策略能提供更好的视频传输质量。  
      关键词:无线视频传输;自适应调制;跨层反馈;自适应调制编码(AMC);自动重传请求(ARQ)   
      4141
      |
      63
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126362 false
      更新时间:2024-05-08
    0