最新刊期

    2013 18 2

      计算机视觉前沿论坛

    • 计算机视觉——探索行为理解,认知内心世界

      徐光祐, 刘允才, 章毓晋
      2013, 18(2): 131. DOI: 10.11834/jig.20130201
      摘要:人类发展的过程,是一个对人类自身和环境不断观察、认识、理解和改造的过程。观察人们的动作和行为进而理解他们的日标、意图、动机、态度等内心思想状态是正常成年人在人类社会中生存和发展所必需的生活能力,也是开发以人为中心的计算,使现代信息技术成为提高生活质量有力工具的基础。根据行为理解他人的内心世界—这是哲学家,心理学家和神经生理学家几个世纪以来一直着迷探索的难题。由于它的跨学科本质,对计算机信息技术和计算机视觉研究来说更是一个富有挑战性,同时又具有广泛应用的难题。  
        
      3487
      |
      432
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125207 false
      更新时间:2024-05-07
    • 跨学科前沿与应用的交汇点:日常活动理解

      徐光祐, 陶霖密, 邸慧军
      2013, 18(2): 132-140. DOI: 10.11834/jig.20130202
      摘要:人口老龄化是对当今大多数国家的未来产生重大影响的社会因素。为了解决由此而来的巨大经济和社会压力,目前现实可行的方法是依靠高度发展的信息和通信技术,自动识别和理解人们在家居环境下的日常活动(ADL),向老人提供日常生活辅助以尽可能地延长老人在家中独立生活的时间。由于日常生活发生的物理环境是非结构化的自然环境。ADL识别与理解的任务就是动态上下境下,在时间和空间上对用户的日常活动进行观察、处理、分析、推理和决策的过程。这本质上是要求系统具有类似人类的认知能力。因此,ADL的识别和理解是传统的信息处理方法特别是计算机视觉方法、认知计算和推理等基础理论研究,和未来老龄化社会重大应用的交汇点。开展ADL识别与理解的研究将有利于推动学科的发展和社会的进步。本文旨在讨论ADL的识别和理解中的技术挑战和基本科学问题,通过分析相关研究现状以及讨论与ADL识别需求之间的差距,为探索研究思路提供新的方向。  
      关键词:人口老龄化;智能辅助生活;日常活动;日常活动理解   
      3573
      |
      335
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126321 false
      更新时间:2024-05-07
    • 时空行为理解

      章毓晋
      2013, 18(2): 141-151. DOI: 10.11834/jig.20130203
      摘要:利用视觉信息了解世界是人类视觉和计算机视觉的共同目标。充分利用客观的时空信息,对场景中感兴趣目标的行为进行理解是近年计算机视觉的一个前沿研究内容。本文对该领域的基本情况、主要概念、研究焦点、典型技术、发展情况给予介绍,以期引起相关研究人员的关注,共同参与相关工作,推动计算机视觉的进展。  
      关键词:时空技术;动作基元;动作;活动;事件;行为;图像理解   
      4423
      |
      376
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56123885 false
      更新时间:2024-05-07
    • 视觉机制研究对机器视觉的启发示例

      李雄, 刘允才
      2013, 18(2): 152-156. DOI: 10.11834/jig.20130204
      摘要:研究灵长类的视觉系统机制并以此为基础设计机器视觉的算法已成为重要研究方向,并对机器视觉产生了重要的推动作用。本文从视觉机制和机器视觉方法的角度出发,分析了两大类视觉机制或模型,并列举受其影响和推动的多种重要机器视觉方法:1)合作学习和竞争学习机制,其中合作学习和竞争学习模型相关的机器视觉算法包括立体视觉算法、神经网络、稀疏编码;2)简单细胞和复杂细胞模型,相关的机器视觉算法包括HMAX特征、SIFT描述子和deep belief network。  
      关键词:灵长类动物的视觉机制;机器视觉方法;合作学习与竞争学习;简单细胞与复杂细胞   
      3346
      |
      388
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125576 false
      更新时间:2024-05-07
    • 视点无关的行为识别综述

      冯家更, 肖俊
      2013, 18(2): 157-168. DOI: 10.11834/jig.20130205
      摘要:目前,基于视觉的人体的行为识别是一个非常活跃的研究领域。它在智能监控、感知接口和基于内容的视频检索等领域具有广泛的应用前景,然而,一些困难仍然减慢了行为识别的发展,比如现实场景中动作往往是从任意角度拍摄。因此与视点无关的行为识别就十分重要,大量的研究者开始致力于行为识别的视点无关性。对视点无关的姿态与运动识别进行了综述。从基于时空特征的方法,基于状态空间的方法,基于降维的方法和基于运动轨迹的方法4个方面分析了研究进展情况,并列举了视点无关行为识别的公共数据集,评价了目前的研究情况,并对未来的研究提出了展望。  
      关键词:视点无关;行为识别;状态空间;降维;轨迹   
      3734
      |
      370
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126890 false
      更新时间:2024-05-07

      图像处理和编码

    • 基于演化算法的卷曲DCT图像压缩

      李康顺, 韦蕴珊, 张文生
      2013, 18(2): 169-175. DOI: 10.11834/jig.20130206
      摘要:卷曲离散余弦变换(WDCT)利用频率卷曲原理解决了离散余弦变换(DCT)模糊物体边缘的缺陷,但传统方法在选取WDCT频率卷曲参数时存在较大的难度。通过利用演化算法全局寻优的特点选取WDCT的频率卷曲参数,提出一种基于演化算法的WDCT图像压缩新算法(EAWDCT)。该算法针对频率卷曲参数特征,采用启发式方法设计染色体编码方式及演化算子,以加快收敛速度,最终达到快速准确的找到最优频率卷曲参数。实验结果表明,利用新的EAWDCT算法生成的WDCT矩阵能有效提高峰值信噪比、信噪比并减少均方根误差。  
      关键词:图像压缩;卷曲离散余弦变换;频率卷曲;演化算法   
      2908
      |
      253
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56123949 false
      更新时间:2024-05-07
    • 基于欧氏距离图的图像边缘检测

      张闯, 王婷婷, 孙冬娇, 葛益娴, 常建华
      2013, 18(2): 176-183. DOI: 10.11834/jig.20130207
      摘要:图像边缘检测技术直接影响以目标识别为目的的后续图像处理操作,有效地提取出图像中所携带的目标信息是图像边缘检测的主要目的。为了实现目标轮廓的有效提取,提出一种基于欧氏距离图的图像边缘检测算法。该方法计算图像内像素点之间的欧氏距离,得到图像的距离图,距离图很好地描述了图中景物的外部轮廓;对距离图进行改进的Canny算子边缘检测,可以有效地得到图中物体的轮廓。与一般的边缘检测算法相比,本文算法能够抑制过于细小和琐碎的细节,并能够准确地提取目标的整体轮廓信息,为后续目标识别奠定了良好基础。  
      关键词:欧氏距离;距离图;改进的Canny算子;边缘检测   
      5010
      |
      589
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56124005 false
      更新时间:2024-05-07
    • 基于暗原色先验模型的快速去雾算法

      张冰冰, 戴声奎, 孙万源
      2013, 18(2): 184-188. DOI: 10.11834/jig.20130208
      摘要:为了实时地消除图像中的雾气,提出了一种基于暗原色先验理论的快速去雾算法。改进了透射率修复方法,显著地减少了算法的计算量;通过自适应调节透射率下限值和大气光成分值,扩大了去雾处理的适用范围;对复原的图像进行增强处理,改善了复原图像的整体视觉效果。实验结果表明,本文算法能有效地去除图像中的雾气,同时提高了算法的处理速度,有利于算法的实时实现。  
      关键词:去雾;暗原色先验;透射率;图像增强   
      5650
      |
      462
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125274 false
      更新时间:2024-05-07

      图像分析和识别

    • Gabor特征集结合判别式字典学习的稀疏表示图像识别

      胡正平, 徐波, 白洋
      2013, 18(2): 189-194. DOI: 10.11834/jig.20130209
      摘要:稀疏编码中字典的选择无论对图像重建还是模式分类都有重要影响,为此提出Gabor特征集结合判别式字典学习的稀疏表示图像识别算法。考虑到Gabor局部特征对光照、表情和姿态等变化的鲁棒性,首先提取图像对应不同方向、不同尺度的多个Gabor特征;然后将降维的增广Gabor特征矩阵作为初始特征字典,通过对该字典的学习得到字典原子对应类别标签的新结构化字典,新字典中特定类的子字典对相关的类具有好的表示能力,同时应用Fisher判别约束编码系数,使它们具有小的类内散度和大的类间散度;最后同时用具有判别性的重构误差和编码系数来进行模式分类。基于3个数据库的实验结果表明本文方法具有可行性和有效性。  
      关键词:稀疏表示;稀疏模式分类;Gabor特征;Fisher字典学习   
      4318
      |
      319
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125051 false
      更新时间:2024-05-07
    • 半监督

      陈日新, 朱明旱
      2013, 18(2): 195-200. DOI: 10.11834/jig.20130210
      摘要:加权KNN(-nearest neighbor)方法,仅利用了个最近邻训练样本所提供的类别信息,而没考虑测试样本的贡献,因而常会导致一些误判。针对这个缺陷,提出了半监督KNN分类方法。该方法对序列样本和非序列样本,均能够较好地执行分类。在分类决策时,还考虑了个最近邻测试样本的贡献,从而提高了分类的正确性。在Cohn-Kanade人脸库上,序列图像的识别率提高了5.95%,在CMU-AMP人脸库上,非序列图像的识别率提高了7.98%。实验结果表明,该方法执行效率高,分类效果好。  
      关键词:加权KNN;贝叶斯理论;半监督KNN;流形   
      3332
      |
      293
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127230 false
      更新时间:2024-05-07
    • 最小距离鉴别投影及其在人脸识别中的应用

      黄璞, 唐振民
      2013, 18(2): 201-206. DOI: 10.11834/jig.20130211
      摘要:针对人脸识别问题,提出了最小距离鉴别投影算法,其与经典的线性鉴别分析不同,它是一种流形学习降维算法。该算法首先定义样本的类内相似度与类间相似度:前者能够度量样本与类内中心的距离关系,后者不仅能够反映样本与类间中心的距离关系而且能够反映样本类间距与类内距的大小关系;然后将高维数据映射到低维特征空间,使得样本到类内中心距离最小同时到类间中心距离最大。最后,在ORL、FERET及AR人脸库上的实验结果表明所提算法识别性能要优于其他算法。  
      关键词:人脸识别;降维;线性鉴别分析;局部保持投影;最小距离   
      3627
      |
      338
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125115 false
      更新时间:2024-05-07
    • 图像LSB匹配隐藏的预分类检测模型

      曹卫权, 韩杰思, 王宏霞
      2013, 18(2): 207-213. DOI: 10.11834/jig.20130212
      摘要:当前针对图像LSB匹配隐藏的各种检测方法跨数据集测试性能不佳,其检测效果对于JPEG压缩的和未压缩的图像往往差别很大。对两类图像的颜色空间分布进行了分析,利用量化的DCT交流系数的最高有效位重压缩后不再服从广义Benford定律的现象,查明图像的压缩历史,进而根据图像的通道数以及是否被压缩分别采取不同算法或相同算法的不同参数集合进行检测。实验结果表明,基于该检测模型能够有效提升算法的跨数据集检测能力,增强隐藏检测算法的实用性。  
      关键词:信息隐藏;隐写分析;LSB匹配;预分类;Benford定律   
      2897
      |
      248
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127026 false
      更新时间:2024-05-07
    • 具有旋转鲁棒性的纹理谱描述子

      陈刚, 陈晓云
      2013, 18(2): 214-218. DOI: 10.11834/jig.20130213
      摘要:为克服传统CS-LBP(Center-Symmetric Local Binary Patterns)描述子旋转鲁棒性较差的问题,从人眼视觉角度考虑,提出一种新的CS-LBP纹理谱描述子。将纹理模式的旋转变化与字符串的移位操作相结合,基于纹理模式等价类的思想,设计了更有效的方法提升新描述子的抗旋转能力。实验结果表明,新描述子及方法具有更强的旋转鲁棒性,使旋转纹理图像的聚类准确率提高了9%~38%。  
      关键词:中心对称局部二值模式;旋转鲁棒性;纹理谱描述子;图像特征;图像识别;特征提取   
      3424
      |
      250
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126725 false
      更新时间:2024-05-07

      计算机图形学

    • 利用形体特征的铅笔素描画生成

      莫晓斐, 丁友东
      2013, 18(2): 219-224. DOI: 10.11834/jig.20130214
      摘要:铅笔素描是以单色线条来表现物体的艺术。画家观察物体的形体结构,以线塑型表现物体明暗层次和形体特征。为了表现物体的立体感,提出一种利用形体特征的铅笔素描画生成方法。首先对图像进行双边滤波处理,去除图像微小细节;然后由亮度图像计算其向量场,根据物体的形体特征对向量进行平滑,使其符合原图像的形体特征;最后利用线积分卷积的方法生成铅笔素描纹理,调整明暗对比后得到铅笔素描的效果。实验结果表明,该方法能有效地绘制铅笔素描的立体感和明暗关系。  
      关键词:非真实感绘制;铅笔素描;形体特征;向量场;边缘正切流;线积分卷积   
      3749
      |
      338
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125763 false
      更新时间:2024-05-07

      医学图像处理

    • 统计相似度特征的医学图像分割

      郭艳蓉, 蒋建国, 郝世杰, 詹曙, 李鸿
      2013, 18(2): 225-234. DOI: 10.11834/jig.20130215
      摘要:基于偏微分方程和图论两类图像分割方法的一个共同之处是将分割问题转换成了能量函数的模型建立及其最优化过程。从这一共同点出发,将图像的局部统计分布特征和Bhattacharyya相似度信息相结合并引入到测地线主动轮廓模型(GAC)和图切分(GC)模型的能量函数构造中。改进后GAC算法相当于为模型引入了一个基于似然比检验的回拉力,可有效阻止弱边界处泄露;基于非参数估计的能量函数构造更适用于小样本和分布函数不恒定的情况,使得改进GC模型更完整地提取图像目标的细节部分。将改进GAC和GC模型应用至膝关节MRI序列分割,提出完整分割各骨骼与半月板等结构的框架。在实验与分析部分,进行了定量与定性的实验对比。对噪声与局部体效应影响下的膝关节MRI序列及其他医学图像的实验,结果表明本文方法能够有效提高分割精度。  
      关键词:主动轮廓模型;图切分;Bhattacharyya距离;非参数估计;膝关节图像分割   
      3453
      |
      333
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126050 false
      更新时间:2024-05-07

      遥感图像处理

    • 结合遗传算法和蚁群算法的高光谱图像波段选择

      王立国, 魏芳洁
      2013, 18(2): 235-242. DOI: 10.11834/jig.20130216
      摘要:随着遥感技术和成像光谱仪的发展,高光谱遥感图像的应用越来越广泛,但其自身的特点给高光谱图像的分类、识别等带来了很大的困难。如何快速地从高达数百个波段的高光谱图像中选择出具有较好分类识别能力的波段组合是亟待解决的问题。针对上述问题分析了已有的波段选择方法,提出一种结合遗传算法和蚁群算法的高光谱图像波段选择方法。该算法首先利用遗传算法以较快的寻优能力获得几组较优解,以此来初始化蚁群算法的初始信息素列表,然后用蚁群算法以较高的求精解能力获得最优解,并且在遗传算法部分中采用四进制的编码方式,使得算法编/译码简单、遗传算子操作简捷、且处理时所占空间小,同时在蚁群算法部分中巧妙地对预处理图像进行子空间划分来缩小蚂蚁搜索的范围,提高了算法的搜索效率,减小了输出波段组合的相关性和冗余度。由于该算法充分地吸取遗传算法和蚁群算法的优点、克服各自的缺陷,是一种计算耗时少、收敛性能好的波段选择方法。利用AVIRIS(airborne visible infrared imaging spectrometer)图像对提出的算法进行实验,实验结果表明,本文算法在所选波段性能和计算耗时方面都获得令人满意的效果。  
      关键词:高光谱图像;波段选择;遗传算法;蚁群算法   
      4175
      |
      489
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125982 false
      更新时间:2024-05-07
    • 相似度自适应样本块的高分辨SAR图像阴影修复

      赵昊, 张弓
      2013, 18(2): 243-248. DOI: 10.11834/jig.20130217
      摘要:高分辨率SAR图像目标阴影可为目标识别提供更多的信息,对SAR图像目标阴影进行修复可以获取完整的目标阴影。采用传统样本匹配方法对SAR图像进行目标阴影修复时会出现阴影区域漏判问题和过渡区域不均匀问题。提出一种相似度自适应样本块的SAR图像目标阴影修复方法。利用SAR图像中目标及其阴影斜距的相对位置关系作为待修复区域的预判依据,有效地解决了阴影区域漏判问题;然后采用相似度自适应样本块的图像修复方法,改善了过渡区域不均匀问题。实验结果表明,本文方法可以有效地恢复高分辨率SAR图像中缺失的目标阴影。  
      关键词:SAR图像;图像修复;雷达阴影;相似度;样本块   
      2965
      |
      251
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126282 false
      更新时间:2024-05-07
    0