最新刊期

    2014 19 11

      综述

    • 黄铁军, 郑锦, 李波, 傅慧源, 马华东, 薛向阳, 姜育刚, 于俊清
      2014, 19(11): 1539-1562. DOI: 10.11834/jig.20141101
      摘要:随着视频监控技术的日益成熟和监控设备的普及,视频监控应用日益广泛,监控视频数据量呈现出爆炸性的增长,已经成为大数据时代的重要数据对象。然而由于视频数据本身的非结构化特性,使得监控视频数据的处理和分析相对困难。面对大量摄像头采集的监控视频大数据,如何有效地按照视频的内容和特性去传输、存储、分析和识别这些数据,已经成为一种迫切的需求。 本文面向智能视频监控中大规模视觉感知与智能处理问题,围绕监控视频编码、目标检测与跟踪、监控视频增强、视频运动与异常行为识别等4个主要研究方向,系统阐述2013年度的技术发展状况,并对未来的发展趋势进行展望。 中国最新制定的国家标准AVS2在对监控视频的编码效率上比最新国际标准H.265/HEVC高出一倍,标志着我国的视频编码技术和标准在视频监控领域已经实现跨越;视频运动目标检测跟踪的研究主要集中在有效特征提取和分类器训练等方面,机器学习等方法的引入,使得基于多实例学习、稀疏表示的运动目标检测跟踪成为研究的热点;监控视频质量增强主要包括去雾、去夜色、去雨雪、去模糊和超分辨率增强等多方面的内容,现有的算法均是对某类图像清晰化效果较好,而对其他类则相对较差,普适性不高;现有的智能动作分析与异常行为识别技术虽然得到了不断发展,算法的性能也在不断提高,但是从实用角度,除了简单的特定或可控场景外,还没有太多成熟的应用系统。 随着大数据时代的到来,智能视频监控的需求将日益迫切,面对众多挑战的同时,该研究领域将迎来前所未有的重大机遇,必将产生越来越多可以实用的研究成果。  
      关键词:视频监控;目标检测;目标跟踪;视频增强;行为识别   
      5668
      |
      678
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56121450 false
      更新时间:2024-05-08

      图像处理和编码

    • 基于高阶奇异值分解和均方差迭代的图像去噪

      胡文锐, 谢源, 张文生
      2014, 19(11): 1563-1569. DOI: 10.11834/jig.20141102
      摘要:图像去噪是图像处理的难题,其难点是在尽量滤除噪声的同时对图像信息进行保持。针对该难点,本文提出了一种将非局部相似性和高阶奇异值分解(HOSVD)相融合,并利用均方差(MSE)迭代对图像进行去噪的iHOSVD算法。 首先利用非局部相似块聚类和高阶奇异值分解构建数据自适应的3维变换基及其变换系数;其次,对变换系数进行阈值处理后进行3维反变换,从而达到非局部协同滤波的目的;最后,由于一次去噪操作无法达到理想的去噪效果,采用一种基于均方差最优的迭代方法对图像进行去噪,并证明该迭代是一个权衡偏差和方差使得均方差达到最优的过程。 实验结果表明,iHOSVD算法既能够有效地去除噪声,又能够很好地保持纹理细节信息。 本文所提的图像去噪iHOSVD算法结合了非局部协同滤波与数据自适应去噪的思想,通过对3种高水平去噪算法BM3D、NCSR和PLOW的比较实验发现,不仅表现了较强的图像去噪能力,而且在图像纹理细节保持方面效果最好,适用于纹理信息较强的图像。  
      关键词:高阶奇异值分解;均方差;非局部协同滤波;数据自适应   
      4253
      |
      333
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56121224 false
      更新时间:2024-05-08
    • 小波域中双稀疏的单幅图像超分辨

      杨波, 吴纪桃, 谢晓振
      2014, 19(11): 1570-1576. DOI: 10.11834/jig.20141103
      摘要:过去几年,基于稀疏表示的单幅图像超分辨获得了广泛的研究,提出了一种小波域中双稀疏的图像超分辨方法。 由小波域中高频图像的稀疏性及高频图像块在空间冗余字典下表示系数的稀疏性,建立了双稀疏的超分辨模型,恢复出高分辨率图像的细节系数;然后利用小波的多尺度性及低分辨率图像可作为高分辨率图像低频系数的逼近的假设,超分辨图像由低分辨率图像的小波分解和估计的高分辨率图像的高频系数经过二层逆小波变换来重构。 通过大量的实验发现,双稀疏的方法不仅较好地恢复了图像的局部纹理与边缘,且在噪声图像的超分辨上也获得了不错的效果。 与现在流行的使用稀疏表示的超分辨方法相比,双稀疏的方法对噪声图像的超分辨效果更好,且计算复杂度减小。  
      关键词:小波域;双稀疏;稀疏表示;超分辨   
      3309
      |
      302
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118864 false
      更新时间:2024-05-08
    • 红外热像视频的细微变化放大

      付传卿, 谷小婧, 顾幸生
      2014, 19(11): 1577-1583. DOI: 10.11834/jig.20141104
      摘要:针对红外热像视频对比度低、成像模糊和难以进行细节观测的缺点,提出一种基于欧拉视角的红外热像视频细微变化放大方法。该方法可以将红外热像视频中细微的色彩变化和动作变化进行放大,将原本人眼无法察觉到的变化清晰地展示出来。 该方法首先采用对比度金字塔算法对红外热像视频中每一帧图像进行空域分解,其次对各个尺度的图像进行时域滤波,选择出感兴趣的变化频率并进行线性放大,然后对放大后的信号进行重构,最后对重构得到的图像进行降噪处理,从而获得细微变化放大的红外视频。 针对色彩放大和动作放大,实验采集了若干红外热像视频。其中,对人脸侧面的颜色进行放大时,选择像素值变化频率在0.751 Hz 范围内的信号进行滤波并放大,得到像素值变化被放大100倍的视频;对吉他弦的动作进行放大时,选择变化频率在100120 Hz范围内的信号进行滤波并放大,得到弦的动作幅度被放大的视频。结果表明该方法可以使视频中所选择的变化频段得到有效增强。 本文方法可以放大红外视频中原本无法观测到的细微变化,并使之清晰呈现,在军用和民用领域中有着广泛用途。  
      关键词:红外热像视频;细微变化放大;欧拉视角;对比度金字塔;BM3D降噪算法   
      3762
      |
      277
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56121511 false
      更新时间:2024-05-08

      图像理解和计算机视觉

    • Kinect传感器的彩色和深度相机标定

      郭连朋, 陈向宁, 刘彬
      2014, 19(11): 1584-1590. DOI: 10.11834/jig.20141105
      摘要:针对现有的Kinect传感器中彩色相机和深度相机标定尤其是深度相机标定精度差、效率低的现状,本文在现有的基于彩色图像和视差图像标定算法的基础上,提出一种快速、精确的改进算法。 用张正友标定法标定彩色相机,用泰勒公式化简深度相机中用于修正视差值的空间偏移量以简化由视差与深度的几何关系构建的视差畸变模型,并以该模型完成Kinect传感器的标定。 通过拍摄固定于标定平板上的标定棋盘在不同姿态下的彩色图像和视差图像,完成Kinect传感器的标定,获得彩色相机和深度相机的畸变参数及两相机之间的旋转和平移矩阵,标定时间为116 s,得到彩色相机的重投影误差为0.33,深度相机的重投影误差为0.798。 实验结果表明,该改进方法在保证标定精度的前提下,优化了求解过程,有效提高了标定效率。  
      关键词:视差图像;Kinect传感器;畸变校正;相机标定   
      7055
      |
      383
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118950 false
      更新时间:2024-05-08
    • 空间统一调制模型的轮廓检测

      肖洁, 蔡超, 郭照立
      2014, 19(11): 1591-1595. DOI: 10.11834/jig.20141106
      摘要:在人类大脑初级视皮层上,神经元不仅受到位于经典感受野中刺激的影响,同样也受到周边环境相应非经典感受野中刺激的影响。这种上下文的调制是通过视皮层的水平连接来实现的。基于初级视皮层的视觉机制,本文提出了一个轮廓提取模型。 首先利用局部能量计算初级视皮层上单个神经元的响应;然后通过构建一个新颖的空间统一调制算子获得周边刺激对于中央神经元的增强和抑制影响(上下文调制);最后整合上下文调制影响和中央神经元本身的能量响应,获得完整输出。 本文所提模型,无需在非经典感受野中划分增强域和抑制域,同时能够有效抑制背景纹理,突出目标轮廓,保留交点和角点信息。 通过对合成图像和自然图像的测试表明了本文算法的准确性和优越性,能够极大地提高复杂背景中轮廓检测的性能。  
      关键词:轮廓提取;视觉感知机制;Gabor滤波器;上下文调制   
      3104
      |
      229
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56121534 false
      更新时间:2024-05-08

      图像分析和识别

    • 结合相似性拟合与空间约束的图像分割

      张峥嵘, 詹天明, 韦志辉
      2014, 19(11): 1596-1603. DOI: 10.11834/jig.20141107
      摘要:图像中的目标一般含有很多子类,仅仅利用某个子类的特征无法完整地分割出目标区域。针对这一问题,提出一种结合相似性拟合与空间约束的图像交互式分割方法。 首先,通过手工标记的样本组成各个目标的字典,通过相似度量搜寻测试样本与各个目标的字典中最相似的原子建立拟合项;再结合图像的空间约束项,构建图像分割模型;最后利用连续最大流算法求解,快速实现图像分割的目的。 通过对比实验,本文方法的速度比基于稀疏表示的分类方法的速度提高约13倍,而与归一化切割(N-Cut),逻辑回归(logistic regression)等方法相比,本文方法能取得更稳定和准确的分割结果。此外,本文方法无需过完备字典,只需要训练样本能体现各个子类的信息即可得到稳定的图像分割结果。 本文交互式图像分割方法,通过结合相似性拟合以及空间约束建立分割模型,并由连续最大流算法求解,实现图像的快速准确的分割。实验结果表明,该方法能够胜任较准确地对自然图像进行分割以及目标提取等任务。  
      关键词:图像分割;相似性搜索;空间约束;连续最大流算法   
      3171
      |
      361
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120963 false
      更新时间:2024-05-08
    • 多相主动轮廓模型的眼底图像杯盘分割

      郑姗, 范慧杰, 唐延东, 王琰
      2014, 19(11): 1604-1612. DOI: 10.11834/jig.20141108
      摘要:视盘及视杯的检测对于分析眼底图像和视网膜视神经疾病计算机辅助诊断来说十分重要,利用医学眼底图像中视盘和视杯呈现椭圆形状这一特征,提出了椭圆约束下的多相主动轮廓模型,实现视盘视杯的同时精确分割。 该算法根据视盘视杯在灰度图像中具有不同的区域亮度,建立多相主动轮廓模型,然后将椭圆形约束内嵌于该模型中。通过对该模型的能量泛函进行求解,得到椭圆参数的演化方程。分割时首先设定两条椭圆形初始曲线,根据演化方程,驱动曲线分别向视盘和视杯方向进行移动。当轮廓线到达视盘、视杯边缘时,曲线停止演化。 在不同医学眼底图像中对算法进行验证,对算法抗噪性、不同初始曲线选取等进行了实验,并与多种算法进行了对比。实验结果表明,本文模型能够同时分割出视盘及视杯,与其他模型的分割结果相比,本文算法的分割结果更加准确。 本文算法可以精确分割医学眼底图像中的视盘和视杯,该算法不需要预处理,具有较强的鲁棒性和抗噪性。  
      关键词:眼底图像;杯盘分割;C-V模型;椭圆形约束多相主动轮廓模型;多相水平集函数   
      3467
      |
      285
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56119151 false
      更新时间:2024-05-08
    • 精确局部特征描述的表情识别

      胡敏, 江河, 王晓华, 陈红波, 李堃, 任福继
      2014, 19(11): 1613-1622. DOI: 10.11834/jig.20141109
      摘要:针对传统局部特征提取方法在表情识别上的局限性,提出一种精确局部特征描述的表情识别方法。 首先将人的眉毛、眼睛和嘴巴3个对表情识别起关键作用的器官分割出来,使得特征描述更具有针对性。然后,构造充分矢量三角形以统计图像的轮廓特征与细节特征。最后,对于不同的表情器官采用不同尺度的充分矢量三角形描述,对于同种表情器官采用多种尺度的充分矢量三角形联合描述,从而充分描述关键器官的图像信息。 该算法在日本女性表情人脸库(JAFFE)、cohn-kanade库(CK)以及Pain expressions库上进行实验,分别取得了95.67%、97.83%、84.0%的平均识别率以及11.70 ms、30.23 ms、11.73 ms的平均特征提取时间,实验结果表明,精确局部特征描述的表情识别方法可以较快、较准确的进行人脸表情识别。 精确局部特征描述的表情识别方法通过器官的分割以及充分矢量三角形模式的构造与灵活运用,良好地表达了图像的局部特征且具有较低的时间复杂度,本文算法与目前典型的表情识别算法的实验对比结果也表明了本文算法的有效性。  
      关键词:表情识别;精确局部特征;充分矢量三角形模式;多种尺度   
      3810
      |
      298
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56119020 false
      更新时间:2024-05-08
    • Gabor小波和改进LBP的零件表面粗糙度识别

      胡海锋, 陈苏婷
      2014, 19(11): 1623-1629. DOI: 10.11834/jig.20141110
      摘要:为了提取零件表面图像的纹理特征并对其表面粗糙度分类识别,有效提高识别的正确率,提出了联合Gabor小波和改进局部二值模式(LBP)的纹理特征提取方法。 针对传统LBP算子忽略了邻域内灰度差幅值特征的问题,提出了M_LBP(magnitude considered LBP)算子。采用Gabor小波对零件表面图像滤波,并计算各子图像 Gabor幅值特征GMM(Gabor magnitude maps)。应用M_LBP算子计算各GMM的M_LBP特征谱,进而构造得到零件表面图像的纹理特征向量,最后通过KNN(K-nearest neighbor)算法对零件粗糙度分类识别。 本文提出的算法有效细化了表面图像纹理特征,对粗糙度差别为0.2 μm的零件识别准确率达到98%,远高于利用传统LBP算子提取的纹理信息的识别准确率。 本文提出了一种有效细化LBP纹理特征的M_LBP算子,并通过与Gabor小波的结合,突破了传统LBP算子尺度、方向单一,幅值信息被忽略的局限性,能实现较高精度的粗糙度识别。  
      关键词:粗糙度识别;Gabor小波;M_LBP;KNN分类器   
      3188
      |
      276
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56119058 false
      更新时间:2024-05-08
    • 可扩展的花卉种类识别

      苗金泉, 曹卫群
      2014, 19(11): 1630-1638. DOI: 10.11834/jig.20141111
      摘要:基于模式识别的花卉种类识别方法在使用不同特征或分类器时识别准确率有较大差别。本文的研究目的在于实现花卉种类识别方法的快速构建及性能评估,减轻研究人员的编程工作量,提高效率。 根据使用模式识别技术进行花卉种类识别的一般步骤,应用插件技术将算法中的预处理、特征提取、分类器训练、分类器识别等步骤表示成不同种类的处理器,建立可扩展的系统平台,研究人员可以通过修改各步骤所使用的处理器来修改图像处理和识别算法,并在此基础上采用流式链接方法构建算法。 基于本文所提出的构建方法进行算法优化,并将其用于68种花卉的识别,准确率Top1为 91.26%,Top5为98.41%。 流式链接方法能够对识别方法进行快速装配,有利于快速评估不同特征和分类器在花卉种类识别中的性能,适于算法的研究和优化。本文所提出的基于工作流式链接方法以及插件技术的构建方法具有灵活易用的特点,所构建的算法具有良好的可扩展性。该方法还可以推广应用于其他基于数字图像的模式识别算法研究。  
      关键词:插件;流式结构;可扩展;花卉种类识别   
      3321
      |
      279
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56121387 false
      更新时间:2024-05-08

      医学图像处理

    • 基于提升小波变换的医学图像融合

      李俊峰, 姜晓丽, 戴文战
      2014, 19(11): 1639-1648. DOI: 10.11834/jig.20141112
      摘要:将不同模态的医学图像(如CT/MRI图像)进行科学融合,可以有效地丰富图像的信息,提高信息的利用效能,这对于医学临床诊断具有重要的理论研究意义和应用价值。 基于提升小波变换的特性,对多模态医学图像的融合算法进行研究。首先,对已配准的源图像进行多尺度分解,得到低频子带和多层高频子带;进而,根据低频子带的特点和各层高频子带的噪声含量不同,提出了低频子带系数采用基于区域平均能量的加权融合规则;对噪声含量较低的低层高频子带采用基于计盒分维法获取分维数,而对噪声含量较高的高层高频子带提出了基于区域梯度能量加权融合规则。 分别对灰度图像和彩色图像进行了大量融合实验,并分别在主观视觉特性及客观评价指标下对不同融合算法产生的融合图像的质量进行了分析对比,表明本文算法具有较好的边缘保持度。 实验结果表明,较现有算法产生的融合图像,应用本文融合算法得到的图像具有更丰富的信息,更能使图像灰度级分散,具有更良好的视觉特性和评价指标。  
      关键词:医学图像融合;提升小波变换;区域能量;计盒维数;局部区域梯度能量   
      4005
      |
      328
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120710 false
      更新时间:2024-05-08

      遥感图像处理

    • 基于压缩感知的SAR图像鲁棒编码传输

      侯兴松, 田文文, 龚晨
      2014, 19(11): 1649-1656. DOI: 10.11834/jig.20141113
      摘要:尽管传统的联合信源信道编码方案可以获得高效的压缩性能,但当信道恶化超过信道编码的纠错能力时会导致解码端重构性能的急剧下降;为此利用压缩感知的民主性提出一种鲁棒的SAR图像编码传输方案,且采用了一系列方法提高该方案的率失真性能。 考虑到SAR图像丰富的边缘信息,采用具有更强方向表示能力的方向提升小波变换(DLWT)对SAR图像进行稀疏表示,且为消除压缩感知中恢复非稀疏信号时存在的混叠效应,采用了稀疏滤波方法保证大系数的精确恢复,在解码端采用了高效的Bayesian重建算法获得图像的高性能重建。 在同等码率下,与传统的联合信源信道编码方案CCSDS-RS相比,本文方案可以实现更加鲁棒的编码传输,当丢包率达到0.05时,本文方案DSFB-CS获得的重建性能明显要高于CCSDS-RS;与基于Bayesian重建算法TSW-CS的传统方案相比,本文方案可提高峰值信噪比(PSNR)3.9 dB。 本文方案DSFB-CS 实现了SAR图像的鲁棒传输,随着丢包率的上升,DSFB-CS获得的重建性能缓慢下降,保证了面对不稳定信道时,解码端可以获得相对稳定的重构图像。  
      关键词:压缩感知;合成孔径雷达;鲁棒传输;方向提升小波变换(DLWT);稀疏滤波   
      3576
      |
      256
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56121023 false
      更新时间:2024-05-08

      第11届全国智能CAD与数字娱乐学术会议栏目

    • 大规模DVE场景对等传输机制研究新进展

      王明飞, 贾金原, 张晨曦
      2014, 19(11): 1657-1668. DOI: 10.11834/jig.20141114
      摘要:目前互联网上构建的虚拟世界规模越来越大,但在现实网络带宽有限的情况下,实时传输海量复杂虚拟场景一直都是难以解决的“瓶颈问题”,针对该极具挑战性的问题进行了综述性研究。 首先对大规模3维虚拟场景传输的主要技术进行了概述,然后分别对其中的关键技术如大规模虚拟场景的轻量化与流式化技术、P2P-Cloud(Peer to Peer-Cloud)网络架构、资源发现/邻居发现策略、不同网络架构的虚拟场景数据分发策略和移动网络场景传输等进行了详细综述。 阐明了虚拟场景传输主要技术之间的关系,并通过对已有经典成果的对比,分析了它们的优缺点及需要解决的关键问题。 分别从虚拟场景传输的场景预处理、基于云的混合网络架构和移动网络中的场景传输这3个发展方向做了前瞻性的展望。  
      关键词:P2P覆盖网;云计算;分布式虚拟环境(DVE);场景传输;移动互联网   
      4510
      |
      272
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56121417 false
      更新时间:2024-05-08
    • 自然环境下的植物叶片智能色彩推理仿真

      宋建文, 邱锦明
      2014, 19(11): 1669-1676. DOI: 10.11834/jig.20141115
      摘要:在分析当前相关研究成果的基础上,提出植物叶片基于自然环境的色彩粗规律模型,为大场景植物动态仿真提供算法和理论依据。 该方法利用函数S-粗集,通过(,)-色彩粗规律给出动态色彩系统的色彩生成算法和植物叶片色彩推理仿真,建立基于自然环境的植物叶片动态色彩系统建模理论。 实验结果表明,在基于双向S-粗集函数的植物叶片动态色彩系统理论中,对于阔叶植物叶片,当调整外部因素(如光照度、温度、湿度等)时,叶片的色彩也随之产生相应的变化,验证了植物叶片色彩粗规律理论的可靠性与有效性。 在植物叶片的智能仿真系统中,当外部因素变化时,植物叶片色彩的动态变化基本上符合自然环境中叶片的基本规律,是一种基于Billboard技术的用于解决大场景植物叶片色彩动态变化模拟和仿真的有效方法。  
      关键词:自然环境;函数S-粗集;植物叶片;色彩粗规律;智能色彩;推理仿真   
      3736
      |
      269
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120390 false
      更新时间:2024-05-08
    • 3个控制顶点的类三次Bézier螺线

      高晖, 寿华好, 缪永伟, 王丽萍
      2014, 19(11): 1677-1683. DOI: 10.11834/jig.20141116
      摘要:为了使得过渡曲线的设计更为简单高效。提出基于3个控制顶点的类三次Bézier螺线。 通过对基函数的研究首先构造了3条在一定条件下曲率单调递减的类三次Bézier曲线,并由参数的对称性得另3条曲率单调递增的曲线。它们具有端点性、凸包性、几何不变性等三次Bézier曲线的基本性质,特点是只有3个控制顶点。接着严格地证明了此类曲线曲率单调的充分条件。 有两条曲线比三次Bézier曲线的曲率单调条件范围大,且类三次Bézier螺线与三次Bézier螺线存在一定的位置关系。这6条曲线中有4条曲线的一个端点处曲率为零,可组合成4对类三次Bézier螺线来构造两圆弧间半径比例不受限制的S型和C型G连续过渡曲线;剩下的两条曲线在两圆弧半径相差较大的情况下都可做不含曲率极值点的过渡曲线。最后用实例表明了此类曲线的有效性。 在过渡曲线设计中基于3个控制顶点的类三次Bézier螺线比三次Bézier螺线更为简单高效。  
      关键词:三次Bézier曲线;类三次Bézier曲线;曲率单调;G;连续;过渡曲线   
      4175
      |
      320
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118849 false
      更新时间:2024-05-08
    0