最新刊期

    2014 19 12

      综述

    • 视频摘要技术综述

      王娟, 蒋兴浩, 孙锬锋
      2014, 19(12): 1685-1695. DOI: 10.11834/jig.20141201
      摘要:类似于文本摘要,视频摘要是对视频内容的总结。为了合理地评估视频摘要领域的研究进展,正确导向视频摘要的继续研究,本文归纳总结视频摘要技术的主要研究方法和显著性成果,对视频摘要技术进行综述。 依据视频摘要的两个主要生成步骤:视频内容分析和摘要生成分别介绍视频摘要的主要研究方法。同时,分析了近5年视频摘要领域的研究状况,对视频摘要发展的新趋势:实时视频摘要和多视角视频摘要进行了阐述。最后,还对视频摘要的评价系统进行了分类总结。 对视频摘要进行综述,对摘要中的语义获取难题提出了2种指导性建议。并依据分析结果,展望了视频摘要技术未来的发展方向。 视频摘要技术作为视频内容理解的重要组成部分,有较大研究价值。而目前,视频摘要在视频语义表达和摘要评价系统方面并不精确完善,还需进一步的深入研究。  
      关键词:视频内容分析;摘要生成;实时视频摘要;多视角视频摘要;视频语义获取   
      5478
      |
      367
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120289 false
      更新时间:2024-05-08
    • 局部二进制模式方法综述

      刘丽, 谢毓湘, 魏迎梅, 老松杨
      2014, 19(12): 1696-1720. DOI: 10.11834/jig.20141202
      摘要:局部二进制模式(LBP)是一种理论简单、计算高效的非参数局部纹理特征描述子。由于其具有较高的特征鉴别力和较低的计算复杂度,因此近期获得了越来越多的关注,在图像分析、计算机视觉和模式识别领域得到了广泛的应用,尤其是在纹理分类和人脸识别两个经典的模式识别问题中,LBP方法得到充分的研究和发展。鉴于LBP的理论意义和实用价值,为了使国内外同行对LBP方法有一个较为全面的了解,对其进行系统总结。 在广泛文献调研的基础上,主要以纹理分类和人脸识别为应用背景,系统综述了LBP及现有各种LBP各种改进方法,从每种方法的研究动机、解决思路和方法特点及性能等方面进行总结。 首先,回顾了LBP方法的发展历程,综述了LBP及其众多改进方法的基本原理,系统梳理和评述了各种LBP方法的优势与不足,并在统一框架下对各种LBP方法进行分类总结;然后,综述了LBP及其各种改进方法在纹理分类和人脸识别中的应用研究,并总结了一些方法在基准数据库上达到的最高分类正确率;最后,凝练出LBP方法进一步的发展方向。 LBP方法的研究仍然是计算机视觉和模式识别领域倍受青睐的热点研究领域,仍然有更多低存储、快速的二值特征描述子被提出,LBP方法的应用领域仍在继续拓展。  
      关键词:局部二进制模式;纹理分类;人脸识别;旋转不变;多尺度分析;局部特征描述子   
      5155
      |
      572
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120810 false
      更新时间:2024-05-08

      图像处理和编码

    • 2维全相位内插核的设计与实现

      苏飞, 孙杰, 秦娟, 段宇翔
      2014, 19(12): 1721-1729. DOI: 10.11834/jig.20141203
      摘要:图像的内插处理中,常将图像分解成许多子块,在块与块的交界处或图像边缘会引起图像质量的损伤。为了克服边缘效应,本文提出基于2维全相位数字信号处理的内插算法。 首先设计加窗的2维全相位数字信号处理算法,并利用该算法得到基于离散傅里叶变换(DFT)、离散余弦变换(DCT)和离散小波变换(DWT)的3种类型2维图像内插核,可同时处理行列及斜向频率分布。其次,为保持线性相位特性,对2维基窗和特性矩阵的构成提出约束条件。 该方法在有效地降低分块效应的同时,解决了对斜向内容分量无法有效操作的问题,使内插得到的图像PSNR至少提升3 dB。 设计针对不同频率分布的3种图像内插实验,并同传统6种内插方式结果进行对比,表明该算法物理意义明确,恢复效果良好,实用性较强。  
      关键词:全相位;内插核;模板;全相位基;基窗   
      3147
      |
      567
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120489 false
      更新时间:2024-05-08
    • 改进的正则化模型在图像恢复中的应用

      李旭超, 宋博
      2014, 19(12): 1730-1742. DOI: 10.11834/jig.20141204
      摘要:由拟合项与正则项组成的海森矩阵,如果不具有特殊结构,其逆矩阵计算比较困难,为克服此缺点,提出一种海森矩阵可分块对角化的牛顿投影迭代算法。 首先,用L范数描述拟合项,用自变量是有界变差函数的复合函数刻画正则项,建立能量泛函正则化模型。其次,引入势函数,将正则化模型转化为增广能量泛函。再次,构造预条件矩阵,使得海森矩阵可分块对角化。最后,为防止牛顿投影迭代算法收敛到局部最优解,采用回溯线性搜索算法和改进的Barzilai-Borwein步长更新准则使得算法全局收敛。 针对图像去模糊正则化模型容易使边缘平滑和产生阶梯效应“两难”问题,提出一种新的正则化模型和牛顿投影迭代算法。仿真结果表明,“两难”问题通过本文算法得到了很好的解决。 与其他正则化图像去模糊模型相比,本文算法明显改善图像的质量,如有效地保护图像的边缘,抑制阶梯效应,相对偏差和误差较小,较高的峰值信噪比和结构相似测度。  
      关键词:正则化模型;牛顿投影算法;海森矩阵;预条件矩阵   
      3354
      |
      335
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118764 false
      更新时间:2024-05-08
    • 改进鱼眼变换技术的图像适应

      张丽霞, 区兆明, 宋鸿陟
      2014, 19(12): 1743-1750. DOI: 10.11834/jig.20141205
      摘要:为解决目前基于鱼眼变换技术的图像适应方法难以解决的焦点检测和多焦点冲突两大问题,提出一种基于改进鱼眼变换技术的图像适应方法。 提出的方法根据源图像的能量计算出图像中所有最优高能量线并组成高能量线集合,作为源图像的高能量部分,即图像的焦点区域;以能量线而不是传统的图像区域为单位进行鱼眼变换以得到目标图像。 改变鱼眼变换技术的变换模式并应用于图像适应中,实验结果表明,本文方法解决了基于鱼眼变换技术的图像适应方法存在的问题,通过本文算法所得到的目标图像具有较好的视觉效果,用户满意度接近4分。算法运行速度较快,将源图像(512×384)长度缩小一半的情况下仅需6 s的运算时间。 本文方法一方面保留了鱼眼变换图像适应方法的优势,在突出显示图像重要部分的同时,不会忽略图像的次要部分;另一方面解决了鱼眼变换图像适应方法存在的焦点检测和多焦点冲突问题。实现效果和用户主观评价结果表明,该方法是一种有效可行的图像适应方法。  
      关键词:图像适应;鱼眼变换;焦点检测;最优高能量线   
      3190
      |
      347
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120929 false
      更新时间:2024-05-08
    • 去除乘性噪声的分数阶变分模型及算法

      田丹, 薛定宇, 陈大力
      2014, 19(12): 1751-1758. DOI: 10.11834/jig.20141206
      摘要:针对变分方法在去除图像乘性噪声时易产生“阶梯效应”的问题,分析研究了几种经典乘性去噪变分模型的特性和相关性,在此基础上考虑到分数阶微分的频率特性,提出一种用于去除乘性Gamma噪声的分数阶凸变分模型。 提出的分数阶凸变分模型是经典I-divergence变分模型的分数阶扩展。基于对偶理论,提出一种用于求解该模型的分数阶原始对偶算法。并且基于鞍点理论,分析了确保算法收敛的参数取值范围。 实验中从频域角度分析并验证了提出的分数阶变分模型较经典的一阶变分模型能够有效缓解“阶梯效应”现象,更好地保持图像的中频纹理和高频边缘信息。同时提出的分数阶原始对偶数值算法能有效收敛,且收敛速度较快。 本文提出了一种去除图像乘性噪声的分数阶变分模型,该模型可采用一种基于预解式的原始对偶算法求解。实验结果表明,提出的模型能有效改善图像的视觉效果,采用的数值算法能有效快速收敛。  
      关键词:乘性噪声;变分法;分数阶微分;原始对偶算法;鞍点模型   
      3300
      |
      264
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120637 false
      更新时间:2024-05-08
    • 丢包环境中H.264视频编码的快速模式判决

      兰梦, 张远, 魏雨农
      2014, 19(12): 1759-1765. DOI: 10.11834/jig.20141207
      摘要:视频编码中传统的快速模式判决算法通常基于对视频源特性的分析,但如果考虑到信道传输中的差错,编码模式的率失真特性就会随之改变,快速模式判决算法的性能也会随之下降,需要考虑丢包环境对快速模式判决算法进行优化。 为了解决这一问题,首先分析了丢包环境下各种编码模式的端到端率失真特性,在此基础上提出了一个分层结构的快速模式判决算法。通过快速估计出丢包环境下skip和intra模式的编码率失真代价,进而将模式判决的路径划分为non-intra和non-skip。 将本文算法与基于遍历算法的容错视频编码算法进行对比实验,本文算法平均可以降低50%左右的编码时间,同时几乎不会降低率失真性能。 实验结果表明,在对丢包环境下端到端率失真代价进行估计的基础上,所提出的分层结构快速模式判决的算法,可以在保证解码端图像质量的同时,显著节省编码时间,满足实时视频通信中对低复杂度和鲁棒性的要求。  
      关键词:视频编码;H.264;差错恢复;快速模式判决   
      3087
      |
      212
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120328 false
      更新时间:2024-05-08

      图像分析和识别

    • 偏度和峰度的图像色彩和谐变化

      马云芳, 宋明黎, 卜佳俊
      2014, 19(12): 1766-1774. DOI: 10.11834/jig.20141208
      摘要:当图像颜色较多时,使用Cohen-Or方法进行和谐变化之后的图像颜色丢失严重,和原图像相差较远,并且该方法在计算图像最优和谐模版类型时时间开销大。 鉴于此,本文引入用于描述变量所有取值分布形态偏向和陡缓程度的偏度和峰度来计算图像的和谐模版灰色区域H值范围,将七种和谐模版分类合并到X、T两大类,按照灰色区域损失最少为最优模版的原则,调整计算出来的和谐模版灰色区域H值到X或者T和谐模版的灰色区域中,采用标准高斯函数将颜色正态迁移到调整后的色彩和谐模版灰色区域中,最终实现图像色彩和谐变化。 实验结果表明,本文的图像和谐变化结果能和原图像保持较高的相似度,颜色损失较少,并大大降低了和谐变化所需的时间,一幅450×423图像和谐处理的时间开销由原来的2 549.78 s降低为13.869 3 s。 使用本文方法和谐变化之后的图像最大限度地保持了原有图像的颜色风格,可以为灰度图像着色、图像之间的色彩迁移、工业产品风格转移等应用提供帮助。  
      关键词:图像和谐;偏度;峰度;颜色迁移   
      3538
      |
      495
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118797 false
      更新时间:2024-05-08
    • 结合稀疏表示和概率潜在语义的图像模糊度评价

      张涛, 王新年, 梁德群
      2014, 19(12): 1775-1784. DOI: 10.11834/jig.20141209
      摘要:图像的模糊度评价是客观图像质量评价的一种,主要用来衡量图像信号经过成像系统或处理算法后的降质程度,其在图像获取、传输、分析以及图像处理系统或算法评价等领域有着广泛的应用。针对目前图像模糊度评价方法没有考虑人类视觉系统的无监督学习和层次化特征提取的特性,本文将图像稀疏表示和利用概率潜在语义提取图像主题相结合,提出基于稀疏表示和概率潜在语义的图像模糊度评价算法。 该算法在图像稀疏表示的基础上,通过概率潜在语义方法分别提取清晰训练图像和待测图像的主题,以待测图像潜在主题与清晰图像平均潜在主题之间的相似性作为模糊度评价的依据。主要过程分为3个阶段:词典构建阶段、训练学习阶段和模糊度评价阶段。词典构建阶段的目的是通过样本学习获得图像稀疏表示的词典;训练学习阶段的目的是采用概率潜在语义的方法获得训练图像的平均主题;模糊度评价阶段的目的是通过待测图像的潜在主题与训练图像的平均潜在主题的相关系数来计算图像的模糊程度。 在仿真图和公共测试数据库上与典型算法的比较实验表明:本文算法在单调性、抗噪性以及视频质量专家组制定的5个评价指标上都取得了较好的效果,其中Pearson相关系数和Spearman秩相关系数分别为0.995 6和0.993 4。 本文根据人类视觉系统具有无监督学习和层次化特征提取的特点,以待测图像潜在主题与清晰图像平均潜在主题之间的相似性作为模糊度评价的依据,提出了一种新的基于稀疏表示和概率潜在语义的图像模糊度评价方法。实验结果表明该方法能够对图像的模糊度进行较准确的评价,并且结果与人的主观评价结果一致。  
      关键词:图像质量评价;模糊度评价方法;图像稀疏表示;概率潜在语义;人类视觉系统   
      3128
      |
      223
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120427 false
      更新时间:2024-05-08
    • Log-Gabor小波和分数阶多项式KPCA的火焰图像状态识别

      宋昱, 吴一全
      2014, 19(12): 1785-1793. DOI: 10.11834/jig.20141210
      摘要:为了进一步提高锅炉燃烧火焰图像状态识别的性能,提出了一种基于Log-Gabor小波和分数阶多项式核主成分分析(KPCA)的火焰图像状态识别方法。 首先利用Log-Gabor滤波器组对火焰图像进行滤波,提取滤波后图像的均值和标准差,并构成纹理特征向量。然后使用分数阶KPCA方法对纹理特征向量进行降维,并将降维后的纹理特征向量输入支持向量机进行分类。 本文与基于Log-Gabor小波特征提取以及2种基于Gabor小波特征提取的方法相比,本文方法的分类识别正确率更高,分类精度为76%。同时,第1主分量方差比重与核函数参数之间满足递增关系。本文方法能够准确地提取火焰图像纹理特征。 本文提出一种对锅炉燃烧火焰图像进行状态识别的方法,对提取的火焰图像纹理特征向量进行降维并进行分类,可以获得较高的分类精度。实验结果表明,本文方法分类精度较高,运行时间较短,具有良好的实时性。  
      关键词:燃烧监测;火焰图像;Log-Gabor小波;核主成分分析;支持向量机   
      3362
      |
      375
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120472 false
      更新时间:2024-05-08
    • 加权局部二值模式的人脸特征提取

      张洁玉, 武小川
      2014, 19(12): 1794-1801. DOI: 10.11834/jig.20141211
      摘要:为了能够得到图像更加丰富的纹理特征,提出一种新的自适应加权局部二值模式算法。 首先,将图像进行分块,利用新算法提取每个子块的局部二值模式的纹理直方图;然后,将各子图像的信息熵作为直方图的加权依据,对每个子块对应的直方图进行自适应加权,并将所有子块的直方图连接成最终的纹理特征。提取每个子块的局部纹理特征时的方法为:以某一像素点为中心取相邻的8个像素组成一个局部邻域,在该邻域内依据自适应设定的阈值分别比较3对水平方向和3对竖直方向像素值的大小,以此获得6位二进制码并将每位二进制码乘以相应的权重后相加,累加和即为该邻域新的局部二值模式纹理特征。 在两大人脸数据库上进行的实验结果表明,利用本文提出的方法提取纹理特征,并结合最近邻分类法可以得到85.29%和96.50%的正确识别率。 文中提出的自适应加权局部二值模式特征能够获取图像中更加丰富的纹理信息,因而具有较高的正确识别率,并且对于其他的物体识别也具有一定的参考价值。  
      关键词:纹理特征;局部二值模式;自适应加权;人脸识别   
      3438
      |
      423
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120890 false
      更新时间:2024-05-08
    • 面向部件遮挡补偿的车辆检测模型

      陈远, 谢昭, 吴克伟
      2014, 19(12): 1802-1811. DOI: 10.11834/jig.20141212
      摘要:复杂场景中多目标间的遮挡,会造成车辆视觉信息损失,致使车辆检测出现漏检问题。 为解决遮挡车辆漏检问题,提出一种遮挡补偿模型,分析车辆部件的单视点/多视点可见概率,弥补已有基于部件的车辆检测模型对遮挡区域信息描述的不足。首先,通过外观模型估计车辆候选区域,确定车辆各部件的位置和相似程度,判定车辆部件的遮挡情况,并获得外观项和结构项;其次,计算车辆区域的单视点可见概率和多视点可见概率,并获取被遮挡的部件中心点对应的单视点/多视点可见概率,作为车辆检测的补偿项,调整遮挡部分的检测得分;最后,将车辆检测的外观项、结构项和补偿项,统一到遮挡补偿模型中,实现对候选区域的车辆判断。 实验结果表明,对比于现有的车辆检测模型,本文算法在PASCAL、MSRC以及真实场景中车辆检测结果对应的P-R曲线性能更佳。 该遮挡补偿模型在保持虚警率的同时,能够有效提升遮挡车辆的检测准确性。  
      关键词:车辆检测;遮挡;部件模型;单视点可见概率;多视点可见概率   
      3646
      |
      252
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118989 false
      更新时间:2024-05-08
    • 基于暗原色及入射光假设的单幅图像去雾

      於敏杰, 张浩峰
      2014, 19(12): 1812-1819. DOI: 10.11834/jig.20141213
      摘要:雾是一种常见的天气状况,针对雾能使图像中的景物对比度降低、表面颜色退化的问题,提出一种基于入射光假设的单幅图像去雾方法。 首先利用全局暗原色进行初步去雾,从而使图像透射率处于[0,1]范围内;然后利用雾天光照均匀的特点以及Retinex的照度估计原理进行透射图的估计;最后利用透射图以及初步去雾图像得到复原图像。 与He算法、Fattal算法的对比实验结果显示,该算法获得的复原图像细节清晰,颜色自然。与引导滤波优化后的He去雾算法相比,本文算法速度提高了93%。 大量对比实验结果表明,本文算法能够显著恢复雾天降质图像,对于薄雾和浓雾同样有效,具有广泛的适用性,且算法原理简单。此外,本文算法也同样适用于灰度图。  
      关键词:去雾;多尺度;照度估计;Retinex;入射光假设   
      3915
      |
      370
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120536 false
      更新时间:2024-05-08
    • 空间可变有限混合模型

      申小虎, 吕导中, 万荣春
      2014, 19(12): 1820-1828. DOI: 10.11834/jig.20141214
      摘要:有限混合模型是一种无监督学习方法,它被广泛的应用到数据分类任务中。然而,在图像分割过程中,由于有限混合模型没有引入邻域像素间的空间关系,导致了图像分割结果对噪声非常敏感。为了增强有限混合模型的抗噪性,提出一种新的空间可变有限混合模型。 该模型通过在像素的先验分布中引入一种新的空间关系来降低噪声对图像分割结果的干扰。在构建空间关系的过程中,利用形态学膨胀原理将空间邻域内特征值出现的概率而不是特征值本身进行膨胀操作,然后通过根据具有最大概率的分类标记在高斯混合模型迭代地计算过程中进行局部像素空间平滑,从而起到抑制噪声干扰的作用。 本文实验包含了人工合成图像和医学CT图像的图像分割实验。在人工合成图像分割实验中,对人工合成图像添加了不同程度的噪声来测试本文模型和对比模型对噪声抑制能力的高低;对医学CT图像进行图像分割实验,以是比较本文模型与对比模型之间在实际图像分割中的效果。 实验数据显示,本文提出的模型在噪声抑制能力上,图像分割精度和计算效率上均有更优的性能。  
      关键词:图像分割;有限混合模型;空间可变有限混合模型;形态学膨胀;空间平滑   
      136811
      |
      500
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120607 false
      更新时间:2024-05-08

      遥感图像处理

    • 高分辨率极化SAR图像水平集分割

      邹鹏飞, 李震, 田帮森
      2014, 19(12): 1829-1835. DOI: 10.11834/jig.20141215
      摘要:传统的极化SAR图像分割方法中,由于采用的统计分布模型不能较好地描述高分辨率的图像纹理特征,导致高分辨率极化SAR图像分割效果较差。针对这个问题,本文将具有广泛适用性的KummerU分布嵌入到水平集极化SAR图像分割方法中,提出了一种新的极化SAR图像分割算法。 将KummerU分布作为高分辨率极化SAR图像的统计模型,定义一种适用于极化SAR图像分割的能量泛函;利用最大似然法对各个区域的KummerU分布进行参数估计,并通过数值偏微分方程的方法求解水平集函数,实现极化SAR图像的区域分割。 分别对仿真全极化数据,真实全极化数据进行分割实验,结果表明本文提出的方法其分割精度高于传统方法,分割精度高于95%,从而验证了新方法的有效性。 本文算法能够对各向同质区和各向异质区的极化SAR图像都能取得良好的分割效果,并适应于多种场景,有效地分割出背景和目标。  
      关键词:KummerU;分割;水平集;极化SAR图像   
      4373
      |
      375
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120689 false
      更新时间:2024-05-08
    • 混合本征模型的多视SAR影像海冰密度检测

      汪霄箭, 李玉, 赵泉华, 何晓军
      2014, 19(12): 1836-1842. DOI: 10.11834/jig.20141216
      摘要:SAR影像中像素光谱测度的空间相关性蕴含着海洋表面和海冰更加丰富的空间特性及其变化信息,因此合理建模这种相关性是高分辨率SAR影像海冰精准解译的关键。提出一种利用随机模型及空间统计学测度刻画海冰空间结构的方法。 本文首先,在空间统计学框架下,SAR影像被表示为多值Gamma模型和泊松线Mosaic模型线性加权构建的混合模型,其中多值Gamma模型用于描述海洋表面雷达信号背向散射变化的连续性,而泊松线Mosaic模型则用于表征不同类型海冰表面雷达信号背向散射变化的区域性。利用上述混合模型的一阶、二阶变异函数,建模蕴含在SAR影像中海冰空间结构的变化。 对RADARSAT-1影像海冰结构建模并反演其密度。实验区域真实海冰密度分别为20%,80%等,运用本文方法反演所得海冰密度与真实海冰密度误差正负不超过10%。 本文提出混合本征模型用以刻画SAR强度影像中海冰像素强度变化的空间关系,能够较好地反演Ungava湾海冰密度分布。为利用遥感影像检测空间机构提供一种全新的方法。  
      关键词:本征模型;变异函数;SAR影像;海冰密度   
      4010
      |
      259
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56121164 false
      更新时间:2024-05-08
    0