最新刊期

    2016 21 3

      综述

    • 光场成像技术及其在计算机视觉中的应用

      张驰, 刘菲, 侯广琦, 孙哲南, 谭铁牛
      2016, 21(3): 263-281. DOI: 10.11834/jig.20160301
      摘要:光场成像技术刚刚在计算机视觉研究中展开初步应用,其相关研究比较零散,缺乏系统性。本文旨在系统介绍光场成像技术发展以及其应用在计算机视觉研究中有代表性的工作。 从解决计算机视觉问题的角度出发,4个层面讨论光场成像技术最近十年的研究工作,包括:1)主流的光场成像设备及其作为计算机视觉传感器的优点与不足;2)光场相机作为视觉传感器的标定、解码以及预处理方法;3)基于4维光场的图像渲染与重建技术,以及其如何促进计算机视觉研究;4)以4维光场数据为基础的特征表达方法。 逐层梳理出光场成像在求解视觉问题中的优势和局限,分析其中根本性的原理与掣肘,力图总结出亟待解决的关键问题以及未来的发展趋势。 作为一种颇具前景的新型计算机视觉传感器技术,光场成像技术的研究必将更为广泛和深入。研究应用于计算机视觉的光场成像技术将有力的引导和促进计算机视觉和光场成像技术协同发展。  
      关键词:光场成像技术;计算机视觉;4维光场;重对焦;深度估计   
      4270
      |
      481
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118370 false
      更新时间:2024-05-07

      图像处理和编码

    • 基于半张量积的图像加密

      王金铭, 王杰, 蒋燕君
      2016, 21(3): 282-296. DOI: 10.11834/jig.20160302
      摘要:作为一门以数学为基础的学科,数学领域的新进展经常能够促进加密技术及密码学的研究与发展。半张量积理论是一种新的数学工具,是传统矩阵乘法理论的推广,它对于实现不同阶的高维矩阵数字信号处理提供了一个非常好的途径。为研究半张量积理论在数字图像处理中的应用,提出一种基于半张量积的图像加密算法。 算法以明文内容为密钥参数,以张量积运算构建阶数远小于输入图像尺寸的可逆密钥矩阵,将低阶密钥矩阵与高阶输入图像进行半张量积运算实现图像的加密与解密。 实验采用8×8密钥矩阵对多个不同尺寸的输入图像进行了验证,比较验证表明,从算法安全性、运行效率来说本文算法较现有的一些算法更有优势,能降低约10%~30%的计算时间。 提出了一种新的加密算法,只要满足密钥矩阵阶数与输入图像尺寸之间的整数倍关系,一个固定阶数的密钥就能实现对不同尺寸图像的加密及解密,有效降低了数据运算量。实验结果表明,该算法具有较高的安全性和运行效率,可在实时数据加密中得到应用。  
      关键词:图像加密;张量积;多尺寸;半张量积;高维矩阵;低维秘钥   
      3273
      |
      338
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115009 false
      更新时间:2024-05-07
    • 开源跨平台的图像可视化调试器设计

      张远辉, 谢波, 许昌
      2016, 21(3): 297-302. DOI: 10.11834/jig.20160303
      摘要:在调试C/C++图像处理程序时,如何以可视化的形式观察被调试程序中的图像变量,对于调试过程尤为关键。目前尚未有跨多操作系统平台的图像可视化调试器可供使用,该款开源跨平台的图像可视化调试器的设计与实现弥补了此领域的不足。 利用GDB(GNU debugger)调试器的Python接口,将被调试程序中的图像变量对应的内存字节序列转化成Python下的2维数组,并采用Matplotlib库加以显示,整个图像显示线程独立于GDB的文本字符交互主线程。 在Windows、Linux、Mac系统中分别进行实验,均可实现图像变量的显示、缩放、平移、像素数值查看、保存等多种功能,并使得GDB的命令行保持非阻塞模式运行。 开源跨平台的图像可视化调试器的设计,满足了不同操作系统平台下图像程序的开发调试需求,弥补了当前GDB调试图像程序功能的不足,提高了图像处理程序的开发和调试效率。  
      关键词:开源;跨平台;图像可视化;调试器   
      2789
      |
      371
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114498 false
      更新时间:2024-05-07

      图像分析和识别

    • 快速优化筛选多尺度矩形域的二进制描述

      白丰, 张明路, 张小俊, 孙凌宇
      2016, 21(3): 303-313. DOI: 10.11834/jig.20160304
      摘要:为更好地兼顾基于手动设置的二进制特征描述子优越的实时性能和基于优化学习的二进制特征描述子鲁棒的区分性能,提出一种快速优化筛选多尺度矩形域的二进制描述算法(MRFO),运用于识别卫星装配时所需的典型工件目标。 按像素的灰度值和梯度方向划分图像并利用不同的高斯核函数进行平滑,建立多尺度的子图像集合;从多尺度的子图像中,快速通过约束条件提取候选矩形域;在训练阶段,通过优化学习计算候选矩形域的相关得分及最优阈值,筛选出其中具有强区分性和低相关性的集合;在测试阶段,计算筛选出的矩形域响应值并利用最优阈值进行二值化,将结果依次串联构成二进制描述向量。 实验通过ROC曲线图和80%精确率条件下的召回率统计结果证明MRFO描述算法具有优越的区分性能,平均的精确度能够高出对比算法8%~12%;并在真实的视频图像中利用MRFO描述算法识别出典型工件目标;根据训练阶段的执行时间只有传统优化学习算法的4.35%,只是在测试阶段略高于手动设置的二进制描述算法,证明MRFO描述算法具有优良的实时性能。 MRFO描述算法能够更好地克服各种视角、尺度和旋转变换的干扰以及周围相似背景信息的影响,准确识别出典型工件目标,有助于提高卫星的地面装配精度和效率,改善国内相关行业的自动化水平。普遍适用性较强,具有良好的应用前景。  
      关键词:目标识别;特征描述;优化学习;快速筛选;多尺度矩形域   
      2499
      |
      486
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115605 false
      更新时间:2024-05-07
    • 结合区域和边界信息的图像显著度检测

      闯跃龙, 楼宋江, 张石清, 郭文平, 赵小明
      2016, 21(3): 314-322. DOI: 10.11834/jig.20160305
      摘要:图像显著度检测是许多图像应用的核心问题,为了能够在复杂背景下准确提取图像中前景对象的位置和尺度信息,提出一种结合区域和边界信息的图像显著度检测方法。 对于图像区域信息,提出一种基于图像等照度线的方法检测显著区域信息。该方法针对不同的特征(颜色、亮度和方向)提出统一的计算方法,使得不同特征下获得的显著信息具有一致的度量标准,从而方便后续多特征显著度图的融合。对于图像边界信息,采用一种结合多尺度Beltrami过滤器的全局方法检测显著边界信息。多尺度Beltrami过滤器可以显著增强图像中的边界信息。利用全局显著度检测方法对经过过滤器处理过的图像可以准确地获取图像中最为显著的边界信息。最后,由于区域和边界分别代表图像中的不同类型信息,可以直接采用线性融合方式构建最终的图像显著度图。 与其他9种流行图像显著度检测算法相比,本文算法无论在简单还是复杂背景下均能够较为准确地检测出图像中的显著度信息(Precision、Recall、F测试中获得的平均值为0.5905,0.6554,0.7470的最高测试结果)。 提出一种结合区域和边界信息的图像显著度检测算法,通过区域和边界信息相结合的方式实现图像中显著对象的准确检测。实验结果表明本文算法具有良好的适用性和鲁棒性,为图像中复杂背景下对象检测打下坚实基础。  
      关键词:图像显著度;等照度线;显著边界;显著区域;Beltrami过滤器   
      2917
      |
      468
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56120252 false
      更新时间:2024-05-07

      计算机图形学

    • 利用Voronoi协方差矩阵重建隐式曲面

      李国俊, 朱光耀, 李宗春, 李伟, 孙元超
      2016, 21(3): 323-330. DOI: 10.11834/jig.20160306
      摘要:针对含少量离群点的噪声点云,提出了一种Voronoi协方差矩阵的曲面重建方法。 以隐函数梯度在Voronoi协方差矩阵形成的张量场内的投影最大化为目标,构建隐函数微分方程,采用离散外微分形式求解连续微分方程,从而将曲面重建问题转化为广义特征值求解问题。在点云空间离散化过程中,附加最短边约束条件,避免了局部空间过度剖分。并引入概率测度理论定义曲面窄带,提高了算法抵抗离群点能力,通过精细剖分曲面窄带,提高了曲面重建精度。 实验结果表明,该算法可以抵抗噪声点和离群点的影响,可以生成不同分辨率的曲面。通过调整拟合参数,可以区分曲面的不同部分。 提出了一种新的隐式曲面重建方法,无需点云法向、稳健性较强,生成的三角面纵横比好。  
      关键词:Voronoi协方差矩阵;离散外微分;概率测度;Delaunay细分;曲面重建   
      2999
      |
      328
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118543 false
      更新时间:2024-05-07
    • 非均匀有理B样条曲线优化匹配组合

      臧永灿, 徐建明, 朱自立, 王耀东
      2016, 21(3): 331-338. DOI: 10.11834/jig.20160307
      摘要:为了解决从曲线库(轮廓线集合)中筛选出与期望曲线相匹配的相似曲线段问题,研究基于Kabsch算法的NURBS(非均匀有理B样条)曲线优化匹配组合方法。 首先提出一种基于Kabsch算法的曲线相似性判断方法,针对两条NURBS曲线上相同个数点阵,经最优旋转和平移变换得到其最小均方根偏差,进而依据基于最小均方根偏差和相似度指标判断曲线相似性;在此基础上,提出一种类似二分查找法的曲线优化匹配组合方法,对于给定相似度和最小搜索步长,通过曲线分割和相似性判断得到期望曲线分割段数最少的相似组合曲线。 给定一条期望的3D曲线,在相似度为0.025和最小搜索步长为0.05情况下,采用所提方法从包含4条3D曲线的曲线库中依次筛选出10段基元构建相似组合曲线。 提出了一种新的NURBS曲线优化匹配组合方法,实验结果表明,对不同期望曲线能高效稳定构建相对应的相似组合曲线,适用于类似碎片拼接重构问题。  
      关键词:NURBS曲线;Kabsch算法;相似度;优化匹配;组合曲线   
      3361
      |
      447
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56119216 false
      更新时间:2024-05-07

      第24届全国多媒体学术会议栏目

    • 并行交叉的深度卷积神经网络模型

      汤鹏杰, 王瀚漓, 左凌轩
      2016, 21(3): 339-347. DOI: 10.11834/jig.20160308
      摘要:图像分类与识别是计算机视觉领域的经典问题,是图像检索、目标识别及视频分析理解等技术的基础。目前,基于深度卷积神经网络(CNN)的模型已经在该领域取得了重大突破,其效果远远超过了传统的基于手工特征的模型。但很多深度模型神经元和参数规模巨大,训练困难。为此根据深度CNN模型和人眼视觉原理,提出并设计了一种深度并行交叉CNN模型(PCCNN模型)。 该模型在Alex-Net基础上,通过两条深度CNN数据变换流,提取两组深度CNN特征;在模型顶端,经过两次混合交叉,得到1024维的图像特征向量,最后使用Softmax回归对图像进行分类识别。 与同类模型相比,该模型所提取的特征更具判别力,具有更好的分类识别性能;在Caltech101上top1识别精度达到63%左右,比VGG16高出近5%,比GoogLeNet高出近10%;在Caltech256上top1识别精度达到46%以上,比VGG16高出近5%,比GoogLeNet高出2.6%。 PCCNN模型用于图像分类与识别效果显著,在中等规模的数据集上具有比同类其他模型更好的性能,在大规模数据集上其性能有待于进一步验证;该模型也为其他深度CNN模型的设计提供了一种新的思路,即在控制深度的同时,提取更多的特征信息,提高深度模型性能。  
      关键词:图像分类;识别;深度CNN;Alex-Net;并行交叉国;人眼视觉   
      6021
      |
      398
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115132 false
      更新时间:2024-05-07
    • 基于躯干检测的单人不良图片识别

      陈骁, 金鑫, 谭晓阳
      2016, 21(3): 348-355. DOI: 10.11834/jig.20160309
      摘要:互联网中色情图片传播泛滥,对其自动识别与过滤越来越重要,而目前多数不良图片识别方法对类肤色区域较多的正常图像容易产生误检。为此,针对网络上常见的单人色情写真类图片,在总结已有方法不足的基础上提出一种将躯干部位作为感兴趣区域的不良图片识别算法。 首先使用基于Poselet(姿态部件)的人体躯干检测方法定位出与色情信息密切相关的躯干区域,然后基于躯干区域提取具有判别力的Fisher向量,最后使用线性支持向量机(SVM)进行分类。然而,由于人体外观变化很大,躯干检测器输出的置信度最大的位置往往较躯干真实的位置有一定的偏移。为了克服这一缺点,提出一种自适应的算法,即根据躯干检测器输出的置信度自适应地选择多个躯干候选区域,并通过集成多个区域的判别结果来得到最终结果。此外,为了训练基于躯干的SVM分类器和验证算法的有效性,本文通过互联网下载的方式收集了一个包含30000幅单人色情写真图片的大规模数据集,并对色情部位进行了标注,标注信息可用于自动生成训练数据。 本文提出的基于躯干的自适应分类算法在收集的大规模数据集上达到了91.7%的识别精度,明显高于传统肤色模型的识别结果,尤其是对于如同泳装模特等皮肤裸露较多或类肤色区域较多的图像,本文方法效果尤为显著。 文中基于Poselet的躯干检测能够获取与色情信息更相关的信息,因而相比较于传统方法,在较为准确地检测不良图片的同时,有效地降低皮肤裸露较多的正常图像的误检率,达到了实际应用的要求。  
      关键词:不良图片识别;躯干检测;Poselet;Fisher向量;支持向量机(SVM)   
      5109
      |
      416
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115715 false
      更新时间:2024-05-07
    • 判别特征回归的鲁棒目标跟踪

      高亚奇, 刘日升, 樊鑫, 李豪杰
      2016, 21(3): 356-364. DOI: 10.11834/jig.20160310
      摘要:近年来,目标跟踪领域取得了很大进步,但是由于尺度变化,运动,形状畸变或者遮挡等造成的外观变化,仍然是目标跟踪中的一大挑战,因而有效的图像表达方法是提高目标跟踪鲁棒性的一个关键因素。 从中层视觉角度出发,首先对训练图像进行超像素分割,将得到特征向量集以及对应的置信值作为输入值,通过特征回归的方法建立目标跟踪中的判别外观模型,将跟踪图像的特征向量输入该模型,得到候选区域的置信值,从而高效地分离前景和背景,确定目标区域。 在公开数据集上进行跟踪实验。本文算法能较好地处理目标尺度变化、姿态变化、光照变化、形状畸变、遮挡等外观变化;和主流跟踪算法进行对比,本文算法在跟踪误差方面表现出色,在carScale、subway、tiger1视频中能取得最好结果,平均误差为12像素,3像素和21像素;和同类型的方法相比,本文算法在算法效率上表现出色,所有视频的跟踪效率均高于同类型算法,在carScale视频中的效率,是同类算法效率的32倍。 实验结果表明,本文目标跟踪算法具有高效性和鲁棒性,适用于目标发生外观变化时的目标跟踪问题。目前跟踪中只用了单一特征,未来考虑融合多特征来提升算法鲁棒性和准确度。  
      关键词:目标跟踪;特征回归;判别外观模型;鲁棒性   
      3781
      |
      357
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114912 false
      更新时间:2024-05-07
    • 利用平稳光流估计的海上视频去抖

      王峰, 张磊, 黄华
      2016, 21(3): 365-372. DOI: 10.11834/jig.20160311
      摘要:海上拍摄的视频存在大面积的无纹理区域,传统基于特征点检测和跟踪的视频去抖方法处理这类视频时往往效果较差。为此提出一种基于平稳光流估计的海上视频去抖算法。 该算法以层次化块匹配作为基础,引入平滑性约束计算基于层次块的光流,能够快速计算海上视频的近似光流场;然后利用基于平稳光流的能量函数优化,实现海上视频的高效去抖动。 分别进行了光流估计运行时间对比、视频稳定运行时间对比和用户体验比较共3组实验。相比于能处理海上视频去抖的SteadyFlow算法,本文的光流估计算法较SteadFlow算法的运动估计方法快10倍左右,整个视频去抖算法在处理速度上能提升70%以上。本文算法能够有效地实现海上视频去抖,获得稳定的输出视频。 提出了一种基于平稳光流估计的海上视频去抖算法,相对于传统方法,本文方法更适合处理海上视频的去抖。  
      关键词:层次化块匹配;平稳光流;海上视频去抖;能量优化   
      4218
      |
      402
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118268 false
      更新时间:2024-05-07
    • 融合显著物体检测的图像显示适配

      李姝蓁, 郭竞帆, 任桐炜, 武港山
      2016, 21(3): 373-381. DOI: 10.11834/jig.20160312
      摘要:图像显著适配旨在自动调节图像尺寸,对图像内容进行非均匀缩放,以便在受限的展示空间内更好地保留显著物体。为了解决显示适配过程中显著物体部分扭曲的问题,提出一种基于显著物体检测的图像显示适配方法。 本文方法采用显著物体分割结果来替代显著性图,以改进显示适配结果。首先,采用显著性融合和传播的方法生成显著性图;接着,结合输入图像和显著性图,采用自适应三阈值方法实现显著物体分割;然后,以此为基础,生成输入图像的曲边网格表示;最后,通过对不同网格的非均匀缩放,生成符合目标尺寸的适配结果。 在面向图像显示适配的公开数据集RetargetMe上,将本文方法与现有的10种代表性显示适配方法的结果进行了人工评估和比较。本文方法可以有效地减少显著物体出现部分扭曲的现象,能在48.8%的图像上取得无明显缺陷的适配效果,比现有最好的方法提高了5%。 基于显著物体检测的图像显示适配方法有助于提高显示适配过程中对显著物体处理的一致性,减少由于显著物体部分扭曲而引起的明显人工处理痕迹,从而达到提升显示适配效果的目的。  
      关键词:图像显示适配;显著物体检测;显著性图;显著物体分割   
      4803
      |
      354
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115509 false
      更新时间:2024-05-07
    • 基于网格面积保持的图像智能适配显示

      李璠, 李可, 颜波
      2016, 21(3): 382-389. DOI: 10.11834/jig.20160313
      摘要:ASAP(as-similar-as-possible)算法在处理某些图像时存在着不足,即重要区域被过分压缩,而非重要区域被拉伸得很大。为此,在该算法已有的研究基础上提出一种改进后的图像处理算法。 利用二次规划,通过在原始能量方程中加入网格面积大小的累加项来改进原算法的能量方程,使网格在放缩过程中不仅要保证均匀缩放,也要保证每个网格的面积尽可能地大。对ASAP算法中被过分压缩和拉伸的图像区域进行保护。然后使用图像评测算法对处理图像进行打分,以衡量算法的改进效果。 改进后的算法保持了原算法的高效。从图像质量上来看,图像过度压缩或拉伸的程度有所缓解,图像较好地保留了原始图像中的信息。在客观评测中,改进算法得分较于原始算法有所增加。评分提高的百分比最大达到了39.0%. 实验结果表明,改进后的算法不仅有较高的效率,而且保护了原始算法中被过分压缩或拉伸的图像区域,得到了视觉效果较好的处理图像。  
      关键词:图像处理;图像智能适配显示;内容感知算法;保持相似性算法;二次规划   
      4133
      |
      327
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115228 false
      更新时间:2024-05-07
    • 视频局部特征描述子的紧凑表示方法

      张翔, 王诗淇, 张新峰, 马思伟, 高文
      2016, 21(3): 390-395. DOI: 10.11834/jig.20160314
      摘要:随着手持移动设备的迅猛发展和大数据时代的到来,以多媒体数据为核心的视觉搜索等研究和应用得到了广泛关注。其中局部特征描述子的压缩、存储和传输起到了举足轻重的作用。为此在传统图像/视频压缩框架中,提出一种高效的视觉局部特征的紧凑表示方法,使得传统内容编码可以适应广泛的检索分析等需求。 为了得到紧凑、有区分度、同时高效的局部特征表示,首先引入了多参考的预测机制,在消除了时空冗余的同时,通过充分利用视频纹理编码的信息,消除了来自纹理-特征之间的冗余。此外,还提出了一种新的率失真优化方法——码率-准确率最优化方法,使得基于匹配/检索应用的性能达到最优。 在不同数据集上进行验证实验,和最新的视频局部描述子压缩框架进行比较,本文方法能够在保证匹配和检索性能的基础上,显著地减少特征带来的比特消耗,达到大约150:1的压缩比。 本文方法适用于传统图像/视频编码框架,通过在码流中嵌入少量表示特征的信息,即可实现高效的检索性能,是一种面向检索等智能设备应用的新型多媒体内容编码框架。  
      关键词:计算机科学与技术;视觉搜索;视频局部特征描述子;尺度不变特征变换;高效视频压缩   
      5298
      |
      347
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116326 false
      更新时间:2024-05-07
    • 3维立体动画制作的视觉效果评价

      王泽宇, 卢大玮, 刘亮, 马华东
      2016, 21(3): 396-405. DOI: 10.11834/jig.20160315
      摘要:视觉效果评价是3维立体动画制作过程中不可忽略的一环。评价过程主要依靠专业人员的行业经验,受人员知识水平、测试环境等因素的影响。针对该问题,提出了一个主客观结合的评价模型。 首先建立了一个面向前期制作的三维动画场景数据集用以训练和测试,针对视觉效果评价的两个重要指标:立体感和视觉舒适度,进行主观实验得到相应的分数;提取全局视觉舒适度特征和感兴趣区域立体感特征,使用支持向量回归(SVR)方法,经过训练和测试得到舒适度评价模型和立体感评价模型。 通过将性能验证实验得到验证场景的主观分数与评价模型给出的结果进行比对,结果表明,运用评价模型得到的预测分数与观众主观分数基本一致,该模型可以对影响视觉效果的视觉舒适度和立体感予以5级量化评分。 本文所提出的视觉舒适度和立体感评价方法,能建立影响视觉效果的特征与主观评分间的关系,用得到的模型预测分数给制作人员一个及时直观的调节依据标准。  
      关键词:可视化;动画制作;3维立体;视差;视觉效果评价;渲染   
      4746
      |
      336
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118827 false
      更新时间:2024-05-07
    0