最新刊期

    2015 20 9

      综述

    • 局部图像描述符最新研究进展

      许允喜, 陈方
      2015, 20(9): 1133-1150. DOI: 10.11834/jig.20150901
      摘要:局部图像描述符广泛应用于许多图像理解和计算机视觉应用领域,如图像分类、目标识别、图像检索、机器人导航、纹理分类等。SIFT算法的提出标志着现代局部图像描述符研究的开始。主要对最近发展的现代局部图像描述符进行了综述。 首先,介绍了4大类局部图像描述符:局部特征空间分布描述符、局部特征空间关联描述符、基于机器学习的局部描述符、扩展局部描述符(局部颜色描述符、局部RGB-D描述符、局部空时描述符)。对局部图像描述符进行了分析和分类,并总结了局部图像描述符的不变性、计算复杂度、应用领域、评价方法和评价数据集。最后,展望了局部图像描述符的未来研究方向。 近年来局部图像描述符研究取得了很大进展,提出了很多优秀的描述符,在辨别性、鲁棒性和实时性方面有了很大提高,应用领域不断拓展。 局部图像描述符应用广泛,是计算机视觉领域的重要基础研究。而目前,局部图像描述符还存在许多问题,还需进一步的深入研究。  
      关键词:局部图像描述符;局部不变特征;图像匹配;图像分类   
      4717
      |
      478
      |
      11
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118209 false
      更新时间:2024-05-08

      图像处理和编码

    • 主色提取的直方图峰值筛选与剔除方法

      朱臻阳, 刘春晓, 伍敏, 陈丽丽
      2015, 20(9): 1151-1160. DOI: 10.11834/jig.20150902
      摘要:针对已有主色提取方法中存在的严重误检和漏检现象以及要求主色数量固定等问题,在分析主色特征含义的基础上提出了一种用于主色提取的直方图峰值筛选与剔除算法。 首先根据像素的空间聚集度统计出图像的鲁棒颜色直方图,并提取其局部峰值形成候选主色集;然后根据各候选主色的隶属像素数和空间分布特征以及它们之间的共同相似像素数,对候选主色进行循环筛选;最后通过候选主色剔除过程,将隶属像素数目过少、空间分布过于分散或与其他候选主色差异较小的候选主色去掉,得到最终的图像主色。另外,针对已有主色评价方法比较片面的缺陷,设计了一个能够全面反映主色影响因素的主色综合评价模型。 大量的实验结果表明,本文算法提取的主色在代表图像颜色特征的有效性上超越了已有的方法,且本文算法平均评价分数是已有最高得分算法的1.1倍,相对提高了约10个百分点。 鉴于该算法所展示的优越性能,它在图像检索、分割和编辑等领域具有较大的潜在应用价值。  
      关键词:主色;直方图峰值;评价模型;筛选策略;剔除策略   
      4676
      |
      507
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116669 false
      更新时间:2024-05-08
    • 强度和梯度稀疏约束下的图像平滑

      胡大盟, 黄伟国, 张永萍, 杨剑宇, 朱忠奎
      2015, 20(9): 1161-1169. DOI: 10.11834/jig.20150903
      摘要:为了在图像平滑过程中达到更好地保留边缘去除细节效果,提出一种以像素强度和梯度的稀疏特性为双重约束的图像平滑算法。 该算法首先构造一个像素强度和梯度的0-范数函数,作为平滑模型的约束项;然后采用半二次变量分裂法引入辅助变量,构造最终的较易求解的平滑模型;最后利用交替最小化算法求解该模型,并在傅里叶频域内求解平滑图像的解析解,以加快算法的运行速度。 在自然图像上进行的平滑实验并与其他算法对比表明,本文的算法时间仅需3.42 s,比双边滤波算法快7.85 s,能够较好地满足图像平滑保留边缘去除细节的要求以及计算效率的要求。 本文以强度和梯度的稀疏特性为约束的图像平滑算法能够较好地去除图像中不重要的细节,保留图像的边缘特征,较好地实现了图像的平滑效果,适用于含有复杂背景噪声的图像平滑去噪及边界增强。  
      关键词:图像平滑;像素强度和梯度;稀疏;交替最小化   
      3128
      |
      763
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118232 false
      更新时间:2024-05-08
    • 基于稀疏编码的多模态信息交叉检索

      刘菲, 刘学亮
      2015, 20(9): 1170-1176. DOI: 10.11834/jig.20150904
      摘要:多模态信息交叉检索的根本问题是多模态数据的特征表示。稀疏编码是一种有效的数据特征表示方法,但是当查询数据和被检索数据来自不同模态时,数据间存在分布差异,相似的特征可能被编码为差异显著的稀疏表示,此时传统稀疏编码便不再适用。为此,提出了一种基于稀疏编码的多模态信息交叉检索算法。 采用最大均值差异(MMD)以及图拉普拉斯,并将二者加入到稀疏编码的目标函数中来充分利用多模态信息进行编码,模型求解采用特征符号搜索和离散线搜索算法逐个更新稀疏编码系数。 在Wikipedia的文本图像对数据上进行实验,并与传统稀疏编码进行比较,实验结果表明,本文算法使交叉检索的平均准确率(MAP)提高了18.7%。 本文算法增强了稀疏表示的鲁棒性,提高了多模态交叉检索的准确率,更适用于对多模态数据进行特征提取,并进行进一步的操作,如交叉检索、分类等。  
      关键词:多模态;交叉检索;稀疏编码;最大均值差异;图拉普拉斯   
      3386
      |
      302
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115146 false
      更新时间:2024-05-08

      图像分析和识别

    • 点线光流预测机制的图像序列运动直线跟踪

      张聪炫, 陈震, 黎明
      2015, 20(9): 1177-1187. DOI: 10.11834/jig.20150905
      摘要:针对复杂场景图像序列中运动直线特征的提取、跟踪问题,提出一种基于点、线光流预测机制的图像序列运动直线跟踪方法。 首先根据图像直线的表达式定义点、线光流基本约束方程,由基本约束方程推导出关于点光流与直线光流对应关系的3个重要推论。然后依据点、线光流对应关系,利用图像序列中直线特征上的像素点光流计算直线光流的估计值并根据直线光流阈值筛选图像序列运动直线。最后由筛选出的运动直线及直线光流估计值计算直线的预测坐标并在Hough域内进行跟踪匹配,得到图像序列运动直线跟踪结果。 通过合成及真实图像序列实验验证,本文方法能够准确地筛选出图像序列中感兴趣的运动直线,并对运动直线进行稳定地跟踪、匹配,直线跟踪结果未产生干扰直线的误匹配,直线跟踪时间消耗不超过12 s。 相对于传统的直线跟踪、匹配方法,本文方法具有较高地直线跟踪精度和较好的鲁棒性,更适用于复杂场景下的运动直线跟踪、匹配问题。  
      关键词:运动直线跟踪;点光流;直线光流;预测机制   
      3139
      |
      328
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115035 false
      更新时间:2024-05-08
    • 联合特征融合和判别性外观模型的多目标跟踪

      黄奇, 项俊, 侯建华, 张华, 笪邦友
      2015, 20(9): 1188-1198. DOI: 10.11834/jig.20150906
      摘要:针对基于检测的目标跟踪问题,提出一种联合多特征融合和判别性外观模型的多目标跟踪算法。 对时间滑动窗内的检测器输出响应,采用双阈值法对相邻帧目标进行初级关联,形成可靠的跟踪片,从中提取训练样本;融合多个特征对样本进行鲁棒表达,利用Adaboost算法在线训练分类器,形成目标的判别性外观模型;再利用该模型对可靠的跟踪片进行多次迭代关联,形成目标完整的轨迹。 4个视频数据库的目标跟踪结果表明,本文算法能较好的处理目标间遮挡、目标自身形变,以及背景干扰。对TUD-Crossing数据库的跟踪结果进行了定量分析,本文算法的FAF(跟踪视频序列时,平均每帧被错误跟踪的目标数)为0.21、MT(在整个序列中,有超过80%视频帧被跟踪成功目标数占视频序列目标总数的比例)为84.6%、ML(在整个序列中,有低于20%视频帧被跟踪成功目标数占视频序列目标总数的比例)为7.7%、Frag(视频序列目标真值所对应轨迹在跟踪中断开的次数)为9、IDS(在跟踪中,目标身份的改变次数)为4; 与其他同类型多目标跟踪算法相比,本文算法在FAF和Frag两个评估参数上表现出色。 融合特征能对目标进行较为全面的表达、判别性外观模型能有效地应用于跟踪片关联,本文算法能实现复杂场景下的多目标跟踪,且可以应用到一些高级算法的预处理中,如行为识别中的轨迹检索。  
      关键词:多目标跟踪;判别性外观模型;AdaBoost;时间滑动窗   
      3155
      |
      392
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118444 false
      更新时间:2024-05-08
    • 在线复合模板模型表示的视觉目标跟踪

      亚森江·木沙, 赵春霞
      2015, 20(9): 1199-1211. DOI: 10.11834/jig.20150907
      摘要:视觉目标跟踪中,目标往往受到自身或场景中各种复杂干扰因素的影响,这对正确捕捉所感兴趣的目标信息带来极大的挑战。特别是,跟踪器所用的模板数据主要是在线学习获得,数据的可靠性直接影响到候选样本外观模型表示的精度。针对视觉目标跟踪中目标模板学习和候选样本外观模型表示等问题,采用一种较为有效的模板组织策略以及更为精确的模型表示技术,提出一种新颖的视觉目标跟踪算法。 跟踪框架中,将候选样本外观模型表示假设为由一组复合模板和最小重构误差组成的线性回归问题,首先利用经典的增量主成分分析法从在线高维数据中学习出一组低维子空间基向量(模板正样本),并根据前一时刻跟踪结果在线实时采样一些特殊的负样本加以扩充目标模板数据,再利用新组织的模板基向量和独立同分布的高斯—拉普拉斯混合噪声来线性拟合候选目标外观模型,最后估计出候选样本和真实目标之间的最大似然度,从而使跟踪器能够准确捕捉每一时刻的真实目标状态信息。 在一些公认测试视频序列上的实验结果表明,本文算法在目标模板学习和候选样本外观模型表示等方面比同类方法更能准确有效地反映出视频场景中目标状态的各种复杂变化,能够较好地解决各种不确定干扰因素下的模型退化和跟踪漂移问题,和一些优秀的同类算法相比,可以达到相同甚至更高的跟踪精度。 本文算法能够在线学习较为精准的目标模板并定期更新,使得跟踪器良好地适应内在或外在因素(姿态、光照、遮挡、尺度、背景扰乱及运动模糊等)所引起的视觉信息变化,始终保持其最佳的状态,使得候选样本外观模型的表示更加可靠准确,从而展现出更为鲁棒的性能。  
      关键词:在线学习;复合模板;模型表示;视觉目标跟踪   
      3493
      |
      391
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118320 false
      更新时间:2024-05-08
    • 采用指数矩的图像区域复制粘贴篡改检测

      赖玥聪, 黄添强, 蒋仁祥
      2015, 20(9): 1212-1221. DOI: 10.11834/jig.20150908
      摘要:图像区域复制粘贴篡改是目前众多图像篡改技术中一种简单而且常见的方式。针对目前大多数区域复制粘贴篡改检测算法鲁棒性不强,提出一种基于指数矩的图像篡改检测算法。 首先将图像分成重叠的图像子块,然后提取每一图像子块的指数矩作为特征向量进行字典排序,利用向量相似度和位移初步确定疑似图像子块,再根据疑似图像子块的相邻子块个数和角度方差去除误匹配块,得到最终篡改区域。 该算法具有良好的鲁棒性,与采用圆谐-傅里叶矩的算法相比,在图像受到噪声干扰时,检测率平均提高26.66%,错误率平均降低33.77%。 本文算法利用图像的指数矩,针对图像区域复制粘贴篡改操作,能有效检测出图像的篡改区域。检测图像在经过旋转、高斯模糊和添加噪声等后期处理时,算法依然有效。  
      关键词:图像取证;区域复制粘贴;指数矩;字典排序   
      3286
      |
      413
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118072 false
      更新时间:2024-05-08
    • 结合图元与感知哈希的手写输入简笔画识别

      郭玉鹏, 曹卫群
      2015, 20(9): 1222-1229. DOI: 10.11834/jig.20150909
      摘要:为了克服手写输入中随意性强和自由度大的缺陷,同时兼顾简笔画的整体属性和局部特征,提出一种基于图元识别与感知哈希技术相结合的手写输入简笔画二级识别算法。 首先提取笔画的几何特征、笔序特征及结构特征且进行识别,然后查找由图元信息、笔画结构信息和笔序信息构成的简笔画语义库,完成由规则的几何图元构成的简笔画识别;若未被识别,则生成简笔画图像,利用感知哈希技术完成简笔画图像的识别。 基于本文提出的简笔画识别方法,实现了对样本库中150种简笔画对象的识别,平均识别率为82.6%。 实验结果表明,对于不同用户手写输入的任意样本库中的简笔画,该方法具有较高的识别率,此外,还可以通过在简笔画语义库和样本库中增加简笔画的种类等方式实现对更多种类简笔画的扩展识别。  
      关键词:简笔画;图元;KNN分类器;感知哈希技术;二级识别算法   
      2867
      |
      346
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118640 false
      更新时间:2024-05-08

      计算机图形学

    • 网格修补的特征配准方法

      钱归平, 张小红, 潘瑞芳
      2015, 20(9): 1230-1236. DOI: 10.11834/jig.20150910
      摘要:网格重建和编辑会产生几何特征缺失的模型,填补这些空洞具有重要的意义。为了克服复杂曲面修补中网格融合难以配准的问题,提出了环驱动球坐标结合基于曲率及法向ICP(iterative closest point)迭代配准的网格修补方法。 首先用户查找合适的源网格面片放入空洞处周围;然后对目标网格空洞环建立B样条曲线,将带修补网格包边界置于B样条曲线上,构架环驱动球坐标,将源网格变形初步配准目标网格空洞周围领域;最后使用Laplacian光顺并基于网格曲率及法向进行ICP迭代配准,使源网格与目标网格光滑拼接融合。 该方法能够有效修补网格空洞缺失的细节特征,并且拼接处光滑连续。 环驱动球坐标配准避免了网格变形的包围网格笼子构造,再通过ICP迭代精确配准网格,和以往的网格修补方法相比,该方法能够很好地修补网格空洞处细节特征。  
      关键词:网格修补;环驱动球坐标;ICP迭代;拉普拉斯光顺   
      3085
      |
      410
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56118720 false
      更新时间:2024-05-08
    • 基于生理舌头模型的语音可视化系统

      江辰, 於俊, 罗常伟, 李睿, 汪增福
      2015, 20(9): 1237-1246. DOI: 10.11834/jig.20150911
      摘要:目前针对舌头的语音同步动画技术还未得到广泛的研究。在此背景下,提出了一种基于生理模型的舌头动画合成方法。 首先构建了一个精细的、能够在肌肉激励下产生逼真舌头变形的舌头生理模型;其次利用该舌头模型合成了大量的舌头运动样本,并据此通过学习得到一个从肌肉激励到舌头轮廓的转换模型;然后对采集的动态2维舌头轮廓数据进行运动参数估计以得到与音素对应的体素(肌肉激励序列和刚体位移序列);最后将体素按一定的排列方式输入到舌头生理模型进行仿真以生成相应的舌头动画。 该系统可以合成听觉效果逼真的语音和视觉效果逼真且与合成语音同步的舌头动画。 本文方法可以根据汉语普通话或其他语言的2维舌头轮廓数据构建音素—体素数据库,并据此合成该语言对应的高真实感的3维舌头动画。  
      关键词:语音可视化;舌头模型;人脸动画;舌头动画;物理仿真   
      2857
      |
      365
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115726 false
      更新时间:2024-05-08
    • 面向移动终端的分布并行化渲染

      刘镇, 刘晓, 梅向东
      2015, 20(9): 1247-1252. DOI: 10.11834/jig.20150912
      摘要:随着移动互联技术和实时渲染技术的快速发展,面向移动终端的3维展示提供了远程交互式的模型渲染,但较高的渲染计算复杂度与较大的数据处理规模,影响了移动终端3维展示的渲染质量和实时性。针对以上不足,提出一种面向移动终端的分布并行化渲染方法。 该方法将渲染任务分布到服务端与终端,服务端采用层次细节模型控制场景复杂度,生成初次渲染图像;终端采用基于图像的渲染技术再次绘制图像,提高渲染质量,同时在渲染过程中利用CUDA(compute unified device architecture)并行计算加速渲染数据处理。 本方法有效提高了渲染速度,降低了数据传输量,并保证了图像质量,帧率和数据传输量优化了大约10.8%。 本文方法为面向移动终端的3维展示提供了很好的解决途径,在移动网络环境中,能够有效降低服务端负载压力,提高资源利用率并改善用户体验。  
      关键词:分布渲染;层次细节模型;基于图像的渲染;CUDA(compute unified device architecture)   
      3113
      |
      451
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114901 false
      更新时间:2024-05-08
    • 反正切色调分化模型的铅笔画绘制

      卢从利, 尚媛园, 丁辉, 周修庄, 付小雁
      2015, 20(9): 1253-1261. DOI: 10.11834/jig.20150913
      摘要:在现阶段采用计算机模拟绘制真实铅笔画往往不能够逼近真实效果,主要原因之一是没有考虑到真实铅笔画中的色调较灰度图像有着更明显的暗灰亮层次变化的特性,基于这一问题提出一种新的铅笔画自动生成算法。 一方面在外轮廓提取中采取了LAB空间色差图与纹理图结合的方法,取代了传统基于梯度图的方法;另一方面保留了纹理色调连续变化的特点,且为了体现色调的分层效果提出了反正切色调分化模型,其核心思想是基于图像暗灰亮图层的像素比例来自适应地调整像素灰度值以达到色调分层的目的。 本文算法能够避开噪点的影响更好地展示细节,同时解决了直接分层结果中色调变化突然的缺陷,实现了亮度分层与色调连续变化的结合。 新算法在最终效果上较其他算法的优势体现在两方面,一是轮廓线的连续性更好,对比度更强,其次是纹理的效果能够同时兼顾连续性和分层,这是其他算法做不到的,本文算法适用于所有不同分辨率的彩色或灰度图像,且分辨率越高效果越好。  
      关键词:线性积分卷积(LIC);LAB空间色差图;纹理对比度;反正切色调分化模型   
      3318
      |
      866
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115638 false
      更新时间:2024-05-08

      虚拟现实与增强现实

    • 融入情绪模型的人群实时路径规划

      吴云鹏, 杜沅泽, 叶阳东
      2015, 20(9): 1262-1274. DOI: 10.11834/jig.20150914
      摘要:人群仿真中高效性和逼真性是群体路径规划的关键问题。已有人群路径规划算法忽略了人群情绪造成的路径选择差异,在大规模实时仿真中仍存在一定的局限性。 提出一种融入情绪模型的人群实时路径规划算法(EPP)。使用人格特征理论对人群的情绪进行建模并设定不同情绪所具有的路径选择偏好。在路径建模阶段,通过单次搜索建立全局有向导航图,确定全局层面的可行路径;在路径搜索阶段,提出以期望时间最短为原则的路径规划目标函数,采用局部搜索策略为个体实时规划一条最优或次优的路径。 EPP算法可有效地仿真不同场景下大规模人群的路径选择现象;与已有工作的仿真效果和量化指标对比说明了该算法的有效性和高效性;通过不同情绪状态下人群路径选择差异的讨论以及在不同人群运动模型的兼容性实验进一步说明了该算法的健壮性。 本文算法具有良好的高效性和健壮性,适用于不同场景下大规模人群路径规划的相关应用。  
      关键词:路径规划;情绪模型;全局有向导航图;目标函数;人群仿真   
      3327
      |
      365
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114923 false
      更新时间:2024-05-08

      遥感图像处理

    • 基于Landsat 8卫星影像的北京地区土地覆盖分类

      王婷婷, 李山山, 李安, 冯旭祥, 吴业炜
      2015, 20(9): 1275-1284. DOI: 10.11834/jig.20150915
      摘要:土地覆盖分类能为生态系统模型、水资源模型和气候模型等提供重要信息,遥感技术运用于土地覆盖分类具有诸多优势。作为区域性土地覆盖分类应用的重要数据源,Landsat 5/7的TM和ETM+等数据已逐渐失效,Landsat 8陆地成像仪(OLI)较TM和ETM+增加了新的特性,利用Landsat 8数据进行北京地区土地覆盖分类研究,探讨处理方法的适用性。 首先,确定研究区域内土地覆盖分类系统,并对Landsat 8多光谱数据进行预处理,包括大气校正、地形校正、影像拼接及裁剪;然后,利用灰度共生矩阵提取全色波段纹理信息,与多光谱数据进行融合;最后,使用支持向量机(SVM)进行分类,获得土地覆盖分类结果。 经过精度评价和分析发现,6S模型大气校正和C模型地形校正预处理提高了不同类别之间的可分性,多光谱数据结合全色波段纹理特征能有效提高部分地物的土地覆盖分类精度,总体精度提高2.8%。 相对于Landsat TM/ETM+数据,Landsat 8 OLI数据新增特性有利于土地覆盖分类精度的提高。本文方法适用于Landsat 8 OLI数据土地覆盖分类研究与应用,能够满足大区域土地覆盖分类应用需求。  
      关键词:Landsat 8;土地覆盖;分类方法;纹理   
      4623
      |
      444
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114815 false
      更新时间:2024-05-08
    0