最新刊期

    2012 17 7

      综述

    • 中国多媒体技术研究: 2011

      史元春, 徐光祐, 高原
      2012, 17(7): 741-747. DOI: 10.11834/jig.20120701
      摘要:本文是中国多媒体技术研究与应用的年度文献综述之十四。本文从2011年9种核心刊物的2841篇中选取349篇多媒体技术相关的文章进行了分类、统计,以展现出2011年中国多媒体技术发展的现状。由于分类标准在去年进行过细微调整,较好地适应了多媒体发展的趋势,因此今年仍然采用去年的分类标准。通过分类统计结果可以看出,数字水印、数据管理与检索、QoS控制、流媒体多播、交互模式与接口、生物特征身份识别等多媒体基础技术连续两年都是论文反映出的研究热点,同时,多媒体应用在数目和种类上都日益丰富,与社会生活的结合程度越来越紧密。该文还比较了近5年中国多媒体技术文献统计结果,以得出多媒体技术,特别是特点技术的发展趋势。该文既能为从事多媒体技术研究与应用的人员提供系统的文献索引,也能为技术规划和管理人员提供参考。  
      关键词:多媒体;数字水印;数据管理与检索;QoS控制;流媒体多播;交互模式与接口;生物特征身份识别   
      3167
      |
      96
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127021 false
      更新时间:2024-05-08

      图像处理和编码

    • 图像引导滤波的局部多尺度Retinex算法

      方帅, 杨静荣, 曹洋, 武鹏飞, 饶瑞中
      2012, 17(7): 748-755. DOI: 10.11834/jig.20120702
      摘要:Retinex算法是一种用于消除由光照变化给图像所带来的负面影响的图像增强算法。该算法的求解通常需要基于入射分量分段光滑的假设,利用正则化的方法迭代求解,计算效率低。文中基于一项最近提出的研究——"图像引导滤波",提出一种非迭代的Retinex算法框架。基于反射分量也满足分段光滑的假设,采用两次图像引导滤波克服了图像噪声所带来的影响。然后在基于小波变换域图像融合策略的基础上,提出基于图像引导滤波的多尺度Retinex算法,实现图像细节增强与颜色保真之间的平衡。实验结果表明,与各种算法相比,该算法在克服噪声、细节增强和颜色保真方面能够取得更好的效果。  
      关键词:Retinex理论;图像增强;引导滤波;双边滤波   
      5463
      |
      137
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126089 false
      更新时间:2024-05-08
    • 基于第一主成分方向稳定性的图像零水印

      付剑晶, 王珂
      2012, 17(7): 756-769. DOI: 10.11834/jig.20120703
      摘要:针对灰度值攻击如亮度值的绝对修改、对比度改变、参数直方图均衡化,以及组合攻击破坏数字图像水印,利用第一主成分向量方向的稳定性,提出了一种适应性很强的零水印方法,解决了水印的不可见性与鲁棒性的矛盾。首先分析了第一主成分方向的稳定性,接着通过实验测试它在空域与变换域的表现。在此基础上对输入图像执行多级DT-CWT分解,选择它的两个低频子带并分别进行分块,计算各子块的第一主成分向量;然后分别计算它们与一个秘密参考向量的夹角;最后比较两个低频子带对应子块的夹角关系抽取图像特征。此外对所提出的方案进行了安全性与鲁棒性分析。通过对6幅图像的20种单项攻击以及50种组合攻击进行实验,结果表明所提出的方案在鲁棒性、经受攻击的广泛性、实用性3方面综合性能优越。  
      关键词:图像水印;灰度值攻击;组合攻击;DT-CWT变换;零水印   
      2994
      |
      56
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125884 false
      更新时间:2024-05-08
    • 小波变换估计非线性扩散最优停止时间

      蒋平, 张建州
      2012, 17(7): 770-774. DOI: 10.11834/jig.20120704
      摘要:Gilboa提出一种针对高斯噪声的基于信噪比(SNR)最优的迭代停止时间估计方法。该方法用一个噪声补丁来估计图像噪声与冗余(噪声图像与去噪图像的差)的协方差对冗余方差的导数,补丁是随机生成的纯高斯噪声图像,其均值为零并且方差等于噪声图像的噪声方差。在实际应用中图像噪声方差未知,补丁的噪声是随机的,不同噪声所得到的最后停止时间可能不同。针对这些问题,对该方法进行了改进。首先将图像进行小波变换;再利用小波系数的层间相关性去掉第1层斜向高频系数(HH)中的边缘纹理信息,获得"纯"的子噪声;然后把子噪声作为补丁的噪声取代随机噪声。实验结果表明,改进方法不仅能解决随机噪声补丁的两个问题,而且去噪图像在峰值信噪比(PSNR)上有一定优势。  
      关键词:非线性扩散;最优停止时间;小波变换;高斯噪声;信噪比   
      3256
      |
      53
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126958 false
      更新时间:2024-05-08

      图像分析和识别

    • 改进的Beamlet与Canny相结合提取复杂图像线特征

      曾接贤, 周沥沥, 符祥
      2012, 17(7): 775-782. DOI: 10.11834/jig.20120705
      摘要:传统Beamlet无结构算法在提取图像线特征时不仅存在重叠模糊的缺陷,而且在提取复杂图像线特征时不能有效地检测出目标信息,细节特征更是难以刻画。针对这些问题,提出将改进的Beamlet无结构算法与Canny算子相结合的方法提取复杂图像的线特征。首先,对图像进行Beamlet变换,通过改进Beamlet无结构算法,采用新的能量统计和制定新的划线规则,以保证每个二进方块最多有一条最优基;然后,对图像用Canny算子检测边缘,通过选取较大的Sigma,只检测明显的大边缘;最后,两者结合得到图像的线特征。从检测的线特征的线型连接程度等方面对该算法的性能进行了评价,并与现有的方法进行了比较,实验结果表明,该方法克服了两种方法单独提取线特征时存在的断裂、重叠、模糊和虚假边缘的缺点,有效地提高了复杂图像线特征提取的准确性和连续性。  
      关键词:Beamlet变换;Canny算子;复杂图像;线特征提取   
      3144
      |
      83
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125784 false
      更新时间:2024-05-08
    • 动静态信息融合及动态贝叶斯网络的步态识别

      杨旗, 薛定宇
      2012, 17(7): 783-790. DOI: 10.11834/jig.20120706
      摘要:步态是远距离视频监控领域最具潜力的生物特征。目前对步态的识别研究大都是考虑单一条件下步态的识别率,但在穿外套、背包等混合条件下识别率较低,通过分析人体行走时步态的时序特征,提出一种基于动静态信息相结合的多信息融合的动态贝叶斯网络(DSIF-DBN)。模型含有3层状态,模型中每个时间片都为静态信息和动态信息的融合。此模型能很好地表达步态的时序特性,即步态行走时人体姿态,运动幅度等特征的节奏性变化。实验结果表明该方法有较高的识别率,能有机地融合步态的静态信息及动态信息,并且在有噪声及信息缺失的情况下有较好的鲁棒性,大大降低了外套及背包对步态识别的影响。  
      关键词:步态识别;视频监控;动态贝叶斯网络;信息融合   
      3403
      |
      60
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125809 false
      更新时间:2024-05-08
    • 融合音频单词与视觉特征的成人视频检测

      刘毅志, 唐胜, 王向东, 林守勋, 张勇东
      2012, 17(7): 791-797. DOI: 10.11834/jig.20120707
      摘要:基于多模态的检测方法是过滤成人视频的有效手段,然而现有方法中缺乏准确的音频语义表示方法。因此本文提出融合音频单词与视觉特征的成人视频检测方法。先提出基于周期性的能量包络单元(简称EE)分割算法,将音频流准确地分割为EE的序列;再提出基于EE和BoW(Bag-of-Words)的音频语义表示方法,将EE的特征描述为音频单词的出现概率;采用复合加权方法融合音频单词与视觉特征的检测结果;还提出基于周期性的成人视频判别算法,与基于周期性的EE分割算法前后配合,以充分利用周期性进行检测。实验结果表明,与基于视觉特征的方法相比,本文方法显著提高了检测性能。当误检率为9.76%时,检出率可达94.44%。  
      关键词:成人视频检测;多模态融合;音频单词;视觉特征;能量包络单元   
      3985
      |
      67
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127331 false
      更新时间:2024-05-08
    • 基于平面区域跟踪的目标位姿参数自动测量

      回丙伟, 文贡坚, 赵竹新, 钟金荣
      2012, 17(7): 798-805. DOI: 10.11834/jig.20120708
      摘要:提出一种从序列图像中自动跟踪测量目标位置和姿态参数的方法。利用单应性原理和上一帧图像中目标位姿参数的测量结果,将目标上的典型平面区域重建为同时含有几何信息和亮度信息的平面区域模板;然后根据投影方程,将该模板在一定的位置姿态参数下进行投影仿真成像,当模板的仿真成像结果与当前帧图像中的该平面区域达到最佳匹配时,认为此时仿真成像的位置姿态参数即为当前帧图像的测量结果。通过对该匹配问题进行最优化建模和求解,实现了序列图像中目标位姿参数的自动测量。实验结果表明,本文方法能够在序列图像中对含有典型平面区域的目标实现较高精度的自动跟踪测量。  
      关键词:序列图像;最优化模型;位置姿态测量;目标跟踪   
      2966
      |
      65
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125991 false
      更新时间:2024-05-08
    • 3维图像中边界曲面的分类追踪及抽取

      丁德福, 程柳航, 王利生
      2012, 17(7): 806-812. DOI: 10.11834/jig.20120709
      摘要:3维图像分析中,边界曲面的检测与重构是一个非常重要的问题。已有的连续隐边界曲面的抽取及逼近计算技术存在着把某些零交叉曲面片错误地识别为边界曲面片的缺陷。为此,提出一个新的边界曲面的追踪及抽取的方法。该方法首先将包含边界曲面的全部立方体分为两类:包含一个连通零交叉曲面片的立方体叫第1类边缘立方体,包含两个及其以上不连通零交叉曲面片的立方体叫第2类边缘立方体;然后根据边界曲面的连续性连通性,便可追踪出两类边缘立方体;对于追踪出的第1类边缘立方体直接提取边界曲面片,对于追踪出的第2类边缘立方体的边界曲面片通过其相邻的第1类边缘立方体来提取。实验结果表明本文方法是可行有效的,而且可以有效地克服已有技术的缺陷。  
      关键词:3维图像分析;边界曲面检测;零交叉曲面片;边界曲面追踪   
      2630
      |
      69
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125799 false
      更新时间:2024-05-08
    • 局部时空域模型的核密度估计目标检测方法

      王兴宝, 刘纯平, 费兰英, 王朝晖, 季怡
      2012, 17(7): 813-820. DOI: 10.11834/jig.20120710
      摘要:针对非参数核密度估计在前期学习阶段信息冗余和计算量大,在后期背景更新阶段自适应性差需手动调整阈值和检测结果出现阴影等问题,提出一种基于局部时空域模型的核密度估计目标检测方法。在前期训练学习阶段采用K均值聚类选择关键帧,从而避免信息冗余和计算量大问题;在后期背景更新阶段,构建一种局部时空域模型,在时间域通过历史帧信息自适应调整时间域窗口大小,在空间域利用颜色和LBP描述的纹理特征消除部分阴影问题。在复杂场景下的实验结果表明,该算法在实时性和检测准确率方面有效得到提高。  
      关键词:核密度估计;局部时空域模型;K均值;LBP算子   
      3128
      |
      65
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125906 false
      更新时间:2024-05-08
    • 基于相位谱和调谐幅度谱的显著性检测方法

      李崇飞, 高颖慧, 卢凯, 曲智国
      2012, 17(7): 821-827. DOI: 10.11834/jig.20120711
      摘要:针对目前视觉注意选择领域中的谱残余方法(SR)显著图对比度较差、细节显著性检测效果不理想的问题,通过分析图像频谱特性与显著性的关系,提出了一种基于频谱分析的显著性区域检测方法。该方法通过保留傅里叶相位谱并对幅度谱进行分段非线性调谐,达到抑制图像冗余信息、增强图像显著性信息的效果。实验结果表明,本文基于相位谱和幅度谱调谐(PTA)的显著性检测方法得到的显著图较SR方法对比度更高,对显著细节的检测效果也更明显。  
      关键词:相位谱;幅度谱;非线性调谐;显著图   
      3165
      |
      109
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126739 false
      更新时间:2024-05-08

      图像理解和计算机视觉

    • “目标-场景”语境关联的生成图模型分析

      谢昭, 李姗琦, 高隽
      2012, 17(7): 828-838. DOI: 10.11834/jig.20120712
      摘要:图像场景分析是目前计算机视觉领域的研究热点,体现了场景与目标之间的包含关系。在分析过程中合理的使用基于上下文关系的知识可以提高场景分析模型的适用性和目标识别的准确率。从"图像集——场景——目标——部分——视觉词汇"这种层次的角度进行场景分析,将全局上下文信息和局部上下文信息同时融入到基于HDP的生成图模型中,在场景层和目标层这两个不同的层次上,共同作用于场景分析。场景分析的结果可以用来约束目标识别,目标识别的结果可以反馈作用于场景分析。  
      关键词:场景分析;生成图模型;上下文信息;反馈机制;目标识别   
      3435
      |
      66
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126535 false
      更新时间:2024-05-08
    • 融合上下文信息的场景结构恢复

      武晖, 于昕, 隋尧, 张利
      2012, 17(7): 839-845. DOI: 10.11834/jig.20120713
      摘要:提出了一种融合场景上下文信息的两级分类算法,从单幅图像中恢复场景结构。室外场景的结构化特征使其3维结构可以粗略地分为3类:"地面","天空"以及"竖直物体"。首先,把图像分割成具有灰度和颜色一致性的区域;其次确定特征显著区域("确定区域")的结构,将特征不明显的区域标记为"未知区域";然后根据"未知区域"与"确定区域"的相似性及"确定区域"场景结构对"未知区域"的可能结构进行投票,将投票最多的结构类型赋予"未知区域";最后介绍场景结构恢复在构造场景3维模型方面的应用。实验结果表明,由于利用了场景结构的上下文信息,该算法场景结构恢复的正确率为92.3%,优于现有算法88.1%的恢复正确率。  
      关键词:场景理解;模式识别;图像分割;上下文信息   
      3255
      |
      50
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126039 false
      更新时间:2024-05-08
    • 带有局部控制因子的图割光流估计

      路子赟, 唐土生, 高隽, 沈琳, 刘伟
      2012, 17(7): 846-852. DOI: 10.11834/jig.20120714
      摘要:提出一种带有局部空间项控制因子的图割光流估计算法,能判断和处理光流场的平移遮挡现象。文中分析了平移遮挡的形成机理,构造了遮挡判别公式,基于本次的正向和反向光流场,依靠遮挡判别结果调节局部空间项控制因子,建立下次的能量泛函,加强背景区域对遮挡区域的平滑作用,隔绝运动区域对遮挡区域的平滑作用,从而构造出新结构的网络流图。另外,该算法被证明可以阻断遮挡误判在各次图割优化过程间的传递,从而使逐次-扩散移动图割光流算法具有自适应处理遮挡的能力。通过与Ground-truth光流场的实验对比,表明该算法能较好地判断与处理遮挡导致的光流场无效区域。  
      关键词:光流估计;平移遮挡;局部空间项控制因子;逐次;-扩散移动图割;帧序   
      2898
      |
      43
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126791 false
      更新时间:2024-05-08
    • 改进的Harris亚像素角点快速定位

      何海清, 黄声享
      2012, 17(7): 853-857. DOI: 10.11834/jig.20120715
      摘要:针对Harris算法检测角点存在偏差、运算慢、像素级精度难于满足实际应用需要等问题,改进了Harris角点检测方法。该方法在Harris提取角点过程中,通过两次角点筛选,剔除非角点和伪角点,利用角点响应函数执行非极大值抑制,以局部角点响应函数最大值的像素点作为初始角点,并以该初始角点为中心,以一定半径搜索角点簇,采用最小二乘法加权角点簇与待求角点的欧几里得距离,精化初始角点坐标,从而实现Harris亚像素角点准确快速定位。实验结果表明了该方法的有效性和实用性。  
      关键词:Harris算法;角点检测;亚像素角点;角点响应函数;欧几里得距离   
      4242
      |
      90
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126143 false
      更新时间:2024-05-08

      计算机图形学

    • 应用最小生成树实现点云分割

      孙金虎, 周来水, 安鲁陵
      2012, 17(7): 858-865. DOI: 10.11834/jig.20120716
      摘要:点云分割是点云参数化、形状识别、编辑造型等领域的关键基础算法。提出一种基于最小生成树的点云模型分割算法,包括生成带状分割边界、区域增长、拆分带状分割边界以及生成最终区域4个步骤。算法采用Snake模型提取分割曲线并向两侧扩展形成带状分割边,利用最小生成树实现区域增长来提取区域内部点,最后拆分带状分割边界并与已有区域合并形成最终区域。实验结果表明,该算法能够有效避免过分割和欠分割,能够生成光顺分割边界,与Level Set分割算法相比具有较高的效率。  
      关键词:点云;模型分割;Snake模型;最小生成树;K邻域;区域增长   
      3999
      |
      87
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126427 false
      更新时间:2024-05-08

      医学图像处理

    • 病毒进化的离散差分进化超声图像特征选择

      张巧荣, 朱长明, 倪军, 刘海波
      2012, 17(7): 866-872. DOI: 10.11834/jig.20120717
      摘要:选择具有识别作用的超声图像淋巴结区域特征对临床诊断具有重要价值。针对目前特征选择算法收敛速度慢和容易陷入局部极小值的问题,提出病毒协同进化的离散差分进化的颈部淋巴结超声图像特征选择算法。该算法主要利用病毒感染操作进行宿主个体的变异,在维持宿主个体多样性的同时保留最优的搜索信息,提高了算法的适应度函数值和进化速度。在临床颈部淋巴结超声图像中进行实验验证,分类精度达到98%,而算法平均收敛迭代次数仅为30次,表明本文所提算法是正确有效的。  
      关键词:病毒进化;离散差分进化;超声图像;特征选择   
      2846
      |
      50
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125819 false
      更新时间:2024-05-08
    • 分水岭优化的Snake模型肝脏图像分割

      兰红, 张璐
      2012, 17(7): 873-879. DOI: 10.11834/jig.20120718
      摘要:Snake算法是主动轮廓模型的经典算法,是近年来图像分割和视频领域研究的热点。针对Snake模型中存在的初始轮廓敏感和能量函数中曲率约束不足等问题,提出将分水岭变换和主动轮廓模型相结合的主动轮廓分割算法。首先通过引入标记函数和强制最小值技术解决传统分水岭变换可能导致的过分割问题,然后利用改进的强制标记分水岭算法优化Snake模型的初始轮廓曲线, 最后通过在Snake模型中增加一项与曲线形状相关的外部力弥补能量约束函数中曲率约束的不足,从而实现更精确的图像分割。改进后的Snake模型应用于腹部MR图像中,对肝脏图像的识别和分割取得了良好效果。  
      关键词:Snake 算法;图像分割;分水岭变换;肝脏图像   
      4245
      |
      100
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126840 false
      更新时间:2024-05-08

      遥感图像处理

    • 许菡, 李小娟
      2012, 17(7): 880-885. DOI: 10.11834/jig.20120719
      摘要:现有的遥感影像端元提取方法主要是从光谱特征角度提出,而结合空间信息的端元提取方法是近些年遥感影像混合像元分解的研究热点,为此使用图论的图像分割Normalized Cut与分水岭变换方法提出了一种改进的空间预处理模型用于高光谱遥感影像混合像元的端元提取。该方法在混合像元端元提取过程中不仅利用遥感影像的光谱信息而且引入了像元的空间位置信息,实验结果表明本文提出的端元提取方法与现有的方法相比提高了遥感影像的混合像元分解精度。  
      关键词:遥感影像分割;分水岭变换;Normalized Cut;端元提取;高光谱数据   
      3170
      |
      62
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126690 false
      更新时间:2024-05-08
    • 改进非局部均值滤波的SAR图像降噪

      郑永恒, 程建, 曹宗杰
      2012, 17(7): 886-891. DOI: 10.11834/jig.20120720
      摘要:在非局部均值滤波(NLMF)的基础上,通过预生成相似集与2DPCA (two-dimensional principle component analysis)对NLMF进行改进,提出一种新的SAR (synthetic aperture radar)图像降噪方法。在NLMF算法框架下,针对SAR图像噪声的特点,首先经预处理选择邻近的子图像生成相似集,然后通过2DPCA提取子图像的主要特征,此过程减小了斑点噪声对相似性度量的影响,最后在降维后子图像的基础上进行相似性度量。通过仿真SAR图像和真实SAR图像的降噪实验,将本文方法与经典Lee滤波、Kuan滤波、Gamma-Map滤波和NLMF滤波相比较,结果表明,该方法无论在边缘保持还是一致区域的平滑上,都能取得较好的效果,是一种有效的SAR图像降噪算法。  
      关键词:SAR图像降噪;相似集;2维主成分分析(2DPCA);非局部均值滤波(NLMF)   
      3880
      |
      80
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126449 false
      更新时间:2024-05-08

      本期目录

    • “中国多媒体技术研究:2011”统计文献分类一览

      史元春, 徐光祐, 高原
      2012, 17(7) DOI: 10.11834/jig.20120721
      摘要:无  
      关键词:无   
      2479
      |
      40
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126992 false
      更新时间:2024-05-08
    0