最新刊期

    2010 15 8

      主题栏目

    • 支持隐式人机交互的分布式视觉系统

      2010, 15(8): 1133. DOI: 10.11834/jig.20100818
      摘要:交互技术的发展推动着交互方式的转变并催生新的交互理论和交互范式。隐式人机交互是一种新型人机交互范式,其特点是用户无需直接操作计算机等设备,交互系统通过分布式传感器检测,分析用户动作,在线地获取当前的动态上下文,用于理解用户的意图,作为系统的隐含输入,产生与用户意图相适应的隐含输出来为用户服务。本文分析了隐式交互对计算系统的需求,提出了通用化的面向应用的服务共享模型,以用于构建分布式视觉系统。基于该系统实现的隐式交互实例表明,上述模型是通用的服务共享模型,能够实现多种隐式交互系统。  
      关键词:隐式交互;视觉系统;交互理论;上下文感知   
      3688
      |
      275
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56135156 false
      更新时间:2024-05-07
    • 一种草图形式的视频摘要生成方法

      陈 佳, 滕东兴, 杨海燕, 马翠霞, 王宏安
      2010, 15(8): 1139. DOI: 10.11834/jig.20100816
      摘要:视频摘要作为一种视频内容的简要表示,能够有效地增强用户浏览和组织视频的效率。提出了一种基于草图的视频摘要生成方法。与以往的静态视频摘要方法不同,该方法结合视频内容分析,利用草图在表达上的简洁性和抽象性,对视频中的主要内容进行表达。首先通过视频分析获取视频中的语义特征并提取关键帧,然后通过交互式的方法从关键帧中生成草图,最后进行摘要布局生成完整的视频摘要。实验结果表明,该方法能够有效突出视频的主要对象和主要事件,并具有较高的用户满意度。  
      关键词:视频摘要;草图;非真实感图形学   
      3355
      |
      227
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56135205 false
      更新时间:2024-05-07
    • 虚拟环境中的人脸姿态交互方法

      杭 飞, 刘惠义
      2010, 15(8): 1145. DOI: 10.11834/jig.20100817
      摘要:提出一种基于面积比的人脸姿态估计方法,先分析人脸姿态发生变化时特征点之间形成的三角形的面积变化,再应用BP神经网络对位置参数和人脸姿态参数的关系进行学习,从而对人脸姿态进行估计,最后将该方法应用于虚拟环境的漫游中。实验结果表明,采用该方法对人脸转动进行估计,采用的特征点比较少,具有较高的识别率和稳定性。  
      关键词:姿态估计;神经网络;人机交互   
      2857
      |
      261
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56135016 false
      更新时间:2024-05-07
    • 实物界面下的虚拟装配

      2010, 15(8): 1151. DOI: 10.11834/jig.20100815
      摘要:基于增强现实技术,将实物用户界面应用到虚拟装配系统中,在单摄像头的条件下,将虚拟零件模型加载至实物标记上,用户通过操作实物标记来控制虚拟模型,完成装配过程。相比于传统的虚拟装配交互方式,增强了用户操作的切实感。根据装配任务需求设计了4类实物标记。提出了3种交互技术,包括接近性原理,匹配约束信息提示与判定,以及视点控制等,并且结合碰撞检测来实现精确而又自然的虚拟装配。该系统可以帮助设计人员方便地对产品设计进行分析和改进,降低用户的学习难度。  
      关键词:实物界面;虚拟装配;约束;接近性原理;视点控制   
      3380
      |
      222
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56133862 false
      更新时间:2024-05-07

      综述

    • Delaunay三角网构建方法比较研究

      余 杰, 吕 品, 郑昌文
      2010, 15(8): 1158. DOI: 10.11834/jig.20100804
      摘要:Delaunay三角网构建是3维场景可视化领域的一个热点也是难点问题。归纳总结了现有Delaunay三角网构建研究中的3类方法——逐点插入法、三角网生长法和分治法,以及在各自原理框架下的不同实现算法;比较分析了3种不同方法的优缺点和各自代表性算法的时间复杂度,并详细讨论了Delaunay三角网构建方法在大规模场景渲染和地形可视化领域中未来3个研究方向:混合算法研究、算法支撑技术研究和分布式并行算法研究。  
      关键词:Delaunay三角形;构网方法;构网效率;比较研究   
      4095
      |
      307
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56133842 false
      更新时间:2024-05-07

      图像处理和编码

    • 基于灭点理论和平面控制场的相机标定方法研究

      杨化超, 张书毕, 刘 超
      2010, 15(8): 1168. DOI: 10.11834/jig.20100801
      摘要:给出了一种基于灭点理论和平面控制场的相机解析自标定方法。在系统分析平面场景灭点几何的基础上,依据灭点理论并结合2维场景的共线方程严密论证和推导了平面控制场中相机外方位元素初值的实用算法。给出了一种圆形标志点的快速检测及定位方法,提出了一种基于计算可靠性矩阵QVVP的自检校光束法平差中各类观测值权值的确定方法。实验证明了该相机标定方法的正确性和有效性,为相机标定探索了一种可行的方法。  
      关键词:相机标定;共线方程;外方位元素;灭点   
      3848
      |
      281
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56134637 false
      更新时间:2024-05-07
    • 基于Markov链安全性的二阶统计保持隐写算法

      张 湛, 刘光杰, 戴跃伟, 王执铨
      2010, 15(8): 1175. DOI: 10.11834/jig.20100803
      摘要:如何设计高阶统计安全的大容量隐写算法是当前隐写研究的难点和热点。该文基于Markov链安全性指标和动态补偿的思路,提出一种二阶统计保持的隐写算法。该算法在不降低嵌入量的前提下尽量保持了载体图像的二阶统计特性。实验结果表明,该算法在较大容量数据嵌入过程中,能较好保持二阶统计特性,取得隐写安全性的提高。  
      关键词:信息隐藏;隐写;Markov链;统计二阶保持   
      3235
      |
      359
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56133532 false
      更新时间:2024-05-07
    • 码书排序对快速码字搜索算法性能影响的分析

      乔 阳, 潘志斌, 乔瑞萍
      2010, 15(8): 1182. DOI: 10.11834/jig.20100809
      摘要:矢量量化快速码字搜索算法中,为了有效地减小搜索范围,必须对原始码书按一定的准则进行重新排序。对现存的两类快速码字搜索算法进行了总结,其中一类是码书按1维顺序关系排序,另一类是码书按2维相邻关系排序。通过实验给出了两类算法的搜索范围和编码时间,并进行了比较和分析,进而提出了在实际编码时如何更好地使用这两种排序关系的准则。  
      关键词:矢量量化;码字快速搜索;码书排序;性能评价   
      3348
      |
      182
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56134331 false
      更新时间:2024-05-07
    • 用于内容认证的半脆弱可逆视频水印算法

      曾 骁, 陈真勇, 范 围, 陈 辉, 熊 璋
      2010, 15(8): 1189. DOI: 10.11834/jig.20100802
      摘要:提出了一种运用哈希函数进行MPEG-4内容认证的半脆弱可逆视频水印算法。在YUV视频进行MPEG-4编码的I帧中嵌入两个水印,一个运用哈希函数进行内容完整性验证并嵌入帧序号进行帧间篡改定位,另一个基于直流系数和低频系数用于帧内篡改定位。实验结果表明,算法能够对视频内容进行验证并实现篡改定位,且对MPEG-4压缩具有鲁棒性。另外,算法具有可逆性,能够在视频内容可信的前提下进行无损恢复。  
      关键词:视频水印;MPEG-4;半脆弱;可逆;篡改定位   
      3071
      |
      220
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56133369 false
      更新时间:2024-05-07

      图像分析和识别

    • 一种模糊特征驱动曲线演化的图像分割

      石澄贤, 王洪元, 夏德深
      2010, 15(8): 1196. DOI: 10.11834/jig.20100808
      摘要:利用模糊特征向量表示图像上各区域上的特性,然后把模糊特征向量集成到简化Mumford-Shah模型。这种推广的Mumford-Shah模型与原来的Mumford-Shah模型相比能包含更多的图像信息,增强了图像分割的性能,而复杂程度却没有提高。原来的模型是推广模型的特例。对弱边缘、凹凸区域和复杂背景的图像能较好地分割。人工合成图像、真实图像的实验说明推广模型对图像分割的有效性。  
      关键词:模糊特征;图像分割;Mumford-Shah模型   
      3021
      |
      361
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56132522 false
      更新时间:2024-05-07
    • 基于像素层背景模型的复杂场景运动目标检测

      韩建平, 张明敏, 潘志庚
      2010, 15(8): 1201. DOI: 10.11834/jig.20100810
      摘要:为了从复杂变化背景中鲁棒地检测、提取运动目标,提出一种基于像素层背景模型的运动目标检测算法。该算法采用快速均值漂移方法将背景帧上具有相同统计特性的像素划分为一个像素层,背景模型从而被表示为一组像素层,通过与邻域像素对应的层匹配来检测运动前景像素。实验结果表明,该方法可以实时、准确地检测运动目标,特别是在摄像机颤动等原因造成的背景时域不规则变化情况下,比经典的基于混合高斯背景模型的方法具有更好的检测效果。  
      关键词:视频分析;运动目标检测;背景模型;视觉监控   
      3240
      |
      330
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56131808 false
      更新时间:2024-05-07
    • 基于LHBP多尺度向性滤波的文字检测算法

      许鹏飞, 姚鸿勋, 纪荣嵘, 王积成, 孙晓帅
      2010, 15(8): 1207. DOI: 10.11834/jig.20100806
      摘要:复杂光照条件和文字—背景的交融是自然场景图像中文字检测的主要难点。为解决该问题,提出了基于LHBP(local Haar binary pattern)多尺度向性滤波的文字检测算法。该算法首先采用对光强变化不敏感并具文字特征显式描述特点的LHBP模式的纹理描述算子;并在LHBP模式上采用多尺度向性滤波器MDF(multi-scale directional filtering)来确定候选文字区域;最后使用基于LHBP直方图的支持向量机法精确定位文字区域。实验结果表明,与其他主流算法相比,该算法能够去除复杂光照条件和文字—背景交融的影响,具有更好的性能。  
      关键词:文字检测;Haar小波;LHBP;支持向量机   
      3747
      |
      253
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56132792 false
      更新时间:2024-05-07
    • 一种Beamlet变换下的图像边缘检测算法

      陈 雨, 方 滨, 王 普
      2010, 15(8): 1214. DOI: 10.11834/jig.20100807
      摘要:Beamlet变换是一种多尺度分析的有效工具。对基于Beamlet变换的线特征提取算法进行改进,提出一种表示Beamlet上图像灰度值加权平均的算式,提出在图像子块内沿Beamlet的各个方向搜索边缘,形成一种图像边缘检测的新算法。从检测到的边缘连贯性等方面对该算法的性能进行了评价,将该算法应用于车道线等图像的边缘检测和车道识别。实验结果表明,该算法检测到的边缘连贯性好,算法的错检率和漏检率低,且具有较强的提取线特征的能力;检测到的边缘线段包含位置、方向等信息,便于对车道等目标进行识别;算法的缺点是:抗噪性不够好且计算较为复杂,有待改进。  
      关键词:多尺度几何分析;Beamlet变换;边缘检测;车道识别   
      3505
      |
      359
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56134087 false
      更新时间:2024-05-07
    • 基于稳定区域的形变指纹匹配算法

      陈小光, 封举富
      2010, 15(8): 1220. DOI: 10.11834/jig.20100819
      摘要:针对指纹匹配中的非线性形变问题,首次提出了稳定区域的概念,并给出了一种新颖的基于指纹稳定区域的形变指纹匹配算法。通过稳定区域这一概念,巧妙地把指纹匹配问题转化为寻找两幅指纹中对应稳定区域的问题。该算法通过稳定区域的构造、确认和扩张3个步骤,实现了从点到面再到更大区域,从线性形变区域到非线性形变区域的匹配策略。该算法在国际指纹识别竞赛FVC2004的数据库上进行了测试,实验结果表明,该算法有着良好的匹配性能,并有较强的处理非线性形变的能力。  
      关键词:指纹匹配;非线性形变;稳定区域   
      3134
      |
      233
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56132888 false
      更新时间:2024-05-07
    • 花粉外壁纹饰的图像分析方法

      裴 勇, 付 慧, 陆光沛, 袁军辉, 曹卫群, 陈建军
      2010, 15(8): 1230. DOI: 10.11834/jig.20100814
      摘要:花粉外壁纹饰特征作为衡量被子植物进化程度的参考依据之一,对其准确刻画具有重要意义。论文分析了传统测量方法的特点和不足,提出了利用图像处理技术测量花粉外壁纹饰图像的方法。该方法实现了对于花粉外壁纹饰图像快速、精确的测量。通过对实验数据的对比分析,验证了该文提出方法的可靠性。  
      关键词:图像处理;花粉外壁纹饰;芍药   
      4065
      |
      294
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56133789 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 一种新的基于局部特征的图像质量评价方法

      任 雪, 孙 涵, 张金国
      2010, 15(8): 1236. DOI: 10.11834/jig.20100820
      摘要:传统的基于结构相似度(SSIM)的质量评价方法具有适用范围狭窄,评价算法不稳定等特点。在对传统图像质量评价算法研究的基础上,提出了一种新的基于局部特征的质量评价方法。与传统方法不同,在对图像质量进行评价时,该方法充分考虑到图像的结构信息对于图像质量的影响。新的方法主要分为3个步骤:首先,基于一种新的图像分块算法,根据图像的结构信息将图像划分成不同的块;其次,利用图像的梯度作为衡量像素重要程度的权值,计算参考图像和失真图像对应图像块的结构相似度;最后,融合各个块的相似度信息获得最终的图像质量评价结果。实验结果表明,该方法的评价结果更加合理、稳定,适用范围广,优于传统的基于结构相似度的质量评价方法。  
      关键词:图像分块;结构相似度;图像质量评价   
      3309
      |
      769
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56134447 false
      更新时间:2024-05-07
    • 盲复原图像振铃效应评价

      2010, 15(8): 1244. DOI: 10.11834/jig.20100821
      摘要:线性空不变盲复原算法通常会在较为明显的边缘处产生振铃效应。振铃现象主要受噪声,复原算法种类,以及复原算法参数的选择的影响。提出了一种盲复原图像振铃效应评价方法。方法根据振铃效应的不同类型,使用Gabor滤波器,共生向量等方法分别对其进行评价,最后提出整体的振铃效应评价方法。实验结果表明,该方法可以有效地评价不同复原算法和不同复原参数下的复原图像中的振铃效应,评价结果符合主观评价结果。  
      关键词:图像质量评价;复原;振铃效应;边缘;测度   
      4678
      |
      218
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56134254 false
      更新时间:2024-05-07
    • 基于多模式均值时空模型的目标融合检测方法

      赵高鹏, 薄煜明
      2010, 15(8): 1254. DOI: 10.11834/jig.20100813
      摘要:针对复杂环境下的目标检测问题,提出了一种基于背景模型的融合检测方法。首先在多模式均值模型的基础上,构造多模式均值时空模型,结合像素在时空域上的分布信息,改善了模型对非平稳场景较为敏感的缺点,给出了模型更新方法和前景检测方法;然后利用该模型对可见光和红外图像序列分别进行建模和前景检测,给出了一种基于置信度的目标融合检测方法,利用双传感器信息提高检测精度和可靠性。实验结果验证了本文方法的有效性。  
      关键词:目标检测;多模式均值时空模型;融合检测   
      3116
      |
      281
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56131948 false
      更新时间:2024-05-07

      计算机图形学

    • 基于MMP三角曲面测地线算法研究

      2010, 15(8): 1260. DOI: 10.11834/jig.20100805
      摘要:测地线的计算在计算机图形处理等方面有着广泛的应用。采用基于MMP(Mitchell, Mount,Papadimitrious)方法,实现了三角曲面上测地线的计算,修正了Vitaly Surazhsky等采用的测地线算法中的误差。该方法首先在窗口传播上摒弃了原有的近似结束条件,采用光源射线法。特别在窗口相交处理过程中采用多种情况的分层枚举,补充了Vitaly Surazhsky讲述的单一情况,窗函数多交点时的测地线偏差情况,并且提供简洁的回溯方法。实验结果表明,该方法所需时间相当于Vitaly Surazhsky算法,可以代替Vitaly Surazhsky采用的算法。  
      关键词:测地线计算;MMP算法;窗函数;三角曲面   
      3640
      |
      261
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56133089 false
      更新时间:2024-05-07

      遥感图像处理

    • 龚建周, 刘彦随, 夏北成, 陈健飞
      2010, 15(8): 1269. DOI: 10.11834/jig.20100812
      摘要:随着遥感技术的快速发展以及遥感数据的广泛应用,影像的融合处理已成为多源遥感影像信息聚合、获取高质量空间影像的有效途径。基于SPOT全色和多光谱、TM多光谱遥感数据,运用IHS和小波变换相结合的融合方法,进行了不同来源影像融合、融合图像质量对小波分解层数的响应以及这种响应对研究区域面积的敏感性分析。结果表明,多源影像之间的IHS和小波变换相结合的融合方法明显地改善了影像的质量;融合图像质量与原始影像空间分辨率相关,如经1层小波变换融合,TM,SPOT融合图像熵值的增幅分别为2095%,019%。小波融合图像质量对小波分解的层数的敏感性较强,在小波分解层数为2,3或4时,都能获得高质量的融合图像;小波分解层数等于或大于5时融合图像质量下降,7是大幅下降的临界层数。融合图像质量对小波分解层数的响应特性对面积大小变化是敏感的,特别是小面积图像,为此,实际应用中需特别注意最佳分解层数问题。  
      关键词:小波分解层数;图像融合;小波变换;IHS;遥感数据   
      3217
      |
      268
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56132158 false
      更新时间:2024-05-07
    • 热红外与多光谱遥感图像的神经网络回归融合方法研究

      姚 为, 韩 敏
      2010, 15(8): 1278. DOI: 10.11834/jig.20100811
      摘要:为验证神经网络方法用于遥感图像融合的有效性,归纳了利用神经网络对遥感数据进行回归来实现融合的3种途径,并提出了一种结合图像数据回归和多光谱遥感图像锐化技术来实现热红外图像的全色锐化新方法。这种热红外图像的全色锐化方法,利用了极限学习机(ELM)这种新型神经网络算法,快速高效地由训练样本得到遥感图像数据间的回归关系;同时,方法注重图像数据本身的物理含义,以提高热红外图像数据的真实质量为目标,是一种定量化的图像融合方法。经这种方法融合得到的热红外数据也能很好地用于定量遥感的物理模型,为遥感的实际应用提供方便。该方法的有效性通过对ETM+图像进行实验得到了证明,而直接对热红外图像数据和全色图像数据进行回归的融合模式,在实验中则无法得到满意的结果。  
      关键词:遥感;图像融合;全色锐化;回归;极限学习机   
      3120
      |
      337
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56134761 false
      更新时间:2024-05-07
    0