最新刊期

    2008 13 4

      图像处理和编码

    • 一种新的基于基准线的形状编码

      龚声蓉, 陆悌亮, 沈项军, 刘纯平
      2008, 13(4): 605. DOI: 10.11834/jig.20080401
      摘要:在图像编码系统中,为了获得较好的解码质量,提出了一种新的基于基准线的形状编码算法。该算法首先采用1维数据描述2维形状信息,并借助形状轮廓来抽取距离集和拐点;然后采用DPCM对距离集和拐点进行编码,从而有效地节约了码流。实验结果表明,该算法不仅能够适应各种特殊的形状边界走向,具有很好的重构效果,而且能有效克服基于块的形状编码所产生的阶梯效应问题。  
      关键词:距离集;拐点;基准线;形状编码   
      3615
      |
      170
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140867 false
      更新时间:2024-05-08
    • 空间可扩展视频编码中增强层上的帧内预测算法研究

      王樟, 柳健, 田金文
      2008, 13(4): 612. DOI: 10.11834/jig.20080402
      摘要:针对空间可扩展视频编码,提出了一种新的增强层上的帧内预测算法。该算法充分考虑了相邻层间所固有的空域相关性,在无法正确获取本层邻块预测值的情况下,利用基本层上插值放大后的解码,通过重构宏块来对增强层上的编码宏块进行帧内预测。此外,还在预测过程中,通过引入与图像纹理特征相关联的自适应加权因子对 (Wv, Wh) 来进一步提高新算法的编码性能。实验结果表明,与H.264标准中的帧内预测算法相比,新算法在保持原有码率和不增加额外的计算复杂度的前提下,可一定程度地提高亮度分量的PSNR值,因此可以作为空间可扩展视频编码中增强层上的帧内编码方案。  
      关键词:H.264;帧内预测;可扩展视频编码;空间增强层   
      2443
      |
      178
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56142124 false
      更新时间:2024-05-08
    • DCLSA:一种适用于H.264/AVC的DCT系数分层置乱算法

      包先雨, 蒋建国, 李援
      2008, 13(4): 618. DOI: 10.11834/jig.20080403
      摘要:基于目前的DCT系数加密算法在安全性、压缩比和信噪比上都各自存在缺点,提出了一种新的适用于H264/AVC的DCT系数分层置乱算法(DCLSA)。该算法针对H264/AVC中4×4 DCT变换的特点,首先将同一宏块中每个4×4块DCT系数进行块间分层,构建系数分层模型,然后可根据安全性要求对不同层系数进行随机置乱,实现加密编码。通过性能比较和具体实验效果分析,此算法具有更高的安全性、更优的压缩比和较好的信噪比,适合于H.264/AVC的网络安全应用。  
      关键词:H.264/AVC;DCT系数置乱;视频加密;密钥同步   
      2846
      |
      200
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141465 false
      更新时间:2024-05-08
    • 稳健平滑算法的改进策略

      李欣, 孙懋珩
      2008, 13(4): 624. DOI: 10.11834/jig.20080404
      摘要:众所周知,一个优秀的平滑算法必须在去除噪声的同时,还要具有良好的边缘细节保持能力。稳健平滑算法虽然是一种很简单的算法,但存在着它的缺陷。针对稳健平滑算法只能消除空间密度不大的椒盐噪声这一不足,在分析和实现已有改进算法的基础上,提出了新的改进策略,即一种自适应的稳健平滑算法,该算法在去除密度大的噪声的同时,保持了良好的边缘信息,使处理效果得到了很大的改进。该算法用MATLAB编程,通过这种新的自适应稳健平滑算法与其他算法对于受椒盐噪声污染程度不同的图像的平滑效果的仿真实验对比证明,该算法具有更好的滤波性能,尤其在噪声严重时,去噪效果优于已有的稳健滤波算法和中值滤波算法。  
      关键词:稳健平滑;图像平滑;椒盐噪声;自适应   
      2670
      |
      222
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56139581 false
      更新时间:2024-05-08
    • 基于平滑滤波的H.264 I帧模式决定策略

      余冰, 张太镒
      2008, 13(4): 629. DOI: 10.11834/jig.20080405
      摘要:为了降低H264中I帧编码模式选择时的计算量,提出了一种快速编码算法。该方法首先选择适当的滤波算子对待编码宏块进行平滑滤波,同时使用滤波后的结果与原始宏块数据进行比较来得到滤波残差量;然后将该滤波残差量作为依据,提前判断出当前宏块编码所属的基本模式集,这样由于减小了候选模式的范围,因而提高了模式决定的效率。在判定过程中还使用了双阈值方法,该方法可确保在作出合理判决时,亦不影响图像质量。采用该算法不仅一定程度上降低了计算复杂度,并且对图像质量的影响可以忽略不计。实验表明,这种新的算法可以降低约16%的计算量,而编码图像峰值信噪比的下降只有01dB,且对比特率的影响不到1%。  
      关键词:I帧;帧内预测;低通滤波   
      2870
      |
      169
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140927 false
      更新时间:2024-05-08
    • 基于ART2网络的彩色像素分析及其应用

      陈众, 蔡自兴, 叶青
      2008, 13(4): 634. DOI: 10.11834/jig.20080406
      摘要:像素分析是图像处理相关领域的其他分析(例如形状、纹理等)的基础,正确而有效地识别图像或视频流中像素的色彩及亮度是顺利进行后续工作的保证。在对RGB颜色空间做合理映射变换的基础上,提出了将ART2网络运用于彩色像素的归类,并通过图像处理的过程和结果演示了警戒值调节和“幼态延续”学习的作用。对处理结果的理论分析表明,这种方法符合人类观察图像的心理和生理过程,对阴影等干扰信息具有较强的适应性。  
      关键词:像素分析;阴影;ART2;图像处理   
      2604
      |
      182
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140118 false
      更新时间:2024-05-08
    • 基于颜色对特征点主成分分析的车牌校正方法

      黄 骥, 吴一全
      2008, 13(4): 642. DOI: 10.11834/jig.20080407
      摘要:为了在车牌的倾斜校正过程中减少车牌边框和噪声干扰的影响,并简化计算过程,提出了一种基于颜色对特征点主成分分析(PCA)的车牌水平校正方法。该方法根据车牌背景与字符交界处的颜色具有固定搭配这一特点,首先在原始车牌图像中提取颜色对特征点,并将所有颜色对特征点视为待分析的样本;然后构建这些样本特征点的2维散布矩阵,并通过主成分分析求出其主成分方向,该主成分方向就是车牌的水平倾斜方向;最后再进行相应的旋转,即可获得校正后图像。由于这种方法将车牌的颜色信息和边缘信息融合后共同使用于车牌的校正过程,同时将搜索图像倾斜角度转换为2维实对称矩阵进行计算,从而简化了计算。通过编程对实际车牌图像进行的实验结果证明,该方法对于边框不清或含有噪声干扰的图像仍然能取得较好的校正结果。  
      关键词:车牌;倾斜校正;颜色对;主成分分析   
      3408
      |
      200
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56144332 false
      更新时间:2024-05-08
    • 不含旋转角度微分的螺旋锥束CT重建

      马建华, 陈武凡
      2008, 13(4): 647. DOI: 10.11834/jig.20080408
      摘要:近年来, Katsevich提出一种基于滤波反投影的螺旋锥束CT重建算法,并给出相应的重建公式改进形式,可以有效地解决长物体成像问题。基于Katsevich算法框架,提出了新的螺旋锥束CT精确重建算法。该算法利用数学上严格的推导,将Katseivch重建公式中关于旋转角度的微分运算完全回避,使得成像质量得到较大改善,减少了重建伪影。同时,新算法仍然基于平移不变滤波且数据冗余加权在滤波过程之后进行,保持了数值计算的灵活性。为验证本文算法的有效性,对计算机模拟数据进行仿真实验,实验结果表明,新重建算法的重建图像质量较Katsevich重建算法有较大提高。  
      关键词:计算机断层成像;螺旋锥束;Hilbert滤波   
      2744
      |
      196
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141720 false
      更新时间:2024-05-08
    • 3维数字化技术在考古中的应用

      刘江涛, 张爱武, 臧克
      2008, 13(4): 654. DOI: 10.11834/jig.20080409
      摘要:3维激光扫描技术在大遗址数字化应用中涉及数据采集、数据加工、3维建模等关键技术。以三星堆遗址一号祭祀坑为例,采用Riegl LMS Z420i 3维激光扫描仪和尼康D100数码相机分别获取几何点云数据与纹理数据,并通过PolyWorks软件实现多站点点云数据配准与3维建模,给出大遗址数字化的整个工艺流程。  
      关键词:激光扫描;数据配准;ICP算法;3维建模   
      3082
      |
      186
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140333 false
      更新时间:2024-05-08

      图像分析和识别

    • 基于最大互信息量的图像自动优化分割

      卢振泰, 吕庆文, 陈武凡
      2008, 13(4): 658. DOI: 10.11834/jig.20080410
      摘要:由于传统的阈值分割算法只考虑到图像的灰度信息,而忽略了灰度的空间分布以及分割后图像与原图像之间的关系,因而分割效果不好。为了提高分割效果,从分割图像与原图像的内在联系出发,提出了一种新的基于K均值算法与互信息量(mutual information,MI)技术相结合的分割算法。新算法首先利用K均值算法确定全局阈值作为初值;然后以互信息量为目标函数,在小范围内计算分割图像与原图像的互信息量,互信息量达到最大时的阈值即为最优值。这是将图像配准方法用于分割的一种创新性尝试。通过对大量医学图像以及汽车牌照图像进行的实验结果表明,该新算法所得到的目标图像的边界特征保持完好,不仅虚假目标信息大大降低,而且图像边界细腻、连续,且定位性能好。  
      关键词:图像分割;阈值;互信息量;K均值算法   
      2927
      |
      206
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56142193 false
      更新时间:2024-05-08
    • 基于快速递推和搜索策略的优化2维熵分割算法

      谢剑斌, 刘通, 王金岩, 何亦征
      2008, 13(4): 662. DOI: 10.11834/jig.20080411
      摘要:首先阐述了优化2维熵函数的概念;然后提出了一种无失真的快速递推算法和有失真的优化搜索策略,这样进一步提高了优化2维熵阈值算法的运算速度,同时能得到与传统算法相近的分割效果;最后从理论和实验两个方面对本文算法进行了分析和验证。  
      关键词:2维熵;快速递推;搜索策略   
      2705
      |
      158
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141592 false
      更新时间:2024-05-08
    • 基于Hilbert扫描和小波变换的自适应图像分割

      张荣祥, 郑世杰, 夏庆观
      2008, 13(4): 666. DOI: 10.11834/jig.20080412
      摘要:阈值的选择是图像阈值分割法的关键,针对现有阈值法中存在的没有充分地考虑图像像素之间的空间相关信息等问题,提出把Hilbert图像扫描方法和小波变换相结合,获得了连续光滑的阈值曲线,从而建立了一种局部自适应阈值法。首先通过Hilbert图像扫描的方法将2维图像信息转化为1维Hilbert序列;然后利用小波变换对其进行多分辨分析获得信号的发展趋势曲线,并将该曲线作为阈值曲线对Hilbert序列进行量化处理;最后对量化后的Hilbert序列运用Hilbert图像扫描的反过程恢复为2维图像信息,从而实现原图像的分割。该方法所建立的阈值曲线能够随像素点的环境变化而自适应调整,反映出当前区域图像灰度信息的变化趋势,从而充分地保留了图像的局部信息和原图像中相邻像素的相关性,提高了图像分割效率。实验结果表明,该方法具有分割性能好以及受噪声影响小等优点,是一种非常有效的图像分割方法。  
      关键词:图像分割;图像扫描;Hilbert曲线;多分辨分析;阈值曲线   
      2957
      |
      207
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56142788 false
      更新时间:2024-05-08
    • 基于自动参数标准化的指纹分割方法

      吴健飞
      2008, 13(4): 672. DOI: 10.11834/jig.20080413
      摘要:提出了一种合成的指纹分割方法:基于自动参数标准化的指纹分割方法。这个方法应用指纹图像中方向图和灰度变化信息,具有高效性和强壮性的特点。与以往指纹分割方法中固定参数标准化相比,基于自动参数标准化的指纹分割方法可以把指纹图像最大程度的标准化而不会恶化指纹图像细节。  
      关键词:指纹图像分割;直方图;阈值;有效窗口;灰度差异   
      2636
      |
      192
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56142938 false
      更新时间:2024-05-08
    • 基于分形编码图形表示的人脸识别算法研究

      仲琛, 肖南峰
      2008, 13(4): 678. DOI: 10.11834/jig.20080414
      摘要:提出了一种基于分形编码图形表示的人脸识别改进算法。该算法在分形图像压缩概念的基础上,定义图像中的像素块(值域块)作为基元。首先计算人脸图像的分形压缩编码,以此为基础寻找像素块间的内在联系,生成图像的图形表示——带循环植物;然后利用带循环植物获得每个像素块最终收敛时的仿射变换参数;最后通过定义合适的距离度量来进行人脸识别。该算法与基于像素的图形表示方法相比,识别率高、识别速度快、鲁棒性好。此外,还对一般情况下带循环植物的生成过程进行了深入的研究和讨论,扩展和丰富了前人研究的成果。  
      关键词:人脸识别;分形编码;图形表示;带循环植物   
      2641
      |
      246
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141626 false
      更新时间:2024-05-08
    • 一种对角LDA算法及其在人脸识别上的应用

      林宇生, 王建国, 杨静宇
      2008, 13(4): 686. DOI: 10.11834/jig.20080415
      摘要:2维特征抽取方法(如2DPCA、2DLDA),因为其抽取特征的速度和识别率要比1维的方法好,所以在人脸识别中得到了广泛的应用。最近基于2DPCA又提出了对角主成份分析(diagonal principal component analysis,DiaPCA),该方法由于保持了图像的行变化和图像的列变化之间的相关性,从而克服了2DPCA仅能反映图像行之间的变化,而忽略了图像列之间变化的缺点。但是,由于DiaPCA并没在特征抽取中融入鉴别信息,同时2DLDA也具有与2DPCA同样的缺点,从而分别影响了DiaPCA与2DLDA两种方法的识别性能。针对这一问题,提出了一种对角线性鉴别分析(diagonal linear dicriminant analysis,DiaLDA)的新算法,该新算法是基于对角人脸图像来求解最优鉴别向量。该新算法在ORL和FERET人脸库进行了实验,并与PCA、Fisherface、DiaPCA、2DLDA等方法进行了比较。实验结果表明,该方法比其他方法的识别性能要好。  
      关键词:2维主成份分析;2维线性判别分析;对角主成份分析;对角线性鉴别分析;特征抽取;人脸识别   
      2676
      |
      202
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56139615 false
      更新时间:2024-05-08
    • 中心近邻嵌入学习算法的人脸识别研究

      孔万增, 朱善安
      2008, 13(4): 691. DOI: 10.11834/jig.20080416
      摘要:针对人脸识别问题,提出了一种中心近邻嵌入的学习算法,其与经典的局部线性嵌入和保局映射不同,它是一种有监督的线性降维方法。该方法首先通过计算各类样本中心,并引入中心近邻距离代替两样本点之间的直接距离作为权系数函数的输入;然后再保持中心近邻的几何结构不变的情况下把高维数据嵌入到低维坐标系中。通过中心近邻嵌入学习算法与其他3种人脸识别方法(即主成分分析、线形判别分析及保局映射)在ORL、Yale及UMIST人脸库上进行的比较实验结果表明,它在高维数据低维可视化和人脸识别效果等方面均较其他3种方法取得了更好的效果。  
      关键词:人脸识别;中心近邻嵌入;有监督学习;线性降维   
      3076
      |
      221
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141081 false
      更新时间:2024-05-08
    • 小写金额的多模式切分与识别算法

      谷军霞, 丁晓青
      2008, 13(4): 696. DOI: 10.11834/jig.20080417
      摘要:针对带表格的中文支票小写金额的自动识别问题,提出了一种多模式切分和识别算法。根据小写金额不同部分的切分和识别难度,采取了3种递进的模式:预切分模式、连写0检测模式和基于识别的切分模式。其中预切分模式用来处理小写金额中不粘连的单字;连写0检测模式用来检测并识别连写的0;基于识别的切分模式用来处理非连写0的粘连部分,在这个模式中采用了遗传算法来加速最优解的搜索过程。利用从银行采集的1 053张真实支票样本进行测试,在拒识率为336%时,小写金额串的识别率达到661%,实验结果证明这种算法可以提高真实支票小写金额的识别率。  
      关键词:多模式切分;识别;小写金额;支票   
      2671
      |
      210
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141493 false
      更新时间:2024-05-08
    • 基于PCA和LDA统一化原理的增强型线性鉴别分析准则

      郭志波, 刘华军, 郑宇杰, 杨静宇
      2008, 13(4): 702. DOI: 10.11834/jig.20080418
      摘要:主分量分析(PCA)和线性鉴别分析(LDA)是模式识别领域的使用最为广泛的两种特征抽取方法,而在图像识别中经常采用的是PCA+LDA方法来代替单纯的LDA。本文提出一种增强型线性鉴别准则(ELDA),将PCA的优点和LDA的优点充分地融合在一起,不仅解决了PCA过程中使用最小距离方法时识别精度相对低的缺点,而且解决了LDA过程中当类内散布矩阵奇异时投影向量的求解问题,也就是说可以使用该方法来替代PCA+LDA的两步骤方法。另外,该方法在识别精度上比PCA和LDA或PCA+LDA方法都有较大的提高,通过在ORL、Yale和NUST603人脸库上的实验验证了该算法的有效性。  
      关键词:增强型线性鉴别分析;主分量分析;线性鉴别分析;PCA+LDA   
      2968
      |
      203
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56142859 false
      更新时间:2024-05-08
    • 车辆超车视觉辅助导航系统研究

      王伟莉, 曲仕茹
      2008, 13(4): 709. DOI: 10.11834/jig.20080419
      摘要:为了能够提高行驶速度,保障行车安全,提高行驶环境认知,设计了一个基于单目视觉的车辆自适应道路、前车检测、超车指导系统,其主要应用于双车道结构化道路,而且在晴天与阴天不同天气情况下,车道线以及深色、浅色车辆均可识别,并可跟踪、超越前车。实验结果表明,该系统可以应用于不同环境背景下,该系统已通过了远距离自动、安全、准确地检测,并进行了超越前车的仿真实验。  
      关键词:单目视觉;道路检测;前车检测;超车   
      2829
      |
      217
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141520 false
      更新时间:2024-05-08
    • 应用于公交客流统计的机器视觉方法

      于海滨, 刘济林
      2008, 13(4): 716. DOI: 10.11834/jig.20080420
      摘要:为了提高公交客流高峰期时的客流检测准确率,提出了一种可以应用于嵌入式平台的基于机器视觉的客流检测方法。该方法以提取乘客的头部轮廓特征作为主要手段,采用针对非标准圆形,即类圆检测的改进型Hough变换,并针对Hough变换结果进行了结合模糊置信度的感知聚类,有效地去除虚假候选头部轮廓,从而实现视场中每个乘客的准确定位。现场实验结果表明,应用该方法进行公交客流统计,准确率可达85%以上。  
      关键词:客流统计;Hough变换;感知聚类;模糊置信度   
      3085
      |
      262
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56139884 false
      更新时间:2024-05-08
    • 基于背景像素值频次最高假设的背景重构算法

      齐美彬, 王倩, 蒋建国, 安宝磊
      2008, 13(4): 723. DOI: 10.11834/jig.20080421
      摘要:背景重构是背景差分法运动检测的关键问题,为了快速地重构背景,提出了一种新的基于“背景点像素值出现频次最高”假设的背景重构算法,即先在观察时间内抽样若干帧作为训练图像序列,并用帧差法对图像进行处理得到大致运动区域,再利用区域生长法得到较完整的运动区域;然后将各抽样帧内运动区域内的点都标记为前景点,而将其余点标记为背景点;最后,统计每个背景点的不同像素值出现的频次,并选出频次最大的灰度值作为该像素点的背景灰度值。实验表明,该算法能快速有效地重构背景。  
      关键词:背景差法;背景重构;区域生长;运动检测   
      3666
      |
      242
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141358 false
      更新时间:2024-05-08
    • 混合高斯模型和帧间差分相融合的自适应背景模型

      刘鑫, 刘辉, 强振平, 耿续涛
      2008, 13(4): 729. DOI: 10.11834/jig.20080422
      摘要:提出了运动目标检测中背景动态建模的一种方法。该方法是在Stauffer等人提出的自适应混合高斯背景模型基础上,为每个像素构建混合高斯背景模型,通过融入帧间差分把每帧中的图像区分为背景区域、背景显露区域和运动物体区域。相对于背景区域,背景显露区中的像素点将以大的更新率更新背景模型,使得长时间停滞物体由背景变成运动前景时,被遮挡的背景显露区被快速恢复。与Stauffer等人提出的方法不同的是,物体运动区不再构建新的高斯分布加入到混合高斯分布模型中,减弱了慢速运动物体对背景的影响。实验结果表明,在有诸多不确定性因素的序列视频中构建的背景有较好的自适应性,能迅速响应实际场景的变化。  
      关键词:背景建模;混合高斯模型;运动目标检测;帧间差分   
      4375
      |
      291
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140981 false
      更新时间:2024-05-08

      图像理解和计算机视觉

    • 基于Dividing Rectangles的多模态

      张加万, 李谭, 孙济洲
      2008, 13(4): 719. DOI: 10.11834/jig.20080425
      摘要:为了准确、可靠地配准多模态医学图像,提出了一种基于互信息的全局优化配准算法。该算法首先提取出目标物体的外轮廓面,再用迭代最近点方法初步对齐图像;然后用确定性的全局优化方法—Dividing Rectangles搜索归一化互信息的全局最优解。该算法利用图像的特征信息,为Dividing Rectangles方法提供了一个较好的初始配准位置,并充分利用了Dividing Rectangles方法在小范围内的高效搜索能力。实验结果表明,对于3维人体脑部数据,该算法配准精度高、速度快,而且有效地避免了配准过程中出现的局部极值。  
      关键词:图像配准;互信息;Dividing;Rectangles   
      3381
      |
      209
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56142708 false
      更新时间:2024-05-08
    • 基于流形学习和混合模型的视频摘要方法

      翟素兰, 罗斌, 张春燕
      2008, 13(4): 735. DOI: 10.11834/jig.20080423
      摘要:视频摘要是进行视频浏览、视频检索、视频索引等视频应用的前提,而且视频摘要类似于文本的摘要,也是对视频内容的一个简短概括。为了自动获得既包含视频的主要信息,而冗余信息又少的视频摘要,提出了一种基于流形学习和有限混合模型的自动视频摘要方法。该方法通过对视频序列进行流形建模,首先得到视频场景的初次分割;然后对包含内容较多的场景,使用等距降维方法计算视频帧的特征向量;最后将视频帧的特征向量输入到混合模型进行聚类分析,得到更细粒度的摘要结果。为了实现视频摘要的自动处理,所采用的混合模型需要具有模型选择功能。混合模型的聚类结果和流形建模的结果共同构成了视频摘要。视频分割片段的实验结果表明,在不需人为干预的情况下,所提供的视频摘要不仅包含视频主要内容,而且冗余信息少。  
      关键词:视频摘要;流形学习;等度降维;模型选择;混合模型   
      2910
      |
      232
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56143283 false
      更新时间:2024-05-08
    • 一种获取物体3维信息的多轴机器人激光扫描系统

      李剑峰, 汤青, 王鹏, 朱建华, 郭永康
      2008, 13(4): 741. DOI: 10.11834/jig.20080424
      摘要:针对机器人工作范围有限引起扫描范围小的问题,建立了一种由机器人﹑便携式线激光3维扫描仪以及旋转平台构成的多轴激光扫描系统。利用半径已知的球体作为参照工具,机器人手持便携式扫描仪对球体进行扫描,精确标定了便携式扫描仪与机器人的方位关系。同时,提出了一种标定转台中心轴线的方法,该方法利用旋转平台上的参考球,在两个不同高度的旋转圆心精确标定出了转轴的方位。实验结果表明,该多轴激光扫描系统可以多角度、多方位对大尺寸物体进行扫描,并有着稳定、灵活以及精度高的特点。  
      关键词:计算机视觉;机器人视觉;3维激光扫描;TCP标定   
      2910
      |
      367
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141950 false
      更新时间:2024-05-08
    • 一种利用动态规划和左右一致性的立体匹配算法

      张浩峰, 赵春霞
      2008, 13(4): 756. DOI: 10.11834/jig.20080426
      摘要:立体匹配是计算机视觉领域研究的一个重要课题,为了得到准确、稠密的视差图,提出了一种利用动态规划和左右一致性的立体匹配算法。该算法首先分别以左、右图像为基元图像,计算各自的视差空间图像,在视差空间图像上利用动态规划,计算得到左视差图和右视差图;然后通过使用左右视差图之间的一致性关系,消除误匹配点,得到较为准确的部分视差图;最后利用视差图的顺序约束关系,给出未匹配视差点的搜索空间计算方法,并利用一种简单有效的方法来计算这些点的视差值。在一些标准立体图像对上所做的实验结果表明,该算法效果良好。  
      关键词:立体匹配;动态规划;左右一致性;视差搜索策略   
      5208
      |
      235
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140613 false
      更新时间:2024-05-08
    • 一种鲁棒型Hausdorff距离图像匹配方法

      孙瑾, 顾宏斌, 秦小麟, 周娜
      2008, 13(4): 761. DOI: 10.11834/jig.20080427
      摘要:图像匹配是图像处理的一项关键技术,传统方法受光照、噪声和遮挡的影响,使匹配过程变得困难。为了提高图像匹配的鲁棒性,提出了一种基于方向信息的鲁棒型Hausdorff距离匹配方法。该方法采用方向信息提取图像边缘,通过计算边缘匹配率(edge matching rate,EMR)获得候选匹配区域,然后采用修正后的Hausdorff距离构造相似性测度。实验结果表明,该方法加快了匹配过程,提高了抗噪性能,并能够准确匹配含有遮挡和伪边缘点的图像,从而解决了基于传统Hausdorff距离匹配方法因噪声点、伪边缘点和出格点而造成的误匹配问题。  
      关键词:图像匹配;Hausdorff距离;边缘检测   
      2863
      |
      207
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140564 false
      更新时间:2024-05-08

      计算机图形学

    • 扩展Picard群对称的3维镶嵌图案的计算机自动生成

      马键, 叶瑞松, 李辉亮
      2008, 13(4): 768. DOI: 10.11834/jig.20080428
      摘要:通过构造扩展Picard群等变的映射,从动力系统的角度出发,利用计算机自动生成具有扩展Picard群对称的图案,生成的图案在与xy平面平行的截面上的对称性为pmm晶体群对称,在包含x轴的截面上为扩展模群对称。 从数值实验所生成的图案可以看出,该算法生成的图案具有丰富的艺术性,为铺砌、雕塑等设计提供了一种计算机自动生成的新途径。  
      关键词:扩展Picard群;镶嵌图案;四元数;对称   
      3096
      |
      222
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141300 false
      更新时间:2024-05-08

      虚拟现实和增强现实

    • 环形物体的两步纹理映射算法

      江巨浪, 张佑生, 薛峰, 胡敏
      2008, 13(4): 774. DOI: 10.11834/jig.20080429
      摘要:鉴于现有的两步纹理映射技术对环形物体表面的纹理映射均不适用,为此提出了一种两步纹理映射方法,用于解决环形物体的纹理映射问题。该算法选择圆环表面为中介曲面,首先运用面积等比约束方法将两块相同类型的纹理分别映射到圆环的上下两侧表面,并通过对纹理拼接区域进行插值预处理来消除纹理接缝;然后采用中介表面法向法将圆环表面的纹理进一步映射至物体表面。实验结果表明,该算法可将平面纹理映射至多种环形物体表面,不仅纹理形变小,且保持连续,能够较好地满足虚拟现实与真实感绘制对环形物体表面的纹理映射要求。  
      关键词:纹理映射;两步纹理映射;环形物体;圆环表面;纹理变形;纹理连续   
      3305
      |
      202
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140665 false
      更新时间:2024-05-08
    • 基于标志点注册及探测球的光源追踪算法

      马晋涛, 周雅, 刘伟, 王红, 刘宪鹏
      2008, 13(4): 780. DOI: 10.11834/jig.20080430
      摘要:增强现实系统中,解决虚拟物体表面光照情况与真实环境匹配问题关键的一步是进行光源追踪。基于标志点注册及具有漫反射特性的探测球提出一种光源追踪算法〖JP3〗。该算法仅对一幅被单一光源照射的标志立方体和探测球图像进行分析,利用图中标志点确定探测球相对照相机的位置、姿态关系,利用探测球表面的亮度信息推算光源向量。该探测球图像要进行一系列图像处理程序,其中等亮度线的提取及拟合是关键步骤。实验结果表明,本文算法能够达到预期效果,较好地实现了光源追踪,适用于各种位置的单一光源照射情况及基于标志点注册的增强现实系统。  
      关键词:增强现实;光源追踪;图像处理   
      3143
      |
      196
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140707 false
      更新时间:2024-05-08

      主题栏目

    • 双PTZ摄像机系统的标定

      万定锐, 周杰
      2008, 13(4): 786. DOI: 10.11834/jig.20080431
      摘要:在视频监控领域,PTZ(Pan/Tilt/Zoom)摄像机因为其具有可变视角和可变焦能力,已经越来越多的被采用,而且用两个PTZ摄像机组成一个视觉系统具有可以同时获取全景图像、近景高分辨率图像以及场景深度信息等优势,虽然目前关于双PTZ视觉系统的研究还比较少,但其应用潜力很大。对双PTZ摄像机系统进行标定的目的之一是辅助两个镜头之间的配准,进而方便立体匹配等。两个摄像机之间公共坐标系的选择是标定问题种的一个关键。针对这一问题提出了一种球面校正公共坐标系,并研究了其标定问题。众所周知,传统的多目镜头标定主要针对静止镜头,而且一般是通过事先估计摄像机的架设位置或者利用标定物来计算摄像机之间的关系,但此类标定方法无法直接解决上述问题。为了更好地进行标定,在此提出了一种利用多组基础矩阵的方法进行自动估计的标定方法,该方法不需要标定物,而只与镜头架设方式有关,且不受摄像机PTZ参数改变影响。实验结果表明,该方法具有方便和实用性。  
      关键词:PTZ摄像机;标定;极线几何;基础矩阵;立体校正   
      5545
      |
      191
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140820 false
      更新时间:2024-05-08
    • 动态上下文环境下的实时分布式多媒体系统框架

      孙洛, 赵彦钧, 王垚, 陶霖密, 徐光祐
      2008, 13(4): 794. DOI: 10.11834/jig.20080432
      摘要:伴随着多媒体采集和处理设备成本的不断降低,以及处理目标的不断复杂化,多媒体信息系统正朝着大规模数据分析和管理系统靠拢,因此如何有效支持实时分布式多媒体信息所需的实时采集、压缩、传输、处理、描述、反馈与存档,以及后期的浏览与检索,已经成为多媒体计算研究的重要问题。为了有效支持实时分布式多媒体信息的实时采集、传输、处理、描述、存档等的需要,在分析动态上下文环境下实时分布式多媒体系统对底层采集、压缩和传输以及信息的表达和存储的普遍需求的基础上,提出并实现了一个通用的实时分布式媒体信息处理框架,以便为实时分布多媒体系统提供基础服务支持。该框架包括软件平台和信息系统两部分。前者用于将逻辑功能与物理设备隔离开来,完成实时采集、压缩、传输和解压等功能;后者通过统一信息表达格式,将数据与特定的采集处理模块隔离开来,同时还提供了信息管理的功能,以便于用户后期检索。这两部分共同将多媒体系统所需要的实时采集、处理、压缩、描述、反馈与存档以及离线浏览与检索等服务融入一致、统一的框架中。基于该框架的会议系统的相关实验表明,该框架具有良好的开放性、可配置性和可扩展性。  
      关键词:框架;动态上下文;实时;分布式   
      4846
      |
      213
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141415 false
      更新时间:2024-05-08
    • 李庆华, 李峰, 陆郡
      2008, 13(4): 801. DOI: 10.11834/jig.20080433
      摘要:对交叉路口行驶车辆进行有效分类,是进行流量统计、交通状况分析,以及交通事故分析的基础。在运动目标检测和图像标定技术的基础上,通过引入多类支持矢量机方法,提出了一种利用车辆的多个特征对交叉路口车辆进行分类的方法,解决了传统分类方法存在的“误分”问题,实验结果表明,该方法分类精确度高,满足交叉路口车型分类的要求。另外,又给出了一种 “车流速度”的提取方法,为交通管理部门分析交通状况提供了依据。  
      关键词:车型分类;多类支持矢量机;图像标定;特征提取;车流速度   
      4243
      |
      205
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56141234 false
      更新时间:2024-05-08
    • 基于累积量和主运动方向的视频烟雾检测方法

      袁非牛, 张永明, 刘士兴, 于春雨, 沈诗林
      2008, 13(4): 808. DOI: 10.11834/jig.20080434
      摘要:视频烟雾检测具有响应速度快、非接触等优点。但现有的视频检测方法误报率比较高。通过分析早期火灾烟雾运动规律,提出了一种适用于普通视频的烟雾检测方法。为了加快检测速度,将视频图像分割成大小相等的块,并估计每个块的运动方向。采用滑动时间窗口生成块运动方向时间序列,在此时间序列的基础上计算块的累积量和主运动方向。累积量可以反映出运动持续的程度,而主运动方向表明每个块最可能的运动方向,可以有效地抑制噪声的干扰。根据累积量和主运动方向提取出3维特征矢量,采用贝叶斯分类器进行烟雾的检测。实验结果表明,该方法鲁棒性高、速度快,能够准确地检测烟雾的出现。  
      关键词:视频烟雾检测;累积量;主运动方向;特征分析;计算机视觉   
      6637
      |
      244
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56143189 false
      更新时间:2024-05-08
    • 空中侦察序列图像连续拼接的累积误差分析与消除

      李从利, 薛模根, 冷晓艳, 卢伟
      2008, 13(4): 814. DOI: 10.11834/jig.20080435
      摘要:分析研究了空中侦察序列图像连续拼接产生误差的原因,连续拼接中的误差累积与传播往往导致拼接图像质量难以接受甚至拼接过程失败,而拼接获取大视野战场毁伤全景图像具有重要军事应用价值;针对空中飘弋平台运动姿态复杂,成像模型难以建立的特点,提出了一种在连续拼接过程中变换基准图的拼接策略以消除累积误差的产生,通过对空中飘弋平台实拍序列图像和模拟仿真的序列图像进行拼接的实验结果表明,基准图的变换可大大减弱拼接过程中的累计误差影响,同时多次变换也会造成局部边缘的失真,但不影响后续的处理和使用,该策略的提出可为类似视点变化复杂的成像拼接提供误差消除方法和有效手段。  
      关键词:误差分析;误差消除;侦察序列图像;图像拼接   
      5127
      |
      204
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56140394 false
      更新时间:2024-05-08
    0