最新刊期

    2003 8 9

      综述

    • 基于内容的图象检索技术

      徐杰, 施鹏飞
      2003, 8(9): 977. DOI: 10.11834/jig.200309355
      摘要:随着数字图象的日益增多,基于内容的图象检索已成为图象使用者和管理者迫切需要解决的问题,近年来,各国研究者纷纷加入该领域的研究.为了使人们对该领域现状有个概略了解,以推动该领域研究进一步开展,首先概括介绍了基于内容图象检索的产生、发展及其关键技术;然后介绍了特征提取(包括低层特征和语义特征)及其相似性计算、相关反馈等的原理及算法;最后指出了基于内容的图象检索技术与计算机视觉技术的区别所在,并对目前存在的问题和应着重的研究内容以及发展方向进行了分析.  
      关键词:计算机信息管理系统(520·6070);基于内容的图象检索;特征提取;相似性计算;相关反馈   
      2466
      |
      176
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56157758 false
      更新时间:2024-05-07
    • MPEG的新发展——多媒体框架标准MPEG-21

      汤泽滢, 卢汉清
      2003, 8(9): 984. DOI: 10.11834/jig.200309356
      摘要:标准化是产业化活动成功的前提,视、音频编码的各种国际标准的制定集中地反映了视、音频编码技术发展的水平.目前,图象压缩方面的标准主要有MPEG系列(MPEG-1,MPEG-2,MPEG-4,MPEG-7和MPEG-21标准),以及H.26X系列(H.261,H.263标准)和静止图象压缩标准JPEG.为了使人们对图象压缩标准有所了解,以进一步推动图象压缩方面的研究,首先对MPEG系列的各种已有标准及其应用进行了概述,然后着重讨论了MPEG中的新面孔——正在开发的MPEG-21标准,并就其目标、用户需求、技术要素、关键任务、应用领域以及工作计划做了较详细的描述.  
      关键词:MPEG;图象压缩标准;多媒体技术;计算机技术;网络技术;通信技术   
      2914
      |
      267
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56155797 false
      更新时间:2024-05-07
    • 几何不变性及其在3D物体识别中的应用

      陈柘, 赵荣椿
      2003, 8(9): 993. DOI: 10.11834/jig.200309357
      摘要:三维物体识别是计算机视觉研究的重要内容之一,它要求从3D物体的2D图象中识别和定位物体.由于物体成像时会受到观察视角、摄像机参数的影响,因此使得同一物体在不同观察视角、不同摄像机参数等条件下所得到的图象存在差异.但由于几何不变性方法可以有效地消除这种差异带给3D物体识别的不利影响,所以,近20年来这种方法受到了广泛的关注和研究.为使人们了解该领域的研究现状,以对该领域的研究有所启发,首先讨论了基于几何不变性的3D物体识别方法的研究内容,包括研究的几何框架和其不变性以及几何不变性在3D物体识别中的主要应用;其次,总结性地评述了该领域的研究现状;最后,提出了研究的发展方向.  
      关键词:几何不变性;计算机视觉;摄像机;坐标转换;图象数据   
      3150
      |
      164
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56157370 false
      更新时间:2024-05-07

      学术论文与技术报告

    • 利用色彩直方图特征进行偏色图象的自动检测和校正

      郑建铧, 郝重阳, 雷方元, 樊养余
      2003, 8(9): 1001. DOI: 10.11834/jig.200309358
      摘要:在肤色检测、人脸识别、图象和视频检索的研究中,大量算法都是基于对图象色彩特征进行分析的,然而当图象发生偏色时,这些算法的性能会明显下降,甚至无效,而且由于现有的偏色校正算法,引入了其他关于偏色图象的先验性信息,具有很大的使用局限性,为此,提出了一种在只给出偏色图象的条件下,进行偏色检测和自动校正的算法.该算法首先获取并分析偏色图象在RGB各通道内的直方图特征,然后参照这些特征检测偏色通道,并通过调整偏色或非偏色通道强度分布来达到各个通道之间色彩平衡.实验表明,在较大程度的偏色情况下,该算法校正恢复出的图象与原始无偏色图象能达到视觉上基本一致的效果,并具有普遍的适用性.  
      关键词:色彩直方图;偏色图象;图象检测;图象校正   
      3915
      |
      221
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156821 false
      更新时间:2024-05-07
    • Landsat7图象系统级几何校正算法研究

      唐海蓉, 向茂生, 朱敏慧
      2003, 8(9): 1008. DOI: 10.11834/jig.200309359
      摘要:Landsat7的双向扫描模式、姿态波动和增强型专题制图仪ETM (Enhanced Thematic Mapper )传感器本身的特点等必然导致遥感图象的几何畸变,同时复杂的成像几何模型也增加了几何校正的难度.为此,在研究了其成像几何模型,分析了影响畸变的因素后,给出了完整的系统级几何校正算法,包括视线产生和投影、姿态合成和重采样等,并对重采样中的间隙插值和延迟进行了深入分析,采用了简化方法.实验结果表明,校正后图象的定位精度、变形度和行间相关度达到了系统级几何校正的要求,验证了算法在保证速度的前提下,具有较高的正确性.  
      关键词:计算机图象处理(520·6040);陆地卫星-7(Landsat7);增强型专题制图仪;系统级几何校正;视线;间隙;延迟;重采样   
      2809
      |
      208
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56157587 false
      更新时间:2024-05-07
    • 基于离群点检测的图形图象噪声滤除算法

      李存华, 孙志挥
      2003, 8(9): 1015. DOI: 10.11834/jig.200309360
      摘要:图形图象噪声过滤与修正,在媒体制作、图象分析与信息提取中起着十分重要的作用.虽然基于小波变换的算法能够对高斯噪声进行较好的滤噪处理,但对于随机分布于图象中的各种非高斯噪声仍没有普遍适用的滤噪方法.为了对这种随机分布于图象中的噪声进行有效的检测与滤除,采用对数字图象像素进行解析化描述的方法,从离群点检测的角度给出噪声的定义,并在此基础上构造了相应的图象噪声检测与滤除算法.实验结果表明,这一新方法对图象类型具有广泛的适应性和较好的噪声滤除效果,在大规模图形图象处理应用中具有实用价值.  
      关键词:计算机图象处理(520·6040);图形图象;噪声滤除;离群点检测   
      2512
      |
      156
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156521 false
      更新时间:2024-05-07
    • 用多项式近似的图象逆滤波及空间移变系统图象的恢复

      文玉梅, 李平
      2003, 8(9): 1021. DOI: 10.11834/jig.200309361
      摘要:光(电)成像系统的特性会引起图象降质,但如果能够根据系统的传递函数确定其逆滤波函数,就可以对这种降质图象进行一定的恢复.为此,提出了一种用多项式近似的图象逆滤波的图象恢复方法,该方法就是首先将连续的逆滤波函数按泰勒级数展开,并用多项式来近似表示,通过对用多项式表达的用于图象恢复的逆滤波函数作反傅里叶变换,就可得到恢复图象在空间域中的近似运算公式,该运算是图象信号及其各阶导数的线性组合,而不是复杂的反卷积操作.同时还详细分析了方法的原理,并推导了算法公式,最后给出了空移不变和移变系统图象的恢复处理结果.实验表明,该方法特别适合于空间移变系统降质图象的恢复,如场曲恢复.  
      关键词:多项式近似;逆滤波函数;空间移变系统;图象质量;图象恢复;泰勒级数;成像系统   
      2283
      |
      205
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56158009 false
      更新时间:2024-05-07
    • 一种肺部肿瘤CT图象序列的自动分割方法

      姜晓彤, 罗立民, 汪家旺, 潘晓敏, 周正东
      2003, 8(9): 1028. DOI: 10.11834/jig.200309362
      摘要:肺部肿瘤序列图象的自动分割是计算机肺部肿瘤三维辅助诊断系统的关键技术之一,肿瘤与周围组织关系的复杂性造成分割困难.为了给医生提供准确的肺部肿瘤影像,运用纹理分析和径向基神经网络实现了肺部肿瘤CT图象序列的自动分割,并根据相邻层肿瘤图象灰度、位置的相关性,提出了一种自动获取多层肿瘤区域神经网络训练样本的阈值分割算法.该算法首先计算图象纹理统计参数,以组成特征矢量空间,然后利用自适应径向基神经网络对特征矢量进行分类来实现肿瘤序列图象的自动分割.实验结果表明,与基于灰度的区域增长法和基于梯度算子和形状算子的最优阈值的分割方法相比较,该方法不仅能充分利用肺部肿瘤序列图象的三维信息,还可最大限度地减少人工干预,且分割结果较好地表现了肿瘤形态特征,经临床医生评估,具有较好的临床指导价值.  
      关键词:计算机图象处理(520·6040);肺部肿瘤分割;纹理分析;径向基神经网络   
      2692
      |
      194
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56156125 false
      更新时间:2024-05-07
    • 一种基于颜色信息的图象检索方法

      尹建芹, 田国会, 宁春林, 路飞
      2003, 8(9): 1034. DOI: 10.11834/jig.200309363
      摘要:由于传统的基于颜色的图象检索都是基于颜色直方图的检索,其很难将颜色信息和其他信息结合起来,因此,降低了图象检索的准确度.为了提高图象检索的准确度,提出了一种基于颜色聚类表的图象检索方法,该方法首先定义颜色聚类表,并对图象进行颜色聚类;然后利用聚类后的颜色信息构造聚类表,并利用聚类表作为特征来对图象进行检索,同时给出颜色聚类表的获取方法;最后,利用该方法进行了仿真实验.实验结果表明,利用颜色聚类表,根据图象的聚类结果来实现检索,可以很方便地将颜色信息与其他信息结合起来.  
      关键词:计算机信息管理系统(520·6070);图象检索;模式识别;聚类;颜色直方图   
      2395
      |
      234
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56155937 false
      更新时间:2024-05-07
    • 可补偿类别差异的加权支持向量机算法

      范昕炜, 杜树新, 吴铁军
      2003, 8(9): 1037. DOI: 10.11834/jig.200309364
      摘要:支持向量机(SVM)算法在各类别样本数多少不同时,样本数量多的类别,其分类误差小,而样本数量少的类别,其分类误差大.针对这种倾向性问题,在分析其产生原因的基础上,提出了加权SVM算法,从而克服了常规SVM算法不能灵活处理每一个样本的缺陷,同时补偿了这种倾向性造成的不利影响.这种以牺牲大类别精度来提高小类别精度的加权支持向量机方法,可应用于诸如故障诊断等关注小类别分类精度的场合.户外图象识别的实验结果证明,该算法是有效的.  
      关键词:模式识别(520·2040);支持向量机(SVM);分类精度;类别差异;权值;户外图象   
      2576
      |
      200
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56155861 false
      更新时间:2024-05-07
    • 一种基于Gabor小波的驾驶员眼部状态识别方法的研究

      王荣本, 郭克友, 储江伟
      2003, 8(9): 1043. DOI: 10.11834/jig.200309365
      摘要:近年来,由于驾驶员疲劳驾驶导致的交通事故逐年递增,所以有必要规范驾驶员的行为.由于驾驶员的疲劳状态可由眼睛状态表达出来,为了对眼睛状态进行有效监测,介绍了一种在车辆上安装CCD监测驾驶员行为的新方法,并介绍了一种采用计算机视觉对驾驶员的眼睛状态进行识别的技术方法.该方法是根据驾驶员在正常驾驶、瞌睡驾驶及疲劳驾驶3种状态下的眼睛张开程度有一定的区别的这一特点,提出的一种利用Gabor小波提取眼角处的纹理走向特征值,并将由所有特征值组成的特征矢量作为三层神经网络的输入,以输出对应3种不同精神状态的眼部状态的识别方法.试验结果表明,该网络可快速有效地识别出驾驶员眼部状态.  
      关键词:Gabor小波;驾驶员;眼部状态识别;BP神经网络;图象处理   
      2415
      |
      179
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56155983 false
      更新时间:2024-05-07
    • 基于纹理映射与Phong光照模型的体绘制加速算法

      张尤赛, 陈福民
      2003, 8(9): 1048. DOI: 10.11834/jig.200309366
      摘要:为了提高体绘制速度,提出了一种基于纹理映射、具有Phong光照效果的体绘制加速算法.该算法是根据Phong光照模型,利用一单位球面体来仿真相同光照绘制条件下的每一个体素的反射光强,首先形成一个以法线矢量为索引值的反射光强查寻表,再应用窗值变换的加速算法来计算体素的不透明度;然后采用纹理映射的方法将体素光强值与由不透明度组成的3D数据集从物体空间投射到观察空间,再沿视方向融合为3D图象.实验表明,这种3D旋转的明暗修正保证了体绘制中3D旋转几何变换的多视角观察的交互速度.由于该算法综合了体绘制软件算法数据处理与纹理映射硬件加速的优点,并用2D纹理映射与融合的方法实现了体数据的3D重建,因而不仅降低了对计算机硬件与软件环境的要求,而且在目前通用个人计算机上即可获得近似实时的交互绘制速度和良好的3D图象品质.据研究,该算法同样适用于3D纹理映射的体绘制方法.  
      关键词:纹理映射;体绘制;加速算法;图象质量;Phong光照模型;遍历体数据   
      3826
      |
      216
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56157261 false
      更新时间:2024-05-07
    • 抗统计分析的LSB密写方案

      张新鹏, 王朔中, 张开文
      2003, 8(9): 1055. DOI: 10.11834/jig.200309367
      摘要:由于通过RS统计分析和Chi—square统计分析,可以察觉以LSB方法密写的秘密信息的存在,因此为提高密写方案的安全性,提出了一种改进的LSB密写方案,即如果被嵌入的秘密比特与原始灰度的最低位相同,便不作改动;否则根据周围像素作增1或减1的调整,而在接收方,只需将载体图象的最低位取出即可恢复秘密信息.大量图象的模拟实验结果说明,该方案不仅可以抵抗RS分析和Chi—square分析,而且不增加失真度.并可保持计算量小、提取方便的优点.并表明改进方案对抵抗这两种密写分析是有效的.  
      关键词:像素;失真度;信息隐藏;密写;数字水印;稳健性;版权保护;信息安全   
      2424
      |
      186
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56157323 false
      更新时间:2024-05-07
    • 基于立方体全景图的虚拟场景浏览技术研究及实现

      韦群, 高丽, 龚雪晶
      2003, 8(9): 1061. DOI: 10.11834/jig.200309368
      摘要:虚拟现实技术将计算机采集到的各类信息以全新的方式组织起来,提供给用户一个趋于人性化的虚拟信息空间,如今通常以全景图象的方式来表示的虚拟场景主要有球面全景图、柱面全景图和立方体全景图3种模式.为了给用户浏览虚拟场景提供一种方便、自然的交互方式,提出了一种对立方体全景图进行实时交互浏览的基本重投影算法及其加速算法,并实现了一个立方体全景图浏览器,实验结果表明,该方法具有最大的观察自由度.  
      关键词:计算机图形学(520·6020);虚拟现实;全景图;立方体全景图;浏览   
      3220
      |
      192
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56158253 false
      更新时间:2024-05-07
    • 一种基于可能碰撞集的碰撞检测方法

      罗冠, 郝重阳, 樊养余
      2003, 8(9): 1067. DOI: 10.11834/jig.200309369
      摘要:为了提高虚拟环境中碰撞检测的实时性和有效性,提出了一种基于可能碰撞集的碰撞检测方法.该方法首先通过预测环境中刚体在当前帧和下一帧之间的可能运动轨迹来构建一个各边与世界坐标系各坐标轴平行,且包围该运动轨迹的包围盒;然后利用空间平铺技术来快速检测与某一平铺单元同时相交的轨迹包围盒,即可得到当前帧的可能碰撞集;接着对可能碰撞集中的刚体对进行最早碰撞时间tmin的求解,并根据tmin进行排序;最后只对具有最小tmin值的刚体对进行碰撞检测.仿真试验结果表明,与目前已有的碰撞检测算法相比,该方法简单、快速,不仅可以有效解决多个刚体环境中碰撞发生的次序问题,同时,该方法还能保证碰撞检测的完整性和唯一性.另外,理论和实践也证明了该方法的正确性和有效性.  
      关键词:计算机仿真(520·6020);虚拟环境;刚体;包围盒;可能碰撞集;碰撞检测;哈希表   
      2574
      |
      184
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56157446 false
      更新时间:2024-05-07
    • 3D—GIS中空间三角平面的不确定研究

      蔡剑红, 文鸿雁
      2003, 8(9): 1073. DOI: 10.11834/jig.200309370
      摘要:数据质量直接影响着GIS应用、分析以及决策的正确性和可靠性,而目前对三维空间数据的不确定性研究不多.为此以3D-GIS中空间平行四边形空间点的估计精度为研究对象,研究了空间三角平面内,三角平面的边以及三角平面外一定范围内任意点的精度,同时给出了空间三角平面面积及其法向量的不确定性等计算方法及估计公式.分析表明,由3个不在同一线上的的空间点构成的三角平面内任意点的精度至少要高于3个角点其中一点的精度;落在三角平面的边上点的精度至少要高于确定该直线元的两控制点其中一个点的精度;而落在三角平面外的点的精度则明显降低,而且这种三角平面上任意点的误差椭球三轴半径及其方向既与控制点的方差协方差有关,又与它在平面内的位置有关.  
      关键词:地理信息系统(420·3040);空间平行四边形;空间三角平面;不确定性   
      2892
      |
      174
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56158407 false
      更新时间:2024-05-07
    • MODIS图象的云检测及分析

      宋小宁, 赵英时
      2003, 8(9): 1079. DOI: 10.11834/jig.200309371
      摘要:云一直是遥感图象处理、图象分析的一大障碍.为了解决这一问题,试图探讨利用中分辨率成像光谱仪MODIS检测云的方法,该方法充分考虑到MODIS数据具有36个光谱通道,特别是红外波段细分的特点,先是基于云的波谱特性采用多光谱综合法、红外差值法及指数法来对MODIS图象上的云点进行检测,鉴于这些方法有一定的局限性,因而还运用了一种基于空间结构分析和神经网络的云自动检测算法;最后将各种方法的云检测结果进行相互映证和对照分析,结果表明,这些方法检测到的云互相吻合,说明利用MODIS图象可成功地检测云点像元.这不仅为云的去除奠定了良好基础,而且也可以提高图象识别、图象分类及图象反演的精度.  
      关键词:中分辨率成像光谱仪数据;多光谱综合法;指数法;云自动检测   
      4901
      |
      237
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56158475 false
      更新时间:2024-05-07
    • 基于动态阈值分块算法的屏幕图象压缩技术

      朱芳宇, 朱光喜, 王曜
      2003, 8(9): 1084. DOI: 10.11834/jig.200309372
      摘要:计算机屏幕图象压缩一直是屏幕共享技术中的关键问题,而现有算法一般是直接应用传统的RLE,LZW或JPEG算法,但由于这几种算法在对计算机屏幕图象进行压缩时,均无法兼顾恢复质量与压缩比的要求.为此提出了一种基于动态阈值分块的高效压缩算法,该算法首先将屏幕图象按照某种规则划分为纯色块、文字块、图标块和图象块4种特征块,然后针对特征块特点采用相应的压缩算法,以保证压缩算法在恢复质量与压缩比上能同时达到最佳.实验结果表明,该算法图象恢复质量较好,压缩比较大,压缩速度较快,整体性能优于当前现有的屏幕压缩算法,具有广泛的应用前景.  
      关键词:图象处理(510·4050);屏幕共享;动态阈值;分块压缩   
      2797
      |
      190
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56157787 false
      更新时间:2024-05-07
    • 基于多分辨率级小波变换的图象压缩方法

      潘迅宇, 潘树陆, 王相海, 潘金贵
      2003, 8(9): 1089. DOI: 10.11834/jig.200309373
      摘要:随着国际互联网的出现,使得越来越多的图象信息传输交流越来越便捷,但传输速度始终是制约网络发展的重要因素,这也使得对图象进行压缩的要求更加迫切。小波变换的良好空间一频率局部化特性,使得原始图象的能量大部分聚集到了低频子带.为了提高图象压缩的效率和重建图象的质量,利用原始图象在小波分解中不同分辨率级能量分布不均匀的特点,提出了一种对各分辨率级进行分级处理的设计方法,即通过对各分解级量化因子的评价,为该级获取一个最佳的量化因子来进行压缩.实验证明,该方法在提高图象的压缩效率和重构质量方面取得了良好的效果.  
      关键词:图象处理(510·4050);图象压缩;小波变换;量化因子;多分辨率级压缩   
      2531
      |
      211
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56158624 false
      更新时间:2024-05-07
    • 一种基于拷屏和压缩技术的屏幕共享方案

      张丽萍, 喻占武, 肖进胜, 胡瑞敏
      2003, 8(9): 1095. DOI: 10.11834/jig.200309374
      摘要:针对当前多媒体应用领域的一类特殊视频——全屏幕半运动非连续色调彩色视频的压缩和传输需求.提出了一种基于拷屏和压缩技术的解决方案.该方案主要利用拷屏和数据压缩技术来实现异地屏幕显示图象的共享,即首先使用拷屏技术从显卡直接获取屏幕图象.然后对拷屏图象进行降低颜色分辨率的处理;接着运用LZ77数据压缩技术进行压缩;最后打包传输。实验证明,该方案不仅可以获得高达100:1以上的图象序列压缩比,并且具有较好的实时性和较低的解码复杂度,因此,可广泛应用于远程教育、股评分析系统等网络多媒体应用领域.  
      关键词:屏幕共享技术;彩色视频;视频压缩;拷屏技术;图象编码   
      3406
      |
      190
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56157838 false
      更新时间:2024-05-07
    • 一种基于PCA/SOFM混合神经网络的图象压缩算法

      许锋, 方弢, 卢建刚, 孙优贤
      2003, 8(9): 1100. DOI: 10.11834/jig.200309375
      摘要:鉴于用神经网络实现图象压缩是一种非常有效的方法,为此提出了一种基于PCA/SOFM混合神经网络的图象压缩编码算法,并对SOFM网络学习参数的优化进行了探讨.实验证明,与PCA SOFM连续编码算法和基本SOFM算法相比,这种混合编码算法,由于占用存储空间少,因而降低了码书设计的计算量,并改善了码书的性能.  
      关键词:图象处理(510·4050);矢量量化;变换编码;混合编码;神经网络;自组织特征映射;主元分析   
      2502
      |
      159
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56158677 false
      更新时间:2024-05-07
    0