首页
期刊介绍
基本情况
编委会
期刊在线
当期目录
过刊浏览
在线出版
专栏专刊
虚拟专辑
投稿须知
处理流程
撰稿要求
同行评议
开放获取
学术诚信
联系我们
数据集上传流程
数据集共享
学术活动
名师讲堂
研究生论坛
文档图像微沙龙
图像视频通信沙龙
最美封面评选
年度会议
图图直播间
下载中心
联系我们
期刊订阅
纸刊订阅
邮件推送
RSS订阅
个人中心
退出登录
浏览全部资源
扫码关注微信
首页
期刊介绍
基本情况
编委会
期刊在线
当期目录
过刊浏览
在线出版
专栏专刊
虚拟专辑
投稿须知
处理流程
撰稿要求
同行评议
开放获取
学术诚信
联系我们
数据集上传流程
数据集共享
学术活动
名师讲堂
研究生论坛
文档图像微沙龙
图像视频通信沙龙
最美封面评选
年度会议
图图直播间
下载中心
联系我们
期刊订阅
纸刊订阅
邮件推送
RSS订阅
最新刊期
2008
年
第
13
卷
第
7
期
本期电子书
封面故事
上一期
下一期
本期目录
中国多媒体技术研究:2007
封面论文
封底论文
增强出版
AI导读
史元春, 高原, 肖鑫, 沈建华, 徐光祐
2008, 13(7): 1201-1221. DOI: 10.11834/jig.20080701
摘要:该文是中国多媒体技术研究与应用的年度文献综述之十。该文从发表在2007年9种国内核心刊物上的3 034篇论文中,选取了516篇与多媒体技术相关的文章进行了分类、统计,以展现2007年中国多媒体技术发展的现状。今年的分类标准做了一些调整,据此选取的论文能更集中地反映出多媒体技术研究的概貌。通过与前4年的统计结果进行对比可以看出,数字水印、虚拟现实、多媒体数据检索、多播、流媒体、交互模式与接口、生物特征身份识别等是2007年论文反映出的研究热点,同时,多媒体应用日趋多样化,并和社会生活的结合程度越来越紧密。该文还对5年来中国多媒体技术文献统计结果进行了比较,从中可清楚地看到多媒体技术,特别是一些热点技术的发展过程和发展趋势。希望该文不仅能给从事多媒体技术研究与应用的人员提供系统的文献索引,也能为技术规划和管理人员提供参考。
关键词:多媒体;数字水印;虚拟现实;多媒体数据检索;多播;流媒体;交互模式与接口;身份识别
4528
|
381
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139734 false
更新时间:2024-05-08
基于计算机视觉的视频火焰检测技术
封面论文
封底论文
增强出版
AI导读
杨俊, 王润生
2008, 13(7): 1222-1234. DOI: 10.11834/jig.20080702
摘要:视频火焰检测是计算机视觉中一项理论意义与实际价值兼备的重要课题,对烟火事故的消防安全具有重要的实际意义。随着火焰视觉特征模型的不断完善,视频火焰检测方法的研究得到发展。本文综述了视频火焰检测的几个主要方面,包括其相对传统检测器的优势、火焰特性的分类与描述、代表性的检测方法、典型的系统方案及其发展趋势等;探讨了其中涉及的系统通用性、实时性、智能性、评测标准和多传感器融合等关键问题;还介绍了一种新的基于层次注意的视频火焰检测模型及多源感知信息的显著性融合框架,尝试借助显著性特征描述和低冗余计算来提升烟火监测系统的效率和主动性。
关键词:计算视觉;火焰;实时警报;视频图像检测;视觉显著性
4266
|
367
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139901 false
更新时间:2024-05-08
局部几何结构驱动的图像插值放大及超分辨率复原
封面论文
封底论文
增强出版
AI导读
邵文泽, 韦志辉
2008, 13(7): 1235-1243. DOI: 10.11834/jig.20080703
摘要:众所周知,图像插值是根据一幅低分辨率噪声图像重建相应高分辨率清晰图像的数字图像处理技术。虽然已有一些文献报道了多种图像插值算法,然而现有算法在插值视觉效果和计算复杂度两者间往往难以实现均衡,为此,提出了一种局部几何结构驱动的偏微分方程(PDE)图像插值算法。该算法通过耦合边缘、纹理和角形3种不同几何结构的扩散机制来进行插值,插值结果表明,该算法不仅具有抗噪声性能,而且能够同时增强边缘、纹理以及角形结构。考虑到图像的超分辨率复原与插值放大在数学本质上的一致性,特将上述PDE应用推广到图像的超分辨率复原,并且针对高强度噪声情形下,超分辨率图像中出现的伪纹理结构,提出了一种耦合全变差模型的改进的PDE。实验结果表明,不论是插值放大图像,还是超分辨率复原图像都具有较高的视觉质量和峰值信噪比。
关键词:图像插值;图像放大;边缘增强;角形生长;超分辨率
3805
|
285
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139200 false
更新时间:2024-05-08
基于可变尺寸块运动矢量恢复的H.264时域差错掩盖算法
封面论文
封底论文
增强出版
AI导读
陈振, 贺建军
2008, 13(7): 1244-1249. DOI: 10.11834/jig.20080704
摘要:针对H264帧间预测编码的新特点,提出了一种基于可变尺寸块运动矢量恢复的时域差错掩盖算法。该算法首先利用相邻宏块编码模式的相关性,根据周围宏块的编码模式判断受损宏块的编码模式及运动矢量恢复的宏块划分方式,分别对各个划分的子块进行运动矢量的恢复;然后利用相邻块运动矢量参考帧的相关性,根据相邻块运动矢量的参考帧确定匹配使用的参考帧;最后采用边缘失真匹配方法恢复运动矢量。实验结果表明,该算法同传统的差错掩盖算法相比,由于支持不同尺寸块运动矢量的恢复,因此,算法对差错信号能够获得更好的恢复效果。
关键词:视频编码;差错掩盖;边缘失真匹配;H264
3030
|
265
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56140204 false
更新时间:2024-05-08
结合Zernike矩和模板具有RST不变性的DWT-HMM鲁棒水印算法
封面论文
封底论文
增强出版
AI导读
王春桃, 倪江群, 黄继武, 张荣跃
2008, 13(7): 1250-1257. DOI: 10.11834/jig.20080705
摘要:抵抗几何攻击是鲁棒水印研究的关键问题之一。为实现水印同步,提出了一种结合Zernike矩和小波域模板实现由粗到精几何同步的算法,即首先利用平移归一化图像的Zernike矩估计旋转和缩放参数,并用校正旋转和缩放后的图像和原图像之间的质心增量估计平移参数;然后基于粗略估计的参数,通过匹配小波域模板实现旋转、缩放和平移(RST)参数的精确识别和校正,该同步方法可以较大程度地降低搜索空间。水印嵌入和检测采用了小波域向量隐马尔可夫模型(DWT HMM)。仿真结果表明,利用由粗到精的几何同步方法和基于HMM的水印算法能有效抵抗StirMark平台的多种单项攻击和联合攻击,算法具有较好的鲁棒性能。
关键词:数字水印;Zernike矩;几何变形;鲁棒性;小波域隐马尔可夫模型;模板
3289
|
307
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141157 false
更新时间:2024-05-08
用于图像认证的可恢复半脆弱数字水印
封面论文
封底论文
增强出版
AI导读
王祖喜, 赵湘媛
2008, 13(7): 1258-1264. DOI: 10.11834/jig.20080706
摘要:为了提高图像认证的可靠性,提出了一种用于图像内容认证的可恢复半脆弱数字水印方案,该方案不仅能鉴别数字图像内容的真实性,还可近似恢复图像中被篡改的区域。该方案基于半色调处理技术,首先将图像半色调处理后生成的二值水印图像经JBIG2压缩后作为嵌入水印,然后经量化索引调制嵌入小波域。用该方案嵌入水印后的图像,在检测时,不但可以定位图像中被篡改的区域,还可以对提取的恢复水印进行解压,并可通过逆半色调处理来重建原图像,用它的对应部分替换被篡改区域来实现对被篡改图像的篡改恢复。此外,由于该算法采用密钥来控制水印的嵌入位置,从而保证了水印的安全性;仿真实验是采用一般性操作和篡改操作相结合的方法,实验结果表明,该算法在保护数字图像内容真实性方面是可行的。
关键词:图像认证;量化索引调制;半色调技术;篡改恢复
4302
|
261
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56140898 false
更新时间:2024-05-08
用于JPEG图像认证的特征水印算法
封面论文
封底论文
增强出版
AI导读
王津申, 戴跃伟, 王执铨
2008, 13(7): 1265-1271. DOI: 10.11834/jig.20080707
摘要:为了更加快速有效地进行JPEG图像认证,提出了一种基于内容的JPEG特征编码算法。该算法的基本思想是首先采用DCT变换域中不同8×8 块之间DCT能量关系来构造特征码;然后在此基础上给出了JPEG图像半脆弱水印方案,即将内容特征码生成方法和水印算法有机地结合在一起。由于特征码具有“半脆弱”特性,即它对于可接受的“内容保持”修改具有鲁棒性,因而对常见的“内容篡改”性修改具有敏感性。另外,由于DCT系数块能量的主要部分集中在低频部分,从而使得可以用低频部分来生成特征码,而且可用高频部分来嵌入水印。实验结果表明,该算法计算简单,不仅有很好的抗JPEG压缩性能,同时对篡改的定位也很精确。
3529
|
279
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141110 false
更新时间:2024-05-08
多投影仪无缝拼接显示中的颜色校正技术比较研究
封面论文
封底论文
增强出版
AI导读
吕品, 张金芳, 王宇心
2008, 13(7): 1272-1280. DOI: 10.11834/jig.20080708
摘要:基于多投影仪的无缝拼接显示是对图形、图像、视频等进行大范围、高分辨率显示的一种有效实现方式。多投影仪无缝拼接显示的一个关键是解决颜色失调问题,而现有的颜色失调原因的分析结果可归纳为投影仪输出颜色的变化特性和投影屏幕与投影环境的影响两个方面。近年来,为解决该问题已提出了多种颜色校正技术,而根据解决颜色失调问题的原理和实现方法的不同,这些技术可分为基于边缘融合的校正技术、基于单一投影光源的校正技术和基于颜色/亮度输出匹配的校正技术3类,并对这3类技术在无缝拼接显示效果、可维护性和可扩展性等方面的优缺点进行了较详细分析,该领域下一步的研究将会朝着兼顾不同投影机类型、不同形状和反射特性的投影屏幕和考虑运动中观察者的实时颜色校正方向发展。
关键词:多投影仪;无缝拼接显示;颜色校正;色彩一致
3385
|
285
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139640 false
更新时间:2024-05-08
一种基于遗传算法的脑MR图像去偏移场模型
封面论文
封底论文
增强出版
AI导读
王利, 陈允杰, 汤杨, 韦志辉, 王平安, 夏德深
2008, 13(7): 1281-1286. DOI: 10.11834/jig.20080709
摘要:由于磁共振图像(magnetic resonance images, MRI)常含有偏移场而影响后继图像分割,针对这种图像的分割,采用Legendre多项式基函数来拟合偏移场,可以去除偏移场对图像分割的影响。当使得恢复图像的信息熵达到最小时,则求得的偏移场最优。在求偏移场的过程中,需要求解基函数的参数,由于传统的梯度下降法易陷入局部最优,为解决此问题,提出将遗传算法引入到参数求解过程中,然而传统的遗传算法不仅时间复杂度高,且易陷入局部最优,为此需对遗传算法进行改进,使得不仅更容易得到全局最优解,且时间复杂度较低。实验证明,该改进算法可以得到精确的偏移场,并可得到准确的分割结果。
关键词:磁共振图像;偏移场;信息熵;梯度下降法;遗传算法;局部最优;全局最优
3381
|
254
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139439 false
更新时间:2024-05-08
加权Myriad滤波器的研究
封面论文
封底论文
增强出版
AI导读
袁杰, 都思丹
2008, 13(7): 1287-1291. DOI: 10.11834/jig.20080710
摘要:为了克服在图像处理领域常用的线性滤波器的不足,非线性滤波器就成了非常有意义的一个研究方向。Myriad算法是基于稳定模型的一种非线性滤波算法,它能够充分利用稳定分布的多种模式来进行非线性信号加权处理。Myriad滤波作为一种图像滤波算法,和常用的中值滤波相比,其优势在于不仅能够有效地滤除盐椒噪声,还能够使细节部分保持得更好。本文提出了中心加权Myriad滤波器和自适应加权Myriad滤波器,通过对参数K的调节,平衡在窗口中去除噪声和保持图像细节之间的矛盾,而所加权重也能够根据图像自适应变化。
关键词:加权Myriad滤波;自适应变化权重;中心加权
3900
|
248
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56140840 false
更新时间:2024-05-08
利用几何结构检测去除图像中的随机值脉冲噪声
封面论文
封底论文
增强出版
AI导读
商泽利, 水鹏朗, 王小龙
2008, 13(7): 1292-1297. DOI: 10.11834/jig.20080711
摘要:尽管中值滤波以及各种改进方法是去除图像中随机值脉冲噪声的有效方法,然而,大多数去噪方法存在门限值选取困难和对图像边缘纹理结构过平滑的缺点。针对这一问题,提出了一种基于几何结构的用于检测和去除随机值脉冲噪声的新方法。该方法首先利用图像的直方图分布来估计脉冲噪声的噪声率;然后进一步基于噪声率和细节图像的直方图分布,自适应地确定两个分类门限;最后利用两个门限,将细节图像中的像素分成‘未被污染点’、‘待定点’和‘噪声点’。其中‘待定点’主要由边缘和纹理区像素和噪声像素构成,为区分其属性,还引入了几何结构检测方法。基于各像素点的类型,细节图像被用于修正中值滤波的结果。实验结果表明,该新方法在去除脉冲噪声的同时,还很好地保留了图像的边缘结构。与已有的方法相比,具有明显的优势。
关键词:随机值脉冲噪声;中值滤波;噪声率;几何结构检测
3347
|
281
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56140042 false
更新时间:2024-05-08
双目视觉测量系统的标定及3维测量
封面论文
封底论文
增强出版
AI导读
夏艳, 苏中, 吴细宝
2008, 13(7): 1298-1302. DOI: 10.11834/jig.20080712
摘要:针对结构光形位公差视觉测量系统,提出了一阶径向畸变的摄像机成像模型和标定方法,并对传统的直接线性变换(DLT变换)标定算法做了些改进。即先针对没有畸变的线性模型,利用传统的标定算法,解线性超定方程组求解摄像机的全部参数,再针对引入一阶径向畸变的成像模型,以线性模型的参数为初值,通过非线性迭代优化摄像机的图像中心,等效焦距,倾斜因子,畸变系数等内部参数。实验结果表明,该方法无需预标定,精度适中,是相对简单实用的标定方法。
关键词:计算机视觉;3维测量;摄像机标定
4192
|
294
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56138052 false
更新时间:2024-05-08
一种基于多层背景模型的前景检测算法
封面论文
封底论文
增强出版
AI导读
杨涛, 李静, 潘泉, 程咏梅
2008, 13(7): 1303-1308. DOI: 10.11834/jig.20080713
摘要:动态场景中的前景检测是后继处理的基础和制约整个智能视频监控系统稳定性、可靠性的关键。为了在保证运动目标检测的基础上,进一步检测出前景中的静止目标并消除“鬼影(Ghost)”,提出了一种基于多层背景模型的前景检测算法。该算法将背景分为参考背景和动态背景两层,分别采用单高斯和混合高斯模型进行背景建模。在线检测时,采用动态背景提取变化前景,用动态背景与参考背景之间高斯分布的差异提取静止前景,同时,通过逐层分析,比较输入像素与两层背景模型分布的相互关系,快速消除Ghost,降低虚警。实验结果表明,多层背景模型具有良好的检测性能和实时性,为后继跟踪、分类等处理提供了坚实的基础。目前,以该算法为核心构建了一个实时目标检测、跟踪系统,对图像大小为320×240的视频序列的平均处理速度达到15帧/s。
关键词:多层背景模型;背景建模;混合高斯;静止前景检测
3691
|
315
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142231 false
更新时间:2024-05-08
一种基于连通分析的UWB SAR目标检测算法
封面论文
封底论文
增强出版
AI导读
杨志国, 黄晓涛, 周智敏
2008, 13(7): 1309-1315. DOI: 10.11834/jig.20080714
摘要:由于超宽带合成孔径雷达(UWB SAR)具有较强的穿透性而被广泛用于探测叶簇覆盖目标,但目前针对此种目标的检测尚未有系统完整的检测算法提出,多数研究机构在对基于UWB SAR的叶簇覆盖目标进行检测时,均沿用美国Lincoln实验室提出的三级结构检测流程,该通用检测算法在对高波段、高分辨率全极化SAR数据进行目标检测时,虽表现出良好的检测和识别性能,但用于UWB SAR叶簇覆盖目标检测时,则存在诸多不适用性。该文在对通用检测算法用于UWB SAR目标检测时存在的问题进行分析的基础上,提出了一种适用的新算法,该新算法通过滑窗平均、低门限恒虚警(CFAR)检测以及连通分析降低了算法对检测环境的要求,从而增强了算法的适用性和稳健性,最后给出了采用通用检测算法和新算法对UWB SAR图像中叶簇覆盖目标进行检测的结果,并验证了新算法在UWB SAR叶簇覆盖目标检测中的有效性。
关键词:超宽带合成孔径雷达;目标检测;检测概率;虚警概率;小滑窗平均;低门限恒虚警;连通分析
3285
|
238
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139330 false
更新时间:2024-05-08
基于人眼视觉注视机制下突触短时可塑性的图像边缘检测算法
封面论文
封底论文
增强出版
AI导读
潘晴, 严国萍, 张玉宽
2008, 13(7): 1316-1321. DOI: 10.11834/jig.20080715
摘要:据人眼视觉在外界刺激下引发神经细胞突触短时程可塑效应而造成感受野结构发生形变的生理现象,对视觉感受野的形变方式进行了假设,在研究了形变后感受野模型长轴和边缘方向的夹角对滤波效果影响曲线的基础上,提出了一种新的高通滤波算法。通过实验验证了该算法在高通滤波效果和实时性能方面的优越性和文中假设的合理性。结果表明,该算法更加适合于对人眼视觉注视机制的描述。
关键词:突触短时可塑性;注视机制;高通滤波
4031
|
251
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141378 false
更新时间:2024-05-08
扫描蛇:一种从高分辨率遥感图像上提取道路的新方法
封面论文
封底论文
增强出版
AI导读
汪闽, 杨晓梅, 闾国年
2008, 13(7): 1322-1328. DOI: 10.11834/jig.20080716
摘要:为了能对高分辨率遥感图像上各种复杂情况下的道路进行有效提取,提出了一种称之为“扫描蛇”的半自动新方法。该方法的基本过程是:首先根据用户确定的起始点确定道路的基本走向、路宽、灰度分布等剖面特征;然后在起始剖面两侧进行深度搜索,寻找满足符合条件的道路边缘(梯度极值)点对;最后进行点对连接形成双线道路。在“北京一号”小卫星图像上的实验证明在道路方向、灰度特征分布发生显著改变,道路间断、相互交叉等一系列复杂条件下,该方法均能有效地提取主干道路,体现出较强的鲁棒性和实用价值。
关键词:高分辨率遥感;道路;信息提取
3861
|
317
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56140679 false
更新时间:2024-05-08
基于混淆交叉支撑向量机树的自动面部表情分类方法
封面论文
封底论文
增强出版
AI导读
徐琴珍, 章品正, 裴文江, 杨绿溪, 何振亚
2008, 13(7): 1329-1134. DOI: 10.11834/jig.20080717
摘要:面部表情自动分类是情感信息处理研究中的重要内容,为了提高表情识别的准确率以及鲁棒性,提出了一种基于混淆交叉支撑向量机树的面部表情自动分类方法。该方法依据伪Zernike矩特征,以混淆交叉支撑向量机树对矩特征进行学习,实现面部表情的自动分类。混淆交叉支撑向量机树的结构使模型能够根据教师信号将面部表情识别问题分解,在不同的层次上以相对较低的复杂度解决子问题;在训练阶段,对当前中间节点划分的两个子样本集进行混淆交叉,增强了模型在面部表情识别上的整体泛化性能以及鲁棒性。实验对Cohn Kanade面部表情数据库中的6类基本表情进行自动分类,准确率达到96.31%;与同样基于该数据库的识别方法相比,该方法在识别正确率和鲁棒性上具有较大的优势。
关键词:面部表情自动识别;混淆交叉;支撑向量机树;伪Zernike矩
3580
|
213
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141445 false
更新时间:2024-05-08
一种提取单幅散斑干涉条纹图中心线的可靠方法
封面论文
封底论文
增强出版
AI导读
杨夏, 于起峰, 伏思华, 孟令晶
2008, 13(7): 1335-1340. DOI: 10.11834/jig.20080718
摘要:在光测力学中,如何从单幅散斑干涉条纹图中高精度地自动提取方向信息是一项较困难的工作。为了可靠地提取单幅散斑干涉条纹图的中心线,提出了一种简单可行的方法,该方法先通过平面拟合的方法来得到散斑干涉条纹图的条纹方向;然后在条纹方向上,利用条纹切面的倾斜度来提取散斑干涉条纹图的中心线。实验表明,此方法可靠、实现简单,对高噪声的散斑干涉条纹图非常有效。
关键词:散斑;条纹方向;条纹倾角;条纹中心线
3351
|
262
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141008 false
更新时间:2024-05-08
基于纹理的雷达与多光谱遥感数据小波融合研究
封面论文
封底论文
增强出版
AI导读
高文涛, 汪小钦, 凌飞龙, 史晓明
2008, 13(7): 1341-1346. DOI: 10.11834/jig.20080719
摘要:众所周知,多光谱与雷达影像融合具有重要的意义,但雷达影像小尺度的纹理特征在先前的融合方法中却没有被考虑。为了更好地对多光谱与雷达影像进行融合,基于双正交小波变换,提出了一种小尺度纹理影像参与融合的三影像小波融合方法。该方法借鉴多通道滤波及基于亮度调节的平滑滤波(SFIM)融合的原理,首先提取多时相雷达影像的小尺度纹理数据;然后再将该纹理数据、单时相JERS 1 SAR数据及TM多光谱数据进行小波融合。分析表明,该方法的融合结果较雷达与多光谱影像小波融合的结果不仅具有更丰富的光谱特征,而且由于继承了雷达影像丰富的小尺度纹理特征,因而具有更高的清晰度。实验证明,该方法可获得较好的融合结果,是一种切实有效的融合法。
关键词:基于亮度调节的平滑滤;小波变换;纹理影像;遥感数据融合;TM影像;JERS 1合成孔径雷达影像
3032
|
266
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139520 false
更新时间:2024-05-08
基于子窗口区域的足球视频镜头分类
封面论文
封底论文
增强出版
AI导读
于俊清, 王宁
2008, 13(7): 1347-1352. DOI: 10.11834/jig.20080720
摘要:为了对海量视频数据进行有效的管理和快速浏览,急需对数字视频进行基于内容的视频检索。镜头分类是足球视频处理与检索的重要部分,针对目前现有足球镜头分类方法存在算法准确性不高或运算量过大的问题,提出了一种新的基于子窗口区域的镜头分类方法。该方法采用在HSV颜色空间中计算足球视频帧子窗口区域球场色像素比率,并辅以边缘信息的检测,对足球视频中的主镜头、中镜头、特写镜头和其他镜头进行了分类,实验结果表明该方法切实可行,具有很高的检出率和准确率。
关键词:镜头分类;子窗口区域;足球视频;HSV颜色空间
3913
|
287
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141072 false
更新时间:2024-05-08
基于多点模型的3D人脸姿态估计方法
封面论文
封底论文
增强出版
AI导读
胡步发, 邱丽梅
2008, 13(7): 1353-1358. DOI: 10.11834/jig.20080721
摘要:改进传统的活动形状模型法,准确地提取人脸特征点后,针对人脸形状特性,使用人脸的多个特征点作为人脸模型,通过最小二乘法优化求解,精确估计3D人脸空间姿态。实验结果表明,新方法不仅可以获得稳定的姿态解,而且与同类方法比较具有良好的姿态估计精确度。
关键词:人脸姿态估计;活动形状模型;最优化
4640
|
295
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139589 false
更新时间:2024-05-08
一种改进的MC算法
封面论文
封底论文
增强出版
AI导读
朱经纬, 蒙培生, 王乘
2008, 13(7): 1359-1366. DOI: 10.11834/jig.20080722
摘要:为了对等值面与子等值面进行提取和分组,在MC算法原理的基础上,提出了一种改进的等值面提取与子等值面分组算法。该算法首先将数据场分解为点、棱边、面与体元的拓扑结构;然后在整个数据场范围内求所有棱边与等值面的交点,并在面内连接交点形成面与等值面的交线,交线在体元内连接生成空间多边形;接着通过三角化各个体元内的空间多边形得到由顶点表与三角形表组成的等值面数据;最后根据三角形在顶点处的连接关系,采用种子算法对属于同一子等值面的三角形与顶点进行标记,属于同一子等值面的顶点与三角形将被存放在独立的顶点表与三角形表中。实验结果表明,该算法可以高效地实现等值面提取与子等值面的分组。
关键词:Marching;Cubes算法;子等值面;种子算法
4935
|
270
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141405 false
更新时间:2024-05-08
一种基于轮廓的图像检索算法
封面论文
封底论文
增强出版
AI导读
谢邦旺, 王加俊
2008, 13(7): 1367-1373. DOI: 10.11834/jig.20080723
摘要:针对Choi Wai pak等人提出的基于最大内切圆直方图的图像检索算法存在的不足,提出了一种改进的新的基于轮廓的图像检索算法。该算法首先用两种不同尺度的1维高斯函数分别对目标轮廓的凹陷部分和凸起部分进行进化处理来得到一个平滑简单而又能很好代表原始轮廓主要信息的进化曲线;然后利用骨架化算法提取出目标骨架;最后,利用进化后的轮廓与骨架之间的距离直方图来构造目标形状的描述符,并实现了图像检索。与Choi Wai pak等人提出的算法(只利用了形状的骨架信息)相比,该新算法不仅利用了轮廓所表达的外围整体形状信息,还利用了骨架所表达出的形状的拓扑关系。实验结果表明,该新算法在尺度变换、旋转变换以及抗噪性能等方面具有更优的鲁棒性。
关键词:图像检索;形状检索;轮廓;距离直方图
3769
|
292
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139707 false
更新时间:2024-05-08
利用物理模型合成皮肤图像
封面论文
封底论文
增强出版
AI导读
徐舒畅, 叶修梓, 张三元, 张引
2008, 13(7): 1374-1378. DOI: 10.11834/jig.20080724
摘要:为了获得各种丰富和逼真的皮肤图像,在对皮肤结构和皮肤组成进行分析的基础上,提出了一种基于物理模型的鲁棒算法对输入的单张皮肤图像自动进行色素分离,并在此基础上实现了全局性和局部性的合成。输入的图像首先被分成N个子区域,并依次在每个子区域利用ICA算法提取分离向量,之后对得到的分离向量进行合理性验证。如果分离向量不合理,则丢弃,在下一个子区域重复上述过程。最后,从所有的合理分离向量中得到最终的分离向量,分离得到黑色素和血色素的密度分布图。通过改变色素的密度可以进行全局性合成,也可以利用密度信息选取感兴趣区域进行局部性合成。实验结果表明,该算法非常有效,可以对人体皮肤图像进行“电子化妆”,重新生成更多逼真的合成图像。
关键词:黑色素;血色素;皮肤图像合成
3625
|
253
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139391 false
更新时间:2024-05-08
协同分布式图形硬件的混合并行体绘制
封面论文
封底论文
增强出版
AI导读
曹轶, 莫则尧, 王弘堃, 袁斌
2008, 13(7): 1379-1384. DOI: 10.11834/jig.20080725
摘要:由于一般的共享存储并行机缺乏图形硬件,其上产生的3维科学计算数据,无法采用硬件加速的并行体绘制来就地进行数据可视化。为此基于本地并行机和分布式图形工作站,给出了一种混合并行绘制模型。该模型的工作原理是先将源数据存留在并行机,然后通过并行机的多处理器发布远程绘制命令流,进而通过操控工作站的图形硬件完成绘制;后期图像合成在并行机上执行,以发挥共享存储通信优势。通过负载平衡优化,并行绘制流水线有效实现了绘制、合成与显示的重叠。实验结果显示,该方法能以1 024×1 024图像分辨率,交互绘制并行机上的大规模数据场。
关键词:并行体绘制;分布式绘制;远程可视化;3维纹理硬件
4040
|
287
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56139862 false
更新时间:2024-05-08
共 0 条
1
前往:
页
跳转
上一期
下一期
0
批量引用
回到顶部