首页
期刊介绍
基本情况
编委会
期刊在线
当期目录
过刊浏览
在线出版
专栏专刊
虚拟专辑
投稿须知
处理流程
撰稿要求
同行评议
开放获取
学术诚信
联系我们
数据集上传流程
数据集共享
学术活动
名师讲堂
研究生论坛
文档图像微沙龙
图像视频通信沙龙
最美封面评选
年度会议
图图直播间
下载中心
联系我们
期刊订阅
纸刊订阅
邮件推送
RSS订阅
个人中心
退出登录
浏览全部资源
扫码关注微信
首页
期刊介绍
基本情况
编委会
期刊在线
当期目录
过刊浏览
在线出版
专栏专刊
虚拟专辑
投稿须知
处理流程
撰稿要求
同行评议
开放获取
学术诚信
联系我们
数据集上传流程
数据集共享
学术活动
名师讲堂
研究生论坛
文档图像微沙龙
图像视频通信沙龙
最美封面评选
年度会议
图图直播间
下载中心
联系我们
期刊订阅
纸刊订阅
邮件推送
RSS订阅
最新刊期
2007
年
第
12
卷
第
10
期
本期电子书
封面故事
上一期
下一期
本期目录
隧道内数字电视信号覆盖方式比较分析
封面论文
封底论文
增强出版
AI导读
戴懿贺, 夏秀靖, 章丽君
2007, 12(10): 1693. DOI: 10.11834/jig.20071001
摘要:为解决隧道内数字电视信号的覆盖问题,可以采用天线方式和泄漏电缆方式,文中对这两种方式进行了理论分析和实际测试比较,并介绍了两种方式各自的优缺点和适用场合。
关键词:数字电视;隧道覆盖
3845
|
200
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141877 false
更新时间:2024-05-07
基于DIBR和图像融合的任意视点绘制
封面论文
封底论文
增强出版
AI导读
刘占伟, 安平, 刘苏醒, 张兆扬
2007, 12(10): 1696. DOI: 10.11834/jig.20071002
摘要:虚拟视点生成是3维视频会议等应用领域中的关键技术,为了快速高质量地进行任意视点绘制,提出了一种基于深度图像绘制(OIBR)和图像融合的新视点生成方法,该方法首先对参考图像进行预处理,包括深度图像的边缘滤波和参考图像规正,以减少目标图像中产生的较大空洞和虚假边缘;然后利用3维图像变换生成新视点图像,并用遮挡兼容算法对遮挡进行快速处理;接着再对两幅目标图像进行融合得到新视点图像;最后用插值法填充剩余的较小空洞。实验证明,该新方法能获得令人满意的绘制效果。
关键词:基于图像的绘制;基于深度图像的绘制;3维图像变换;遮挡兼容算法
3677
|
234
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144046 false
更新时间:2024-05-07
Linux下WMV高性能IPTV流媒体服务器的设计与开发
封面论文
封底论文
增强出版
AI导读
孙澔峻, 叶德建
2007, 12(10): 1701. DOI: 10.11834/jig.20071003
摘要:流媒体点播技术定位于提供实时的文件点播服务,而WMV则是一种IPTV常用的文件格式。为了解决Linux或类Unix环境下对WMV文件格式的支持,设计了一个具有完全自主知识产权的支持WMV格式的Linux环境下的流媒体点播系统。该流媒体服务器采用创新的主从式架构设计,并设计了RTSP连接队列调度等算法,用来完善服务器的功能和提高服务器的性能。
关键词:流媒体;网络电视;WMV;高性能;Linux平台
3054
|
230
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56145164 false
更新时间:2024-05-07
面向嵌入式机顶盒终端的P2P网络电视直播系统的设计与实现
封面论文
封底论文
增强出版
AI导读
朱陈洁, 叶德建
2007, 12(10): 1706. DOI: 10.11834/jig.20071004
摘要:针对当前IPTV直播应用中,集中服务模式对服务器性能和网络设施要求较高、可扩展性较差的问题,提出了一种基于P2P(点对点)技术的直播系统ClearLive。与现有的P2P视频系统只针对PC终端的情况不同,该系统主要面向IPTV应用,面向嵌入式机顶盒终端,并兼容Pc终端。ClearLive针对机顶盒终端的特点和IPTV应用的环境做了适当的和针对性的设计。实际系统测试结果表明,ClearLive系统能在较低的硬件配置下为大量用户提供高质量的直播服务。
关键词:IPTV;P2P;直播;机顶盒
3071
|
196
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141699 false
更新时间:2024-05-07
面向移动多媒体的无线光网络路由算法
封面论文
封底论文
增强出版
AI导读
吴迪, 孟庆雷, 殷福亮, 李明
2007, 12(10): 1710. DOI: 10.11834/jig.20071005
摘要:为了提供具有一定QoS保证的高速率宽带多媒体通信,提出一种MMWO模型。该模型采用了自由空间激光通信(FSO)技术,充分考虑了实际应用中多媒体通信自身的特殊要求,给出了一种具有一定QoS保证的路由算法。仿真实验结果表明,该算法的性能较好,能更好地适应节点快速移动、高带宽、高数据传输率的无线多媒体通信。
关键词:无线多媒体通信;光网络;FSO技术;QoS路由
3148
|
196
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144731 false
更新时间:2024-05-07
自由光通信网络的多媒体路由算法
封面论文
封底论文
增强出版
AI导读
佟宁, 吴迪, 王秀坤
2007, 12(10): 1715. DOI: 10.11834/jig.20071006
摘要:自由光通信网络作为一种新兴的宽带无线网络,适用于多媒体通信的要求。针对多媒体业务在FSO网络中的传输进行了研究,考虑FSO网络的特点,提出了适用于多媒体任务的FSO网络模型。利用该模型,设计了基于拓扑控制算法的路由算法TCR。TCR改进三角剖分算法进行拓扑控制,形成虚拟拓扑图,使得节点的平均吞吐量大;同时,TCR是基于位置的、按需和主动混合的路由,适用于数据量大,实时性要求高的多媒体通信需求。
关键词:移动多媒体通信;自由光通信网络;拓扑控制;路由算法
2736
|
183
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143749 false
更新时间:2024-05-07
基于应用层组播的高清流媒体直播原型系统的实现和测试
封面论文
封底论文
增强出版
AI导读
胡文彦, 叶德建
2007, 12(10): 1720. DOI: 10.11834/jig.20071007
摘要:将应用层组播技术应用在高清流媒体直播系统中,设计并实现了一个支持大并发、高性能、小延时的高清流媒体直播原型系统,同时创造性地提出了分布式时移技术并集成在系统中,使用户能随时收看直播或延时直播的节目。该系统在2006年夏世界杯期间在复旦大学校园网内进行了长达一个多月的大规模测试,最高在线人数460。测试数据表明该系统很好地解决了服务器出口带宽瓶颈以及普通P2P技术延时较长等缺点,为国家科技部重点项目高清电视的直播系统提供了一条可行的技术方案。
关键词:应用层组播;流媒体直播系统;分布式时移
2627
|
206
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56145370 false
更新时间:2024-05-07
无线IPTV中RTP—over-TCP传输方案的设计实现以及多TCP传输技术的应用
封面论文
封底论文
增强出版
AI导读
柴颖, 陈荣华, 叶德建
2007, 12(10): 1725. DOI: 10.11834/jig.20071008
摘要:在无线环境下,TCP的传输效果要好于不带拥塞控制的UDP。为了满足“集中-分布式”无线流媒体系统进行RTP-over-TCP传输的需要,设计实现了一套双TCP通道的传输方案,并考察了TCP阻塞调用和非阻塞调用在单线程多用户调度方式下的性能。另外,还尝试用多TCP传输技术来改进TCP在无线环境中带宽利用率低的问题,仿真实验结果表明,该方案可得到较好的传输效果。
关键词:无线网络电视;RTP—over—TCP;TCP阻塞/非阻塞模式多TCP传输技术
3312
|
224
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144753 false
更新时间:2024-05-07
一种用于JPEG2000的小波变换VLSI结构设计方法
封面论文
封底论文
增强出版
AI导读
陈磊, 王峰, 段淋, 周赟
2007, 12(10): 1730. DOI: 10.11834/jig.20071009
摘要:为了快速地进行小波变换,提出了一种应用于JPEG2000的基于提升格式5/3,9/7统一的离散小波滤波单元;同时对于行列并行滤波,提出了一种控制机制,其在缓存5行的条件下,可完成高速行列并行滤波操作。该方法在保证精度条件下,可以取得较高的硬件利用率,且中间数据暂存空间需求低。然后在提升结构基础上,完成了硬件模块设计,并进行了仿真和FPGA实现。最后用VerilogHDL对系统进行了硬件描述,并在AlteraDE2的验证板上的cyclone2EP2C35FC672芯片上,在Quartus6.0环境下实现了该结构功能。
关键词:离散小波变换;统一滤波单元;并行结构;JPEG2000;行缓存
3058
|
207
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144830 false
更新时间:2024-05-07
一种支持H.264和AVS的帧内预测器设计
封面论文
封底论文
增强出版
AI导读
徐张磊, 郑世宝, 杨宇红
2007, 12(10): 1735. DOI: 10.11834/jig.20071010
摘要:为了使多标准视频解码器中的帧内预测器能够支持H.264和AVS两种视频标准,在对H.264和AVS两标准中的帧内预测计算模式进行分析,并对各模式计算公式之间相似性进行分析的基础之上,提出了一种支持H.264和AVS两种标准的,可配置的帧内预测值计算硬件架构。该架构由于将大部分预测模式的计算放到一个可配置的计算单元中进行,从而大大减少了芯片资源的浪费。为了提高处理速度,可采用4个相同的可配置的计算单元并行计算,一次计算出4个像素点的预测值。实验结果表明,该硬件架构在FPGA上占用10371个LUTs,频率可以达到150MHz。
关键词:H.264;数字音视频编解码标准;帧内预测;硬件架构;可配置
2812
|
210
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56146353 false
更新时间:2024-05-07
H.264/AVC中1/4精度内插算法的硬件设计与实现
封面论文
封底论文
增强出版
AI导读
赵子梁, 郑世宝
2007, 12(10): 1740. DOI: 10.11834/jig.20071011
摘要:为了快速地进行H.264/AVC中1/4精度像素内插,提出并实现了一种适用于H.264中1/4像素精度的内插算法的硬件设计。其中对亮度分量,设计了一种将2维滤波转换为1维滤波,4个滤波器并行处理,同时采用流水线技术和用移位加代替乘法运算的硬件架构;对色度分量,用移位加代替乘法运算进行1/8像素精度的内插。实践表明,此架构可满足标清及高清要求,且速度快,面积小。
关键词:1/4精度像素;硬件架构;滤波器;移位加
3070
|
214
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141620 false
更新时间:2024-05-07
H.264帧内4×4块预测模式选择快速算法研究
封面论文
封底论文
增强出版
AI导读
韩青, 李莉, 应骏
2007, 12(10): 1745. DOI: 10.11834/jig.20071012
摘要:在H.264视频编码过程中,编码时间受诸多因素的影响,如帧间/帧内模式选择、运动估计(ME)、率失真优化(RDO)等。为了以较快速度和较好质量进行编码,针对H.264帧内模式选择,提出了一种适用于H.264帧内4×4块预测的模式选择快速算法。该算法利用帧内4×4块最优预测模式与和它相邻的预测模式之间率失真代价(RDCost)的高相关性,以及绝对变换误差和(SATD)与率失真(RD)性能之间的强相关性,有效地跳过一些不太可能的预测模式,从而使帧内4×4块模式选择过程只需进行4次率失真代价计算即可。实验结果显示,该算法在编码性能和编码速度之间取得了很好的折衷。
关键词:H.264;帧内预测;视频编码
2942
|
224
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142003 false
更新时间:2024-05-07
H.264中Pslices帧间快速自适应模式判决算法
封面论文
封底论文
增强出版
AI导读
董彧焘, 方向忠
2007, 12(10): 1749. DOI: 10.11834/jig.20071013
摘要:为了进一步提高编码效率,提出了一种新的H.264中Pslices帧间快速自适应模式判决算法。在该算法中,SKIP模式无需经过拉格朗日率失真优化就可以判定为最佳模式;P8×8模式也可以在拉格朗日率失真优化之前从候选模式中排除。通过对以上两种特殊模式的判决,可以大大减少整个编码时间。仿真结果表明,和H.264参考软件JM10.2相比,该算法在整个编码时间上节省60%~80%的时间,而在PSNR和码率上的变化则可以忽略不计。
关键词:模式判决;H.264;自适应
3038
|
205
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143038 false
更新时间:2024-05-07
基于媒体流行度和前缀缓存的缓存替换算法
封面论文
封底论文
增强出版
AI导读
刘宜宁, 赵正德, 全卫新, 张伟
2007, 12(10): 1753. DOI: 10.11834/jig.20071014
摘要:针对流媒体用户访问偏好的情况,提出了一种基于前缀缓存与媒体流行度的缓存替换算法。该算法根据不同媒体外部、内部流行度给出预估的综合流行度,进而选择可用缓存中具有低流行度的片断进行替换,使得缓存中的所有片断的再利用价值之和最大。模拟实验结果表明,该算法能减少缓存的替换次数,提高缓存命中率,性能较好。
关键词:流媒体;代理缓存;流行度;前缀缓存
3267
|
220
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56145295 false
更新时间:2024-05-07
一种鲁棒的多特征彩色图像检索新方法
封面论文
封底论文
增强出版
AI导读
王向阳, 芦婷婷
2007, 12(10): 1757. DOI: 10.11834/jig.20071015
摘要:为了提高彩色图像检索的准确性,以回归型支持向量机(SVR)理论为基础,结合重要的图像边缘信息,提出了一种鲁棒的多特征彩色图像检索新方法。该方法首先利用回归型支持向量机(SVR)理论,对原始图像进行去噪处理及彩色边缘提取;然后将整个彩色边缘划分成局部网格区域,并分别计算出每个网格区域的颜色直方图和纹理直方图;最后综合利用上述网格区域的颜色直方图和纹理直方图来计算图像间内容的相似度,并进行彩色图像检索。实验结果表明,该方法不仅能够准确、快速的检索出用户所需图像,而且对光照、锐化、模糊等噪声攻击均具有较好的鲁棒性。
关键词:图像检索;回归型支持向量机;彩色边缘;噪声
3027
|
218
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142866 false
更新时间:2024-05-07
基于改进的数据驱动决策树分析的3维人体运动检索
封面论文
封底论文
增强出版
AI导读
向坚, 徐劼, 郭同强, 吴飞, 庄越挺
2007, 12(10): 1761. DOI: 10.11834/jig.20071016
摘要:随着大量3维人体运动捕获数据库的出现,使得如何对人体运动数据进行高效分析和处理,从而有效利用运动捕获数据库成为一个新的挑战。为了高效地进行3维人体运动检索,首先通过从人体运动中提取一种基于3维空间变换特征规律的空间变换特征和运动的一些关键的时间特性来得到人体运动的3维时序特征;然后针对不同的训练需求,通过改进的数据驱动决策树的学习方法来分析关节点对运动相似的不同影响,并在检索过程中按照不同影响程度依次对关键点进行相似度计算;最终实现了一个高效的运动检索仿真系统。
关键词:运动捕获;3维时序特征;决策树;检索
2816
|
226
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56146282 false
更新时间:2024-05-07
融合相机元信息的基于区域的手机图片搜索
封面论文
封底论文
增强出版
AI导读
马桔, 路红, 郭跃飞
2007, 12(10): 1766. DOI: 10.11834/jig.20071017
摘要:照相手机的流行及其具有的随身携带性,使得人们能够随时随地进行拍照。相比传统的相机来说,手机的联网性使得人们能够实时地进行图片搜索和分享。由此而来的手机图片数量的急剧增长,又使得如何高效地组织、管理以及检索这些图片成为了研究热点。为了高效地进行手机图片搜索,提出了一种融合相机元信息(Exif)的基于区域的手机图片搜索算法,同时利用这个算法实现了一个在线的用户手机拍摄图片的搜索系统。通过与传统的基于内容的手机图片搜索的对比可见,该算法通过融合进相机元信息以及物体的区域特征,在一定程度上降低了“语义鸿沟”问题。实验结果表明,该算法优于传统的基于底层特征的图片搜索算法。
关键词:图片搜索;基于内容的图片搜索;基于区域的方法;照相手机;Exif
2759
|
225
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141895 false
更新时间:2024-05-07
XML驱动的图像语义检索研究
封面论文
封底论文
增强出版
AI导读
陈久军, 肖刚, 盛颂恩, 高飞
2007, 12(10): 1770. DOI: 10.11834/jig.20071018
摘要:本文研究面向语义检索的图像内容描述机制。首先提出图像语义检索整体框架,系统采用XML技术,将图像内容层式描述、图像语义对象自动获取、图像语义相似测度等功能模块加以融合,实现语义层面的图像检索。重点对系统框架中与图像内容描述相关的图像特征分层描述模型、空间位置算子定义、语义对象操作等关键技术进行讨论,并定义相应的XML语义描述框架。检索实验结果表明,该方法具有较好的语义检索性能。
关键词:语义检索;XML描述;分层描述;图像检索
3264
|
197
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141717 false
更新时间:2024-05-07
基于归一化图像重要区域的数字水印方法
封面论文
封底论文
增强出版
AI导读
牛盼盼, 杨红颖, 邬俊, 王向阳
2007, 12(10): 1774. DOI: 10.11834/jig.20071019
摘要:为了使数字水印能更有效鲁棒地抗几何攻击,以图像归一化为基础,提出了一种可有效抵抗几何攻击的数字图像水印方案。该方案首先利用基于矩的图像归一化技术将原始载体映射到几何不变空间内;然后结合不变质心理论提取出归一化图像的重要区域;最后根据人眼视觉特性及小波系数相关性,利用自适应量化调制策略将水印信息嵌入到归一化图像的重要区域内。仿真实验结果表明,该图像水印方案不仅具有良好的透明性,而且具有较强的抵抗常规信号处理及几何攻击的能力。
关键词:图像水印;几何失真;图像归一化;重要区域
2975
|
205
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142898 false
更新时间:2024-05-07
传输流不等差错保护的研究
封面论文
封底论文
增强出版
AI导读
张一, 周军
2007, 12(10): 1778. DOI: 10.11834/jig.20071020
摘要:就DVBoverIP的网络电视传输,提出了一种针对传输流的不等差错保护算法,还提出了一种新的视频质量评估标准——预期受损条块数和基于该评估标准的一种数据交织策略,实验结果表明,该算法有效地提高了视频传输的可靠性,减少了网络丢包对视频质量的影响。
关键词:不等差错保护;传输流;数据交织;网络电视;打包基本流;节目服务信息
2688
|
169
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144393 false
更新时间:2024-05-07
自适应时域差错掩盖方法
封面论文
封底论文
增强出版
AI导读
马鑫, 杨小康, 宋利
2007, 12(10): 1782. DOI: 10.11834/jig.20071021
摘要:差错掩盖作为视频传输中的重要技术之一,可以有效地弥补视频在传输过程中,因为传输环境等原因造成的数据丢失及数据错误,最大程度地保证视频在到达接收端后可以保持令人满意的质量。通过提出一种可应用于基于块编码系统的自适应时域差错掩盖方法,同时估计丢失宏块的运动及丢失宏块中的像素运动,并根据每个像素的不同情况,自适应地将两个估计的运动结合,获得最终的像素恢复值。实验结果表明,该方法相比原有方法,在主观和客观质量上都有较大的提高。
关键词:视频传输;差错掩盖
2868
|
206
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144132 false
更新时间:2024-05-07
基于3维立体技术的视觉加密
封面论文
封底论文
增强出版
AI导读
孙阳, 刘晓峰, 王常杰, 何达华, 杨小康
2007, 12(10): 1786. DOI: 10.11834/jig.20071022
摘要:视觉加密是新的加密研究领域,其优点是利用人眼视觉系统的特性直接对被加密的内容进行解码,而不需要用专用软件或硬件进行复杂的解密计算。近年来,由于自动立体显示技术和立体眼镜技术的发展,使得3维显示的应用日趋广泛,而传统的视觉加密方法在3维视频领域内尚无法取得令人满意的效果,因此3维立体视觉加密研究具有重要意义。为了更有效地对3维视频进行加密,利用3维显示的原理和特点,将其与视觉加密的优点相结合,提出了一种3维立体视觉加密新方法,该方法利用人眼视觉特性中的视差特性将隐藏信息巧妙地隐藏在右视图中,实验结果表明,该方法是有效的。
关键词:3维显示;视觉加密;自动立体显示技术;立体眼镜
2845
|
206
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141768 false
更新时间:2024-05-07
基于多小波的SPIHT改进算法
封面论文
封底论文
增强出版
AI导读
方志军, 李润午, 韦礼珍, 杨寿渊, 万征
2007, 12(10): 1790. DOI: 10.11834/jig.20071023
摘要:为了进一步提高图像编码效率,利用多小波子带上各个分量间的相关性以及分量间能量分布的特点,提出了一种SPIHT改进算法。该算法是根据高频子带第1分量无效值的分布来预测其他3个分量上不重要系数的位置信息,由于减小了无效集判别过程中的扫描范围,从而可加快编码速度。实验结果表明,该算法既提高了编码效率,又保持了压缩性能。
关键词:图像压缩;SPIHT算法;系数重排;多小波变换
3064
|
168
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142954 false
更新时间:2024-05-07
一种基于AVS视频编码的快速帧间预测模式选择算法
封面论文
封底论文
增强出版
AI导读
王蕾睿, 沈礼权, 张兆扬
2007, 12(10): 1794. DOI: 10.11834/jig.20071024
摘要:由于在AVSI-P2中采用了多种预测模式的帧间预测技术,但为了使编码器性能最优,需要对所有帧间候选模式进行遍历,以便从中选择最适合的模式,这无疑会大大增加编码器的计算复杂度。为了快速的进行帧间预测,根据AVSI—P2帧间预测模式的特点提出了一种快速的帧间预测模式选择算法,其特点是将基于全零块的提前中止准则与基于纹理特性的预测模式尺寸预选准则相融合来加快编码速度。实验结果表明,与AVS1-P2参考软件rm52h相比较,该方法在保持比特率和图像质量基本不变的同时,可显著减少编码器的计算复杂性。
关键词:AVS1-P2全零块检测;整数变换;帧间模式选择
3476
|
220
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144663 false
更新时间:2024-05-07
H.264JM模型中运动估计算法及改进方案
封面论文
封底论文
增强出版
AI导读
郑振东, 王沛, 应骏
2007, 12(10): 1798. DOI: 10.11834/jig.20071025
摘要:JM模型是JVT(jointvideoteam)发布的H.264标准测试模型,对算法学习和研究有着重要的意义。根据JM测试模型的参数设定,其中的运动估计算法有3种可选模式。本文结合JMIO.2的源代码对UMHexagons算法进行了分析,并对该算法进行改进,能够在保证视频序列各分量信噪比的情况下缩短运动估计的耗时。本文利用UMHexagons算法的准确预测以及运动估计代价的相关性来设置阈值达到提前结束搜索的目的。在JMI0.2的测试模型上进行了算法验证。实验结果表明,利用块与块之间运动估计代价的相关性,在保证编码性能的同时,可以减少运动估计所需时间的10%以上。
关键词:H.264;运动估计;UMHexagonS算法;JM测试模型
3441
|
188
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143836 false
更新时间:2024-05-07
SPIHT编码图像传输的错误保护技术
封面论文
封底论文
增强出版
AI导读
丁学文, 杨兆选, 曹继华, 郑宏兴, 苏育挺
2007, 12(10): 1802. DOI: 10.11834/jig.20071026
摘要:提出了一种新的SPIHT编码图像传输错误保护算法。该算法采用数据隐藏技术,将纯2维小波最高一级分解的小波系数嵌人最高分辨率级数据重复传输,对码流中的低频和次低频子带系数进行错误保护;对于其他高频子带系数的修复,则利用子带内或者子带间相关性,通过线性数据内插的错误隐藏技术,对受损的小波系数进行修复。实验结果表明,该算法不增加数据冗余,能够有效提高重建图像质量。
关键词:SPIHT编码;纯2维小波;错误保护;数据隐藏;错误隐藏
3631
|
201
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143253 false
更新时间:2024-05-07
位平面算术编码的编码分离与MQ编码器改进
封面论文
封底论文
增强出版
AI导读
王继东, 鲁琴, 罗武胜, 肖学敏
2007, 12(10): 1806. DOI: 10.11834/jig.20071027
摘要:为了降低图像压缩中位平面算术编码的计算复杂度,提出了将算术编码从位平面扫描中分离,方便编码的并行计算。以JPEG2000的位平面编码为例,实现了位平面扫描和MQ编码的分离,然后根据编码分离后的算法特点,设计了一种改进的MQ编码器。对该算法在TMS320C6000系列DSP中的实现进行了研究,通过软件流水、循环展开、条件操作和优化选项等方法提高处理速度。编码独立和编码器改进相结合,使重建图像质量稍有提高,编码速度提高了8倍以上。
关键词:图像压缩;算术编码;并行计算;编码分离;MQ编码器改进
4399
|
216
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141649 false
更新时间:2024-05-07
高分辨率视频会议中基于模板的自适应编码算法
封面论文
封底论文
增强出版
AI导读
王莼栋, 叶德建
2007, 12(10): 1811. DOI: 10.11834/jig.20071028
摘要:如今,对高分辨率的便携计算机视频会议系统的需求日益高涨。虽然便携计算机使用方便、局域网带宽充足,能够为工作学习带来许多益处,然而计算资源的紧张却直接影响了高分辨率视频会议的效果。针对这个问题提出了自适应模板编码算法(template—basedcodingalgorithm,TBCA),不仅能比传统自适应算法提高10%的计算资源利用率,还减少了近一倍的参数调整频率。TBCA已被实现在校园网会议系统(campusvideomeetingsystem,CVMS)中,成功地提高了用户体验。
关键词:自适应编码;实时视频系统;高分辨率;视频编码
3725
|
193
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144524 false
更新时间:2024-05-07
基于熵模型的压缩域运动对象检测
封面论文
封底论文
增强出版
AI导读
徐剑峰, 刘志, 张兆杨
2007, 12(10): 1815. DOI: 10.11834/jig.20071029
摘要:随着视频编解码技术的发展,H.264已成为最主要的标准之一。为了能从H.264码流中准确有效地分割和提取出运动对象,提出了一种压缩域下的对象检测算法。该算法主要利用压缩域下对象的运动矢量信息,先对矢量进行中值滤波预处理,目的是为了减少运动估计算法和对象实际运动所产生的误差。然后利用基于熵的原理,建立运动对象在空间和时间上的一致性模型。在该模型基础上,采用最大熵方法自适应获得阈值,检测得到运动对象。实验结果证明,该算法可以获得比较好的检测结果。
关键词:压缩域;对象检测;H.264
3367
|
196
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142068 false
更新时间:2024-05-07
基于EM聚类的H.264压缩域视频对象实时分割算法
封面论文
封底论文
增强出版
AI导读
刘方青, 石旭利, 张兆扬
2007, 12(10): 1819. DOI: 10.11834/jig.20071030
摘要:从压缩域直接分割视频对象比传统的像素域分割具有快速高效的特点,目前已有不少从MPEG域分割的方法,但从H.264压缩域分割的甚少。为此提出一种基于H.264域的实时分割运动对象方法,该算法先对当前视频帧进行全局运动估计和补偿,然后对4×4的运动矢量场进行分类处理,最后对非零运动矢量使用改进的EM聚类分割算法。本文算法对多个视频序列进行了实验,结果表明,该算法针对静止背景和运动背景的视频序列都能达到较精确的实时分割。
关键词:H.264;压缩域;运动对象分割;EM聚类;全局运动补偿
2974
|
243
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141823 false
更新时间:2024-05-07
基于分布式编码的多描述视频编解码器
封面论文
封底论文
增强出版
AI导读
范钰华, 王嘉, 孙军, 余松煜
2007, 12(10): 1823. DOI: 10.11834/jig.20071031
摘要:为了解决多描述视频编码器在丢包信道下的漂移问题,本文提出了一种新的基于分布式视频算法的多描述视频编码方案。实验结果表明,借助于分布式编码的稳健性,这一新方案能有效地避免漂移问题。为了解决多描述视频编码器在丢包信道下的漂移问题,提出了一种新的基于分布式视频算法的多描述视频编码方案。实验结果表明,借助于分布式编码的稳健性,这一新方案能有效地避免漂移问题。
关键词:分布式编码;多描述视频编码;丢包信道;漂移问题
3086
|
217
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144627 false
更新时间:2024-05-07
基于可伸缩视频编码Hierarchical-B结构的恒定质量控制
封面论文
封底论文
增强出版
AI导读
谈永敏, 杨小康, 宋利
2007, 12(10): 1827. DOI: 10.11834/jig.20071032
摘要:针对H.264视频编码标准可伸缩扩展部分采用Hierarchical—B结构实现了时域上的可分级特性.同时与传统的IPPP或者IBP编码结构相比,在编码增益上也有较大的提高。但其特殊的预测结构会造成图像质量的抖动,在有快速运动和场景切换时此现象尤甚。提出了一种简单的基于PSNR和MAD的恒定质量控制算法,通过在帧级选择合适的量化参数来限制图像质量的波动范围。该算法在JVT规定的标准基础上进行了仿真,实验结果表明,PSNR的方差大幅减小,并基本接近目标PSNR。
关键词:恒定质量;Hierarchical—B结构;可伸缩视频编码
2938
|
194
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144578 false
更新时间:2024-05-07
H.264兼容的全景视频编码方法
封面论文
封底论文
增强出版
AI导读
熊聪, 余松煜, 宋利, 杨小康
2007, 12(10): 1832. DOI: 10.11834/jig.20071033
摘要:在拍摄全景视频时,摄像头往往仅在水平方向上移动。由于在水平移动中偶尔有轻微的上下抖动,以及传感器采集引入的噪声,直接对其进行H.264编码,编码效率不高。针对全景视频拍摄和H.264编码的特点,提出了一种对全景视频高效的H、264编码方法,首先将原始全景视频合成一张全景图;然后再把全景图直接转换为标准H.264码流。实验结果表明,采用该方法对其编码,与直接编码原始视频相比,编码效率大大提高。
关键词:全景视频;全景图;H.264视频编码;运动矢量
3954
|
186
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143066 false
更新时间:2024-05-07
基于光照无关图的阴影去除方法
封面论文
封底论文
增强出版
AI导读
刘富强, 李洲晖
2007, 12(10): 1837. DOI: 10.11834/jig.20071034
摘要:为了在检测目标时排除阴影的干扰,首先论述了光照无关图的原理及其重要性质,然后在此基础上提出了一种基于光照无关图的阴影去除方法。该方法根据光学成像原理通过对图像进行变换来得到一幅与光照无关的灰度图,以达到去除阴影的目的。同时针对该方法需事先测定摄像机的光照无关角的不便之处,还提出了基于直方图统计的摄像机光照无关角判定法则。通过对大量不同场景下视频监控图像的实际测试结果表明,基于光照无关图的阴影去除方法以及基于直方图统计的光照无关角判定方法,可以有效去除目标阴影,并可准确分割目标。
关键词:光照无关图;光照无关角;直方图统计;阴影去除
4046
|
240
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143333 false
更新时间:2024-05-07
基于块的眼睛定位方法
封面论文
封底论文
增强出版
AI导读
艾娟, 姚丹, 郭跃飞
2007, 12(10): 1841. DOI: 10.11834/jig.20071035
摘要:为了能更加有效快速地进行眼睛定位,提出了一种基于块(basedonblocks)的眼睛定位新算法,该算法首先将图像二值化并划分为块,然后利用两只眼睛的相似性和眼睛对的唯一性将一系列的图像块进行匹配,并以此确定一对眼睛的位置。由于该新算法利用了两眼睛固有的位置关系与相互间的相似性,将两眼睛成对考虑,所以能检测各种角度(平面旋转)人脸的眼睛,并可得到较高的检测准确率。此外,实验显示该算法在一定程度上还能适应不同光照条件和表情变化。大量人脸图片上的实验结果表明,该算法可以可靠、快速地定位眼睛。
关键词:面部特征;眼睛定位;人脸;识别块
3126
|
235
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142507 false
更新时间:2024-05-07
基于辐射能量的红外人脸识别
封面论文
封底论文
增强出版
AI导读
伍世虔, 韦礼珍, 方志军, 李润午, 王正友
2007, 12(10): 1845. DOI: 10.11834/jig.20071036
摘要:人脸识别至今还是计算机视觉中的一个难题,用红外人脸图像来进行识别是近几年才发展的一个新领域,虽然其独立于光源,不易受外部光线的影响,但研究发现,人脸温谱图因受到一系列内在(生理、心理等)和外在(环境、成像等)条件的影响而使识别率下降。针对这一问题,根据Stefan-Boltzmann定律,提出把易受环境温度影响的面部温度数据转换为较为鲁棒的辐射能量数据来进行识别,以提高红外图像人脸识别的性能。理论分析显示,当人体处于一个稳定的状态时,辐射能量图对周围环境温度的敏感度较低。实验结果表明,基于辐射能量图的识别率高于基于温谱图的识别率。
关键词:人脸识别;红外图像;辐射能量
3499
|
213
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141855 false
更新时间:2024-05-07
基于三角级数的直方图拟合多目标图像分割
封面论文
封底论文
增强出版
AI导读
冯涛, 方建安, 刘其真
2007, 12(10): 1849. DOI: 10.11834/jig.20071037
摘要:针对灰度图像多层分割如何选取多目标图像分割的准确阈值这一难点问题,提出了一种利用三角级数来对直方图包络线进行拟合,首先把直方图包络线逼近问题转化为求解三角级数的问题,再通过计算拟合函数的拐点来得到用于多目标图像分割的最优阈值的方法。实验结果表明,该方法是求解多峰值直方图图像的最优分割阈值的有效手段。
关键词:三角级数;直方图逼近;函数拐点;最优阈值
3224
|
214
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142158 false
更新时间:2024-05-07
手机文字识别中的暗角修正技术
封面论文
封底论文
增强出版
AI导读
应骏, 袁豪磊, 李莉
2007, 12(10): 1853. DOI: 10.11834/jig.20071038
摘要:为了提高手机图像的识别率,从手机文字扫描识别应用问题出发,在分析手机普遍存在的暗角退化特征的基础上,提出了一种从含有文字信息的图像中提取图像的暗角退化模型的方法;然后根据该暗角模型对输入图像进行复原,最终达到修正手机摄像模组暗角退化的目的。
关键词:文字识别;智能手机;二值化;退化模型;暗角修正
3204
|
212
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142723 false
更新时间:2024-05-07
一种基于ICA的多源图像融合算法
封面论文
封底论文
增强出版
AI导读
曹杰, 龚声蓉, 刘纯平, 姚望舒, 刘全
2007, 12(10): 1857. DOI: 10.11834/jig.20071039
摘要:图像融合的要求是尽可能多地融合源图像中的有用信息,并尽量不要把无用信息融合进来。为了尽可能达到这一要求,在分析盲源分离理论的基础上,提出了一种基于独立分量分析(ICA)的图像融合算法。该算法首先对源图像进行预处理;然后对源图像进行ICA分解,并在ICA域对独立分量系数进行融合;最后根据融合系数重建融合图像。实验结果表明,该新提出的算法降低了产生冗余信息的可能性,对多源图像融合是可行有效的。
关键词:多源图像;图像融合;独立分量分析;矩阵稀疏性
3973
|
189
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56146449 false
更新时间:2024-05-07
一种用于图像拼接的图像序列自动排序算法
封面论文
封底论文
增强出版
AI导读
赵万金, 龚声蓉, 刘全, 沈向军, 刘纯平
2007, 12(10): 1861. DOI: 10.11834/jig.20071040
摘要:为实现全景图拼接中图像序列的自动排序,提出了一种利用相位相关法判断两幅图像是否重叠以及两幅重叠图像的位置关系的完全自动的图像序列排序算法。该算法避免了图像序列排序中的人工干预。实验结果表明,该算法能有效地实现顺序混乱的图像序列的自动排序,并能很好地应用于全景图拼接。
关键词:全景图像;图像拼接;图像序列;自动排序;相位相关
3332
|
239
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143465 false
更新时间:2024-05-07
基于全相位沃尔什内插核的图像插值
封面论文
封底论文
增强出版
AI导读
何宇清, 侯正信
2007, 12(10): 1865. DOI: 10.11834/jig.20071041
摘要:好的内插模板是放大后图像失真小的关键。全相位数字滤波器是一种新型的线性相位滤波器。依据全相位滤波理论,提出了2维Walsh内插模板,采用先对角线内插,再水平垂直内插的放大方法。将该方法同最近邻内插、双线性内插、三次样条内插进行了比较,实验结果表明,该方法计算简便,抗噪能力强。
关键词:全相位数字滤波器;内插;超分辨率
3095
|
178
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56142050 false
更新时间:2024-05-07
基于改进SCW的道路标志牌字符定位算法
封面论文
封底论文
增强出版
AI导读
刘富强, 沙浩
2007, 12(10): 1869. DOI: 10.11834/jig.20071042
摘要:本文提出了一种快速的基于改进SCW的道路标志牌字符定位算法。首先采用改进的自适应图像分割方法SCW对输入图像进行分割,然后对所得二值图像进行连通区域分析,获得斑块信息。最后根据一系列判决标准得出道路标志牌上字符的最终位置。实验结果显示该算法具有很强的准确性和鲁棒性。
关键词:SCW;CCA;字符定位;车辆导航
2892
|
208
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143213 false
更新时间:2024-05-07
一种新的基于机器学习的2维条形码检测算法
封面论文
封底论文
增强出版
AI导读
郝云峰, 戚飞虎, 蒋人杰
2007, 12(10): 1873. DOI: 10.11834/jig.20071043
摘要:随着2维条形码在人们的日常生活和工业生产中越来越多的应用,对2维条形码的检测定位是十分有意义的。目前的检测算法只适用于纸制印刷品表面,不能用于检测印刻在其他材料表面的2维条形码。提出了使用机器学习的方法来检测各种材料表面的基本模式各不相同的2维条形码,在AdaBoost的基础上提出了白适应SpatialBoost算法,将图像的纹理信息和空间信息白适应的结合起来。实验结果表明,该算法所训练出的2维条形码检测器在测试样本上达到了100%的检测率。
关键词:2维条形码;机器学习;白适应SpatialBoost;多分辨率
3022
|
223
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143355 false
更新时间:2024-05-07
基于语义测度的图像相似性计算研究
封面论文
封底论文
增强出版
AI导读
陈久军, 肖刚, 高飞, 张元鸣
2007, 12(10): 1877. DOI: 10.11834/jig.20071044
摘要:针对图像检索中的低层视觉特征相似性度量问题,提出一种基于语义测度的图像相似性计算方法。该方法在图像区域分割的基础上,通过构建图像区域子块与语义元数据之间的统计映射关系,实现图像内容的统计语义描述,建立图像之间、图像与语义类别、语义类别之间的分层语义相似测度。通过对自然图像库的实验结果表明,该方法在相似图像检索中具有更好的性能。
关键词:语义测度;相似性;图像语义;图像检索
3223
|
203
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56145223 false
更新时间:2024-05-07
真实感3D重建中的纹理映射技术
封面论文
封底论文
增强出版
AI导读
郭玲, 王建宇, 黄炎焱
2007, 12(10): 1881. DOI: 10.11834/jig.20071045
摘要:精确的纹理映射是体现模型视觉真实感的关键因素。本文在阐述纹理映射技术原理的基础上,探讨了基于3维激光扫描设备进行3D重建过程中,实现具有高度真实感的纹理映射所遇到的实际问题,提出了基于纹理的模型重构和纹理光照连续性重建算法,解决了纹理图像空间不连续、光照不连续等因素对模型真实感的影响,并通过真实数据的实验对算法有效性进行了验证,为大型户外实体的真实感3D重建奠定了技术基础。
关键词:重建;纹理映射;光照连续性
4351
|
223
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143375 false
更新时间:2024-05-07
基于分叉树和SVM的人脸图像光照方向估计
封面论文
封底论文
增强出版
AI导读
孙雪梅, 苏菲, 蔡安妮
2007, 12(10): 1885. DOI: 10.11834/jig.20071046
摘要:根据人脸识别中光照方向类别多,类与类之间特征不明显,不易分类的问题,提出了采用SVM分类方法解决人脸识别中复杂的、非线性光照方向分类问题。用分叉树将复杂分类变成每级分类,并保证在4类以内的分类方法;同时在各级分类中,根据当前分类的类别特点,提取当前要处理的分类之间的明显特征作为特征进行分类;另外,给出了最优的SVM分类器的训练和构造过程。实验结果表明,该方法对解决分类特征不易于提取,类别数目多的分类问题有明显效果,分类准确率达到89.16%。
关键词:分叉树;SVM;光照方向;人脸识别;非线性
3493
|
228
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144093 false
更新时间:2024-05-07
基于多重加权法的多重分形图像分割研究
封面论文
封底论文
增强出版
AI导读
蒋爱平, 杨悦华, 杨兴全
2007, 12(10): 1889. DOI: 10.11834/jig.20071047
摘要:针对现有多重分形谱对噪声敏感的问题,该文提出了一种基于多重加权法的多重分形谱算法。并首先介绍了基于测度理论的多重分形谱的定义;然后定义了基于多重加权的概率测度,同时对基于多重加权法的多重分形谱性能进行了分析,最后采取与衬底法、方差法进行仿真比较的方法,进行了线性区间、抗噪声性能和收敛速度的比较。比较结果表明,该算法具有保持和加强图像的局部特性以及突出图像的细微处的特点,不仅克服了多重分形谱对噪声敏感的缺点,而且权重因子收敛快。
关键词:分形;多重分形;边缘检测;图像分割
2891
|
214
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143961 false
更新时间:2024-05-07
一种新的残留指纹图像分割方法
封面论文
封底论文
增强出版
AI导读
范国娟, 尹义龙
2007, 12(10): 1893. DOI: 10.11834/jig.20071048
摘要:指纹图像分割主要是去除非脊线区域、不可恢复的脊线区域和残留脊线区域,提高特征提取的准确率和减少图像处理的时间。一般说来,残留脊线具有清晰的脊线结构,单单采用基于指纹图像的特征参数很难将其有效分割。本文提出了两级分割的方法,首先通过面积参数去除分离的残留脊线区域;然后在二级分割中利用形状参数将粘连的残留脊线区域分割掉。实验结果表明,基于本文方法的细节点检测的准确率更高。
关键词:指纹;图像分割;残留脊线;线段编码;链码
3236
|
228
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144163 false
更新时间:2024-05-07
基于PCA预处理的图像特征属性约简
封面论文
封底论文
增强出版
AI导读
孙颖楷, 王光学
2007, 12(10): 1897. DOI: 10.11834/jig.20071049
摘要:讨论了主分量分析在图像特征属性约简中的应用。运用主成分分析PCA(principalcomponentanalysis)对特征向量进行降维处理,并引人粗糙集理论,对其在特征参数属性优化中的运用进行了探索,利用约简算法剔除识别决策表中不必要的属性,揭示出CBIR(contentbasedimageretrieval)系统中特征条件判断属性内在的冗余性。UCI数据集处理结果表明PCA预处理可排除无关特征量的影响,有效进行特征提取,降低图像识别处理的复杂性。
关键词:PCA;图像;粗糙集;约简
2858
|
199
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141736 false
更新时间:2024-05-07
基于DM642的红外图像处理系统的优化策略
封面论文
封底论文
增强出版
AI导读
宋乐, 林玉池, 周欣, 黄银国
2007, 12(10): 1901. DOI: 10.11834/jig.20071050
摘要:提出了一种面向红外图像处理系统的优化设计方法。采用美国INFRARED-2500AS型红外探测器,以高性能数字媒体处理器DM642为核心搭建系统平台,对采集得到的红外图像进行图像插值、直方图均衡等处理,并通过视频编码器进行显示输出。在阐述了系统的体系结构和指令执行流程的基础上,从硬件和软件两方面介绍了相应的优化策略,包括系统电路设计的改进和存储器结构的调整,并利用DM642多媒体指令集等技术进行了代码优化。实验结果表明,经过优化的系统在速度和稳定性等方面均得到了明显的提高,可满足红外图像处理算法大数据量、高速传输、复杂运算的实际需求,并能够适用于野外较为恶劣的工作环境,可以在军事和民用等诸多领域发挥较大作用。
关键词:DM642;红外图像;优化;高速电路;存储器分配
2909
|
220
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56146403 false
更新时间:2024-05-07
基于Gentle Adaboost的行人检测
封面论文
封底论文
增强出版
AI导读
朱文佳, 戚飞虎
2007, 12(10): 1905. DOI: 10.11834/jig.20071051
摘要:行人检测是物体检测领域的一大难点。为了更加快速地检测行人,将人脸检测中BoostedCascade算法应用到行人检测中,并对其进行了改进,即先利用加权平均矢量投影的方法将高维的梯度直方图特征化为1维,再利用lookuptable进行概率密度估计,从而将GentleAdaboost成功地应用于行人检测。实验表明,该方法不仅训练时间短、检测速度快,而且检测精度接近目前的最佳水平。
关键词:行人检测;Gentle;Adaboost
3823
|
217
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143308 false
更新时间:2024-05-07
一种快速的图像修复算法
封面论文
封底论文
增强出版
AI导读
侯正信, 何宇清, 许微
2007, 12(10): 1909. DOI: 10.11834/jig.20071052
摘要:处理图像修复问题的一类主要方法是建立偏微分方程,用迭代的方法来求解,其中最具代表性的算法是BSCB(bertalmio-sapiro-caselles-bellester)算法。针对BSCB模型速度很慢的缺点,提出了结合扩散率函数的选择性自适应插值算法。实验结果表明,该算法简便易行,使运算速度比BSCB模型提高了很多,同时修复的效果也有所改善。
关键词:图像修复;BSCB模型;扩散率函数
4543
|
241
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56145126 false
更新时间:2024-05-07
宽基线主动视觉中感兴趣目标的对应技术
封面论文
封底论文
增强出版
AI导读
刘博文, 余松煜, 徐奕, 杨小康
2007, 12(10): 1917. DOI: 10.11834/jig.20071054
摘要:在主动视觉系统中,通常需要多个代理对同一场景中的感兴趣目标进行协同处理,以提高系统智能分析感兴趣目标的能力。其中,基于多视几何关系解决感兴趣目标的对应问题是协同处理的基础。一方面,主动视觉系统一般工作在宽基线条件下,这增加了对应问题描述的复杂性;另一方面,主动视觉系统以最佳视角观察目标,因此摄像头需做实时的姿态调整,由此导致的视间几何关系变化进一步加深了对应问题的解决难度。本文基于仿射不变的几何特征,建立宽基线条件下的多视几何关系,并针对频繁使用几何特征不能满足主动视觉系统实时要求的问题,提出一种快速更新多视几何关系的方法,并在多视几何约束下实现对应感兴趣目标的鲁棒标识。实验结果表明,该方法能解决宽基线主动视觉系统中感兴趣目标的复杂对应问题,并能达到实时要求。
关键词:主动视觉;宽基线;感兴趣目标;对应问题;多视几何关系
3127
|
253
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143410 false
更新时间:2024-05-07
基于谱聚类的两阶段颜色量化算法
封面论文
封底论文
增强出版
AI导读
谷瑞军, 叶宾, 须文波
2007, 12(10): 1922. DOI: 10.11834/jig.20071055
摘要:颜色量化是进行图像处理和图像分析的重要技术之一,可以被广泛地应用到图像分割、图像压缩和图像识别中。首先利用高效的二分K均值聚类进行粗略量化,然后使用基于加权距离的谱聚类进行再次量化。实验结果表明,和其他常见量化算法相比,两者的结合使得新方法在运算速度和量化质量上都取得了不错的结果,而加权距离的引入,有效地解决了传统算法将包含像素个数少但重要的颜色进行错划分的问题。
关键词:颜色量化;谱聚类;二分K均值
3207
|
186
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56143915 false
更新时间:2024-05-07
电影胶片中霉斑噪声的数字处理技术
封面论文
封底论文
增强出版
AI导读
蒋雯丽, 郑世宝
2007, 12(10): 1926. DOI: 10.11834/jig.20071056
摘要:针对电影霉斑噪声的修复问题,建立了一种自适应平滑修复模型。该模型专门针对噪声特性设计了双向匹配度算法。该算法能不加任何逻辑判断,即可白适应地根据噪声的污染情况找到需要的运动矢量。该模型利用韦伯比设立的噪声检测模型,不仅具有较高的灵敏度和准确度,同时利用膨胀算法解决了噪声的边缘修复问题。针对真实视频序列进行的实验结果表明,去哚效果较好,可见该算法是有效性的。
关键词:霉斑噪声;自适应检测;韦伯比;三步搜索
3052
|
222
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144939 false
更新时间:2024-05-07
运动目标的自动空时分割算法
封面论文
封底论文
增强出版
AI导读
李仁杰, 余松煜
2007, 12(10): 1931. DOI: 10.11834/jig.20071057
摘要:在视频应用中,运动目标的提取是一个重要的研究课题。为了对运动目标进行更有效的分割,提出了一种从视频序列中自动提取运动目标的空时分割算法。该算法在时域分割中采用基于齐异矢量消除的目标检测方法来获得运动目标的初始模板。通常,该初始模板具有不连续的边界和一些“孔”。为了得到较为完整的目标区域,用具有距离约束的区域生长算法来补偿初始模板。而在空域分割中,分水岭分割则通过考虑全局信息来增强其分割的精确性。然后,精确的运动目标即可通过空时融合模块提取出来。试验结果表明,该空时分割算法是有效的。
关键词:空时分割;区域生长;分水岭;齐异矢量
2786
|
237
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56144428 false
更新时间:2024-05-07
精确校正图像的径向畸变和倾斜失真
封面论文
封底论文
增强出版
AI导读
刘堂友, 董爱华
2007, 12(10): 1935. DOI: 10.11834/jig.20071058
摘要:对于用图像进行几何检测,由数码相机生成的图像存在一些固有缺点,如存在径向畸变、倾斜几何变形等。为此提出了一种可同时精确校正数码相机图像的径向畸变和倾斜失真的算法。该算法基于标准网格,首先分别建立倾斜变形模型和径向畸变模型,由此建立目标图像的倾斜变形和径向畸变的联合变形模型;然后用最小二乘法和最优化算法求根据联合失真模型求得标准网格的失真参数,利用该参数可校正同等条件下获得的目标图像;最后对实际图像进行了校正实验,获得了满意的校正结果,说明该算法能有效地同时精确校正图像的径向畸变和倾斜失真。
关键词:图像;径向畸变;倾斜失真;校正
3493
|
223
|
0
<HTML>
<网络PDF>
<Meta-XML>
<引用本文>
<批量引用>
56141674 false
更新时间:2024-05-07
共 0 条
1
前往:
页
跳转
上一期
下一期
0
批量引用
回到顶部