最新刊期

    2018 23 5

      综述

    • 中国图像工程:2017

      章毓晋
      2018, 23(5): 617-628. DOI: 10.11834/jig.180121
      中国图像工程:2017
      摘要:目的本文是关于中国图像工程的年度文献系列综述之二十三。为了使国内广大从事图像工程研究和图像技术应用的科技人员能够较全面地了解国内图像工程研究和发展的现状,能够有针对性地查询有关文献,且向期刊编者和作者提供有用的参考,对2017年度图像工程相关文献进行了统计和分析。方法从国内15种有关图像工程重要中文期刊在2017年发行的共148期上所发表的2 932篇学术研究和技术应用文献中,选取出771篇属于图像工程领域的文献,并根据各文献的主要内容将其分别归入图像处理、图像分析、图像理解、技术应用和综述评论5个大类,然后进一步分入23个专业小类(与前12年相同),并在此基础上分别进行各期刊各类文献的统计和分析。结果根据对2017年统计数据的分析可以看出:图像分析方向当前得到了最多的关注,其中目标检测和识别、图像分割和边缘检测、目标特性的提取分析都是关注的焦点。遥感、雷达、测绘等领域的图像技术研究和应用都最为活跃。结论中国图像工程在2017年的研究深度和广度还在提高和扩大,仍保持了快速发展的势头。  
      关键词:图像工程;图像处理;图像分析;图像理解;技术应用;文献综述;文献统计;文献分类;文献计量学   
      12
      |
      5
      |
      7
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677495 false
      更新时间:2024-05-07

      图像处理和编码

    • 使用四叉树分割进行自适应空域隐写

      黄颖, 康明红
      2018, 23(5): 629-639. DOI: 10.11834/jig.170227
      使用四叉树分割进行自适应空域隐写
      摘要:目的针对自适应隐写术可有效避免对载体敏感区大量修改的关键问题,为间接提高安全性和增大隐写容量,在四叉树分割和自适应像素对匹配(APPM)的基础上提出一种自适应空域隐写术。方法首先该方法以图像块的纹理复杂度作为一致性测度并且设置图像块大小为判别准则进行图像分割,根据四叉树分割结果中面积较小的图像块属于复杂区域,较大的属于平滑区域,按照图像块面积大小将图像分成由高复杂、中复杂、低复杂三大区域构成。其次嵌密方式采用APPM,根据密信容量和载体图像选择进制数B。最后,为了保证安全性和提高容量,优先选择高复杂区嵌入不低于B进制的密信,在中复杂区进行B进制的密信嵌入,在低复杂区选择不高于B进制的密信嵌入。结果为了验证提出的方法,选8幅经典图作为实验,在嵌入率1.92 bit/pixel的情况下,与已有PVD系列算法和DE算法相比具有更高的PSNR值,PSNR值高达48 dB。此外与APPM算法比较,在嵌入率2.5 bit/pixel情况下,该算法的平均KL距离相比传统APPM算法减小了25.37%,平均一阶Markov安全指标值相比传统APPM算法减小了12.11%,对应的平均PSNR值相比传统APPM算法提高0.43%,在嵌入率1.5 bit/pixel情况下,该算法的平均KL距离相比传统APPM算法减小了37.84%,平均一阶Markov安全指标值相比传统APPM算法减小了26.61%,对应的平均PSNR值相比传统APPM算法提高1.56%。此外,从RSP图库中随机选1 000幅图作为数据集,在嵌入率0.5,0.6,0.7,0.8,0.9和1.0 bit/pixel条件下,结合SPAM特征和SVM分类器的最小平均错误率均高于LSB系列经典算法和APPM算法。结论1)考虑了人类视觉系统对图像不同区域的敏感性不同,通过对图像进行四叉树分割预处理,优先选择非敏感区进行隐写,保证了一定的安全性要求,低嵌入率下抗SPAM检测和统计不可见性方面比较有优势。2)在四叉树分割中,对于隐写前后图像的四叉树分割结果不同的异常情况,采用一种图像块纹理复杂度调整方案,保证了密信正确完整提取。3)利用了APPM算法的大容量特性,可以隐写嵌入率大于1 bit/pixel的密信,比较适用于大容量的密信隐写,而且可以嵌入任意进制的密信,最大程度地减少嵌入失真,此外,进行了四叉树分割预处理,在安全性方面优于传统APPM算法。  
      关键词:四叉树分割;自适应像素对匹配;隐写术;纹理复杂度;人类视觉系统;安全性;隐写容量   
      15
      |
      4
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677494 false
      更新时间:2024-05-07
    • 不同颜色模型下自适应直方图拉伸的水下图像增强

      黄冬梅, 王龑, 宋巍, 王振华, 杜艳玲
      2018, 23(5): 640-651. DOI: 10.11834/jig.170610
      不同颜色模型下自适应直方图拉伸的水下图像增强
      摘要:目的水下图像是海洋信息的重要载体,然而与自然环境下的图像相比,其成像原理更复杂、对比度低、可视性差。为保证不同类型水下图像的增强效果,本文提出在两种颜色模型下自适应直方图拉伸的水下图像增强方法。方法首先,进行基于Gray-World理论对蓝、绿色通道进行颜色均衡化预处理。然后,根据红绿蓝(R-G-B)通道的分布特性和不同颜色光线在水下传播时的选择性衰减,提出基于参数动态优化的R-G-B颜色模型自适应直方图拉伸,并采用引导滤波器降噪。接下来,在CIE-Lab颜色模型,对‘L’亮度和‘a’‘b’色彩分量分别进行线性和曲线自适应直方图拉伸优化。最终,增强的水下图像呈现出高对比度、均衡的饱和度和亮度。结果选取不同类型的水下图像作为数据集,将本文方法与融合颜色模型(ICM)、非监督颜色纠正模型(UCM)、基于暗通道先验性(DCP)的水下图像复原和基于水下暗通道先验(UDCP)的图像复原方法相比较,增强后的图像具有高对比度和饱和度。定性和定量分析实验结果说明本文提出的方法能够获得更好视觉效果,增强后的图像拥有更高信息熵和较低噪声。结论在RGB颜色模型中,通过合理地考虑水下图像的分布特性和水下图像退化物理模型提出自适应直方图拉伸方法;在CIE-Lab颜色模型中,引入拉伸函数和指数型曲线函数重分布色彩和亮度两个分量,本方法计算复杂度低,适用于不同复杂环境下的水下图像增强。  
      关键词:水下图像增强;直方图分布;自适应直方图拉伸;颜色模型;拉伸函数;指数型曲线函数   
      15
      |
      5
      |
      18
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677496 false
      更新时间:2024-05-07
    • 应用多索引加法量化编码的近邻检索算法

      刘恒, 姚宇, 曾玲, 陶攀
      2018, 23(5): 652-661. DOI: 10.11834/jig.170297
      应用多索引加法量化编码的近邻检索算法
      摘要:目的海量图像检索技术是计算机视觉领域研究热点之一,一个基本的思路是对数据库中所有图像提取特征,然后定义特征相似性度量,进行近邻检索。海量图像检索技术,关键的是设计满足存储需求和效率的近邻检索算法。为了提高图像视觉特征的近似表示精度和降低图像视觉特征的存储空间需求,提出了一种多索引加法量化方法。方法由于线性搜索算法复杂度高,而且为了满足检索的实时性,需把图像描述符存储在内存中,不能满足大规模检索系统的需求。基于非线性检索的优越性,本文对非穷尽搜索的多索引结构和量化编码进行了探索新研究。利用多索引结构将原始数据空间划分成多个子空间,把每个子空间数据项分配到不同的倒排列表中,然后使用压缩编码的加法量化方法编码倒排列表中的残差数据项,进一步减少对原始空间的量化损失。在近邻检索时采用非穷尽搜索的策略,只在少数倒排列表中检索近邻项,可以大大减少检索时间成本,而且检索过程中不用存储原始数据,只需存储数据集中每个数据项在加法量化码书中的码字索引,大大减少内存消耗。结果为了验证算法的有效性,在3个数据集SIFT、GIST、MNIST上进行测试,召回率相比近几年算法提升4%~15%,平均查准率提高12%左右,检索时间与最快的算法持平。结论本文提出的多索引加法量化编码算法,有效改善了图像视觉特征的近似表示精度和存储空间需求,并提升了在大规模数据集的检索准确率和召回率。本文算法主要针对特征进行近邻检索,适用于海量图像以及其他多媒体数据的近邻检索。  
      关键词:倒排索引;压缩编码;加法量化;近似最近邻检索;矢量量化   
      19
      |
      47
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677493 false
      更新时间:2024-05-07
    • 多特征分层融合的相关滤波鲁棒跟踪

      鲁国智, 彭冬亮, 谷雨
      2018, 23(5): 662-673. DOI: 10.11834/jig.170472
      多特征分层融合的相关滤波鲁棒跟踪
      摘要:目的为提高目标跟踪的鲁棒性,针对相关滤波跟踪中的多特征融合问题,提出了一种多特征分层融合的相关滤波鲁棒跟踪算法。方法采用多通道相关滤波跟踪算法进行目标跟踪时,从目标和周围背景区域分别提取HOG(histogram of oriented gradient)、CN(color names)和颜色直方图3种特征。提出的分层融合算法首先采用自适应加权融合策略进行HOG和CN特征的特征响应图融合,通过计算特征响应图的平滑约束性和峰值旁瓣比两个指标得到融合权重。将该层融合结果与基于颜色直方图特征获得的特征响应图进行第2层融合时,采用固定系数融合策略进行特征响应图的融合。最后基于融合后的响应图估计目标的位置,并采用尺度估计算法估计得到目标更准确的包围盒。结果采用OTB-2013(object tracking benchmark 2013)和VOT-2014(visual object tracking 2014)公开测试集验证所提跟踪算法的性能,在对多特征分层融合参数进行分析的基础上,与5种主流基于相关滤波的目标跟踪算法进行了对比分析。实验结果表明,本文算法的目标跟踪精度有所提高,其跟踪精度典型值比Staple算法提高了5.9%(0.840 vs 0.781),同时由于有效地融合了3种特征,在多种场景下目标跟踪的鲁棒性优于其他算法。结论提出的多特征分层融合跟踪算法在保证跟踪准确率的前提下,跟踪鲁棒性优于其他算法。当相关滤波跟踪算法采用了多个不同类型特征时,本文提出的分层融合策略具有一定的借鉴性。  
      关键词:目标跟踪;相关滤波;多特征融合;分层融合;特征响应图   
      23
      |
      34
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677492 false
      更新时间:2024-05-07

      图像分析和识别

    • 矩阵低秩表示的目标跟踪算法

      亚森江·木沙, 木合塔尔·克力木
      2018, 23(5): 674-687. DOI: 10.11834/jig.170083
      矩阵低秩表示的目标跟踪算法
      摘要:目的目标跟踪中,遮挡、强烈光照及运动模糊等干扰对跟踪精度的影响较大,其为目标外观的观测建模精度带来一定的困难。此外,很多现有算法在观测建模中都以向量形式表示样本数据,使得样本数据原有结构及其各像素的潜在关系被有意改变,从而导致观测模型数据维度及计算复杂度的提高。方法本文通过深入研究跟踪框架的观测建模问题,提出一种新颖的基于矩阵低秩表示的观测建模方法及其相应的似然度测度函数,使得跟踪算法能够充分挖掘样本数据的潜在特征结构,从而更加精确探测目标在遮挡或强烈光照等各种复杂干扰下的外观变化。同时,以矩阵形式表述样本信号的数据格式,使得其视觉特征的空间分布保留完好,并有效降低数据维度和计算复杂度。结果本文跟踪算法在富有挑战性干扰因素的跟踪环境中体现出更为鲁棒的跟踪性能,能够较好地解决跟踪中遮挡或强烈光照所引起的模型退化和漂移等问题。在10个经典测试视频中,本文跟踪算法的平均中心点误差为5.29像素,平均跟踪重叠率为78%,平均跟踪成功率为98.28%,均优于其他同类算法。结论本文以2维矩阵数据原型为载体,提出了一种新的多任务观测建模框架和最大似然度估计模型。实验数据的定性与定量分析结果表明,本文算法与一些优秀的同类算法相比,其跟踪建模精度达到相同甚至更高的水平。  
      关键词:数据原型;矩阵低秩表示;多任务;观测建模;似然度估计;目标跟踪   
      11
      |
      5
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677619 false
      更新时间:2024-05-07
    • 融合表情和BVP生理信号的双模态视频情感识别

      任福继, 于曼丽, 胡敏, 李艳秋
      2018, 23(5): 688-697. DOI: 10.11834/jig.170401
      融合表情和BVP生理信号的双模态视频情感识别
      摘要:目的针对当前视频情感判别方法大多仅依赖面部表情、而忽略了面部视频中潜藏的生理信号所包含的情感信息,本文提出一种基于面部表情和血容量脉冲(BVP)生理信号的双模态视频情感识别方法。方法首先对视频进行预处理获取面部视频;然后对面部视频分别提取LBP-TOP和HOG-TOP两种时空表情特征,并利用视频颜色放大技术获取BVP生理信号,进而提取生理信号情感特征;接着将两种特征分别送入BP分类器训练分类模型;最后利用模糊积分进行决策层融合,得出情感识别结果。结果在实验室自建面部视频情感库上进行实验,表情单模态和生理信号单模态的平均识别率分别为80%和63.75%,而融合后的情感识别结果为83.33%,高于融合前单一模态的情感识别精度,说明了本文融合双模态进行情感识别的有效性。结论本文提出的双模态时空特征融合的情感识别方法更能充分地利用视频中的情感信息,有效增强了视频情感的分类性能,与类似的视频情感识别算法对比实验验证了本文方法的优越性。另外,基于模糊积分的决策层融合算法有效地降低了不可靠决策信息对融合的干扰,最终获得更优的识别精度。  
      关键词:表情;生理信号;视频颜色放大;模糊积分;双模态   
      12
      |
      37
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677636 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 字典重建和空间分布关系约束下的特征选择与图像拼接

      于邓, 刘玉杰, 隋国华, 陈晓明, 李宗民, 范建平
      2018, 23(5): 698-707. DOI: 10.11834/jig.170461
      字典重建和空间分布关系约束下的特征选择与图像拼接
      摘要:目的针对大型图像检索领域中,复杂图像中SIFT特征描述子的冗余和高维问题,提出了一种基于字典重建和空间分布关系约束的特征选择的方法,来消除冗余特征并保留最具表现力的、保留原始空间结构性的SIFT特征描述子。方法首先,实验发现了特征选择和字典学习方法在稀疏表示方面的内在联系,将特征选择问题转化为字典重构任务;其次,在SIFT特征选择问题中,为了保证特征空间中特征的鲁棒性,设计了新型的字典学习模型,并采用模拟退火算法进行迭代求解;最后,在字典学习的过程中,加入熵理论来约束特征的空间分布,使学习到的特征描述子能最大限度保持原始SIFT特征空间的空间拓扑关系。结果在公开数据集Holiday大型场景图片检索数据库上,通过与国际公认的特征选择方法进行实验对比,本文提出的特征选择方法在节省内存空间和提高时间效率(30%~50%)的同时,还能保证所筛选的特征描述子的检索准确率比同类特征提高8%~14.1%;在国际通用的大型场景图片拼接数据库IPM上,验证本文方法在图像拼接应用中特征提取和特征匹配上的有效性,实验表明本文方法能节省(50%~70%)图像拼接时间。结论与已有的方法比较,本文的特征选择方法既不依赖训练数据集,也不丢失重要的空间结构和纹理信息,在大型图像检索、图像拼接领域和3D检索领域中,能够精简特征,提高特征匹配效率和准确率。  
      关键词:特征选择;字典重建;熵空间分布约束;大规模图像检索;图像拼接   
      12
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677645 false
      更新时间:2024-05-07

      遥感图像处理

    • 融合波段特征的多光谱遥感影像感知哈希认证算法

      丁凯孟, 杨晓梅, 苏守宝, 刘岳明
      2018, 23(5): 708-718. DOI: 10.11834/jig.170467
      融合波段特征的多光谱遥感影像感知哈希认证算法
      摘要:目的多光谱遥感影像的完整性、真实性等安全问题逐步受到人们的关注,但是,传统认证技术更多地关注数据载体的认证,其不能满足多光谱遥感影像的认证需求。针对多光谱遥感影像的数据特点,提出一种融合波段感知特征的多光谱遥感影像感知哈希认证算法。方法首先,采用隐形格网划分将多光谱影像的各个波段划分成不同的区域;然后,采用离散小波变换对各波段相同地理位置的格网单元进行分解,并分别采用不同的融合规则对小波变换后的不同分量进行融合;最后,通过Canny算子与奇异值分解提取融合结果的感知特征,再对提取的感知特征进行归一化,最终生成影像的感知哈希序列。多光谱影像的认证过程通过精确匹配感知哈希序列来实现。结果本文算法采用Landsat TM影像和高分二号卫星的融合影像数据为实验对象,从摘要性、可区分行、鲁棒性、算法运行效率以及安全性等方面进行测试与分析。结果表明,该算法只需要32字节的认证信息就能够实现多光谱遥感影像的认证,摘要性有了较大提高,且算法运行效率提高约1倍;同时,该算法可以有效检测影像的恶意篡改,并对无损压缩和LSB水印嵌入保持近乎100%的鲁棒性。结论本文算法克服了现有技术在摘要性、算法运行效率等方面不足,而且有较好的可区分性、鲁棒性,能够用于多光谱遥感影像的完整性认证,尤其适合对摘要性要求较高的环境。  
      关键词:多光谱遥感影像;感知哈希;波段融合;完整性认证;边缘特征;离散小波变换   
      21
      |
      4
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677661 false
      更新时间:2024-05-07
    • 基于GF-1 WFV影像和机器学习算法的玉米叶面积指数估算

      贾洁琼, 刘万青, 孟庆岩, 孙云晓, 孙震辉
      2018, 23(5): 719-729. DOI: 10.11834/jig.170434
      基于GF-1 WFV影像和机器学习算法的玉米叶面积指数估算
      摘要:目的叶面积指数(LAI)是重要的植被生物理化参数,对农作物长势和产量预测具有重要研究意义。基于物理模型和经验模型的LAI估算方法被认为是当前最常用的方法,但两种方法的估算效率和精度有限。近年来,机器学习算法在遥感监测领域广泛应用,算法具有描述非线性数据拟合、融合更多辅助信息的能力,为了评价机器学习算法在玉米LAI遥感估算中的适用性,本文分析比较了随机森林和BP神经网络算法估算玉米LAI的能力,并与传统经验模型进行了比较。方法以河北省怀来县东花园镇为研究区,基于野外实测玉米LAI数据,结合同时期国产高分卫星(GF1-WFV影像),首先分析了8种植被指数与LAI的相关性,进而采用保留交叉验证的方式将所有样本数据分为两部分,65%的数据作为模型训练集,35%作为验证集,重复随机分为3组,构建以8种植被指数为自变量,对应LAI值为因变量的RF模型、BP神经网络模型及传统经验模型。采用决定系数$ R^2$和均方根误差(RMSE)作为模型评价指标。结果8种植被指数与LAI的相关性分析表明所有样本数据中,实测LAI值与各植被指数均在($ P$<0.01)水平下极显著相关,且相关系数均高于0.5;将3组不同样本数据在随机森林、BP神经网络算法中多次训练,并基于验证数据集进行估算精度检验,经验模型采用训练数据集建模,验证数据集检验,结果表明,RF模型表现出了较强的预测能力,LAI预测值与实测值$ R^2$分别为0.681、0.757、0.701,均高于BP模型(0.504、0.589、0.605)和经验模型(0.492、0.557、0.531),对应RMSE分别为0.264、0.292、0.259;均低于BP模型(0.284、0.410、0.283)和经验模型(0.541、0.398、0.306)。结论研究表明,RF算法能更好地进行玉米LAI遥感估算,为快速准确进行农作物LAI遥感监测提供了技术参考。  
      关键词:随机森林;BP神经网络;叶面积指数;机器学习;植被指数;农业遥感监测   
      11
      |
      5
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677662 false
      更新时间:2024-05-07

      GDC 2017会议专栏

    • 自适应的线条画绘制

      王少荣, 敖知琪, 要曙丽, 陈毅松, 汪国平
      2018, 23(5): 730-739. DOI: 10.11834/jig.170376
      自适应的线条画绘制
      摘要:目的基于参考图像的线条画生成是非真实感绘制最为常见的应用之一。尽可能模拟艺术家的创作风格生成疏密得当、具有层次感的线条画是这类工作的主要目标和挑战。本文提出一个自适应线画图绘制算法。方法首先,将场景图像分割成若干个区域,分别计算每个区域亮度的方差以及每个像素到边界的最小距离,将每个区域的方差和面积的比值作为该区域的复杂度。然后,计算能反映其显著视觉特征的边缘切向流场。最后,使用基于流的各向异性高斯差分滤波生成线条画。在构造边缘切向流时,每个位置的切向量由其邻域的切向量加权而得到。文中增加了一个新的系数项,对于邻域的任意一个位置,如果它和参考位置在区域分类中属同一个类别。则该位置的权值更大。基于流的高斯差分自适应滤波过程中,高斯差分滤波的尺度参数和复杂度以及到区域边界距离有关。细节越丰富,离边界越近,尺度参数取值越小,这样得到的边缘比较细,同时可以防止将相邻小细线条连接成粗线条。然后,将高斯差分滤波结果沿着流线方向进行高斯滤波,对于细节丰富的区域,边缘比较多,尺度参数取值比较小,所连接边缘比较短,可以减少错误边缘可能。结果对生物、树林、建筑、山河等具有代表性的图像,采用本文算法进行自动实时进行线条绘制,实验结果表明,采用本文算法所生成的线条随着区域场景的复杂程度呈现不同粗细和浓淡的变化,具有一定的层次感。因而本文算法能生成视觉特征鲜明、风格化效果突出的线条画,且能处理各种复杂场景的图像。结论本文自适应参数的线条画生成算法,其算法参数调节以及算法效果优于固定参数的算法,本文算法在处理日常生活中各类主题场景的图像时均能取得良好效果。  
      关键词:非真实感绘制;线条画绘制;边缘切线场;图像分割   
      12
      |
      5
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677797 false
      更新时间:2024-05-07
    • 青铜器纹饰特征增强及自动提取

      王雨, 陈海妹, 李维诗
      2018, 23(5): 740-747. DOI: 10.11834/jig.170375
      青铜器纹饰特征增强及自动提取
      摘要:目的青铜器是我国的文化瑰宝,然而出土青铜器大多破损、变形,需要修复以进行保护。随着3维激光扫描技术及数字几何处理研究的发展,文物数字化修复技术得到了广泛的重视。在青铜器修复过程中需要将相邻碎片的纹饰对准,以保证纹饰的连续性,从而保证修复质量。因此,青铜器纹饰特征的有效提取是青铜器修复过程中的一项重要工作,鉴于青铜器纹饰特征一般具有比较明显的尖锐边,本文提出并实现了一种青铜器尖锐特征增强及自动提取算法。方法首先,为了减少网格均匀度对特征提取的不利影响,提出一种加权法向距离;其次,为了增强尖锐特征提取效果,提出一种逆双边滤波算法,并利用该算法获得反锐化掩膜,增强法向距离间的差异性,使得大的更大,小的更小;最后,采用Otsu算法自动确定分割阈值,依据该阈值把网格顶点分为特征点集和非特征点集,实现青铜器纹饰特征的提取。结果对实际3维激光扫描获得的青铜器模型,分别采用本文算法和Tran等人提出的尖锐特征自动提取算法进行了纹饰特征提取,包括采用两种算法进行了纹饰特征增强前后纹饰特征提取实验,本文使用的3个模型点数在6 000至80万之间,这些模型都可以在1 s到10 s之间得到最终的提取结果,具有较高的效率。同时,本文算法可以更为准确地提取尖锐特征点,且得到的特征点更为连续,有利于进一步的处理。结论采用本文提出的青铜器纹饰提取算法,能够自动、高效地提取青铜器纹饰特征。  
      关键词:青铜器修复;纹饰提取;特征增强;自动分割   
      57
      |
      76
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677827 false
      更新时间:2024-05-07
    • 针对用户兴趣的视频精彩片段提取

      王晗, 俞璜悦, 滑蕊, 邹玲
      2018, 23(5): 748-755. DOI: 10.11834/jig.170365
      针对用户兴趣的视频精彩片段提取
      摘要:目的视频精彩片段提取是视频内容标注、基于内容的视频检索等领域的热点研究问题。视频精彩片段提取主要根据视频底层特征进行精彩片段的提取,忽略了用户兴趣对于提取结果的影响,导致提取结果可能与用户期望不相符。另一方面,基于用户兴趣的语义建模需要大量的标注视频训练样本才能获得较为鲁棒的语义分类器,而对于大量训练样本的标注费时费力。考虑到互联网中包含内容丰富且易于获取的图像,将互联网图像中的知识迁移到视频片段的语义模型中可以减少大量的视频数据标注工作。因此,提出利用互联网图像的用户兴趣的视频精彩片段提取框架。方法利用大量互联网图像对用户兴趣语义进行建模,考虑到从互联网中获取的知识变化多样且有噪声,如果不加选择盲目地使用会影响视频片段提取效果,因此,将图像根据语义近似性进行分组,将语义相似但使用不同关键词检索得到的图像称为近义图像组。在此基础上,提出使用近义语义联合组权重模型权衡,根据图像组与视频的语义相关性为不同图像组分配不同的权重。首先,根据用户兴趣从互联网图像搜索引擎中检索与该兴趣语义相关的图像集,作为用户兴趣精彩片段提取的知识来源;然后,通过对近义语义图像组的联合组权重学习,将图像中习得的知识迁移到视频中;最后,使用图像集中习得的语义模型对待提取片段进行精彩片段提取。结果本文使用CCV数据库中的视频对本文提出的方法进行验证,同时与多种已有的视频关键帧提取算法进行比较,实验结果显示本文算法的平均准确率达到46.54,较其他算法相比提高了21.6%,同时算法耗时并无增加。此外,为探究优化过程中不同平衡参数对最终结果的影响,进一步验证本文方法的有效性,本文在实验过程中通过移除算法中的正则项来验证每一项对于算法框架的影响。实验结果显示,在移除任何一项后算法的准确率明显降低,这表明本文方法所提出的联合组权重模型对提取用户感兴趣视频片段的有效性。结论本文提出了一种针对用户兴趣语义的视频精彩片段提取方法,根据用户关注点的不同,为不同用户提取其感兴趣的视频片段。  
      关键词:视频检索;视频精彩片段提取;视频分析;知识迁移   
      12
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677830 false
      更新时间:2024-05-07
    • 基于弹簧变形模型的图像缩放方法

      谷香丽, 迟静, 张彩明
      2018, 23(5): 756-765. DOI: 10.11834/jig.170374
      基于弹簧变形模型的图像缩放方法
      摘要:目的随着显示设备分辨率和纵横比的多样化,内容感知图像缩放技术逐渐成为图像处理领域新的研究热点之一,为了既能实现图像有效缩放,又能较好保持图像主体区域的几何结构完整,提出一种基于弹簧近似的内容感知图像缩放方法。方法首先,为控制图像缩放,对输入图像进行显著性检测和特征直线检测;其次,在图像上构建一个平面三角网格,视三角网格的每一条边为一根弹簧,则整个三角网格构成一个弹簧系统,可利用该弹簧系统的变形实现图像缩放,其中,根据每根弹簧所在图像区域的显著度设置弹簧的弹性系数,该系数可在缩放时有效保持图像的主体区域,避免主体内容缩放不均匀或变形;然后,以图像直线特征保持为约束,构造用于约束弹簧系统变形的目标函数;最后,利用纹理贴图技术把弹簧系统每个三角形对应的图像贴回弹簧系统,得到缩放后的目标图像。结果为证明本文方法的有效性,对大量图像进行多比例缩放测试,并与现有方法进行比较。在同比例缩放下,本文方法可以更好地保持图像中的主体区域,以及特征直线,使放缩后的图像整体具有更好的视觉效果。本文方法的计算时间小于0.19 s,时间成本与现有方法大致相同。结论基于弹簧系统的内容感知图像缩放方法,通过弹簧系统变形带动网格变形进而实现图像缩放,与现有的内容感知图像缩放方法相比,本文方法所处理的图像视觉效果更好,实验结果表明,本文方法能够更有效、快速地处理各种图像的内容感知缩放。  
      关键词:内容感知;图像缩放;弹簧系统;特征保持;重要区域   
      21
      |
      60
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677831 false
      更新时间:2024-05-07
    • 梯度优化的有理函数图像插值

      杜宏伟, 张云峰, 包芳勋, 王平, 张彩明
      2018, 23(5): 766-777. DOI: 10.11834/jig.170369
      梯度优化的有理函数图像插值
      摘要:目的对图像纹理区域的细节保持一直以来是图像插值技术的一个难题,为此提出了一种梯度优化的有理函数图像插值算法。方法首先,构造了一种新的含有可调参数的双变量有理插值函数,随着参数的不同取值,该函数具有不同的表达形式,它是多项式模型和有理模型的有机统一体;其次,根据图像的区域特征,利用等值线方法将图像自适应地划分为纹理区域和平滑区域,纹理区域采用有理模型插值,平滑区域采用多项式模型插值;最后,根据各向同性Sobel算子计算插值单元的图像梯度,确定纹理方向,不同纹理方向的插值单元用相应的权重对中心点进行优化。结果从客观数据、主观效果、时间复杂度3个方面对重建图像进行评价,客观数据包括峰值信噪比(PSNR)和结构相似性(SSIM),从实验结果可以看出,本文算法的PSNR平均提高了0.14~1.50 dB,SSIM平均提高了0.005~0.097。从主观效果来看,本文算法的重建图像的纹理细节更加丰富,边缘结构更加清晰,从时间复杂度来看,本文算法的平均运行时间是3.77 s,分别比DFDF(directional filtering and data fusion)、NEDI(new edge-directed interpolation)、RSAI(robust soft-decision adaptive interpolation)、Lee's、NARM(nonlocal autoregressive model)算法快了3.28倍、5.26倍、53.28倍、43.53倍、418.54倍。特别地,对于Baboon、Barbara、Metal这类纹理细节丰富的图像,本文算法在峰值信噪比和结构相似性上较对比算法有突出优势,主观效果有明显提高。结论基于构造的双变量有理插值模型,本文提出了一个梯度优化的有理函数图像插值算法,实验结果表明,该算法在图像纹理细节和边缘结构保持方面具有良好的视觉效果,有效提高了插值图像质量,且时间复杂度较低。  
      关键词:图像插值;有理函数;梯度优化;区域划分;等值线方法   
      12
      |
      4
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55677833 false
      更新时间:2024-05-07
    0