最新刊期

    2017 22 5

      综述

    • 中国图像工程:2016

      章毓晋
      2017, 22(5): 563-574. DOI: 10.11834/jig.170115
      摘要:本文是关于中国图像工程的年度文献系列综述之二十二。为了使国内广大从事图像工程研究和图像技术应用的科技人员能够较全面地了解国内图像工程研究和发展的现状,能够有针对性地查询有关文献,且向期刊编者和作者提供有用的参考,对2016年度图像工程重要文献进行了统计和分析。 从国内15种有关图像工程重要中文期刊在2016年发行的共148期上所发表的2 938篇学术研究和技术应用文献中,选取出728篇属于图像工程领域的文献,并根据各文献的主要内容将其分别归入图像处理、图像分析、图像理解、技术应用和综述评论5个大类,然后进一步分入23个专业小类(与前11年相同),并在此基础上分别进行各期刊各类文献的统计和分析。 根据对2016年统计数据的分析可看出:图像分析目前得到了最多的关注,目标跟踪的文献数量继续维持在高水平,对图像分割和边缘检测的研究仍然是一个重点,图像匹配融合及其在遥感测绘等领域的应用继续成为热点,医学图像应用等也有明显增加。 中国图像工程在2016年的研究深度和广度还在提高和扩大,仍保持了快速发展的势头。  
      关键词:图像工程;图像处理;图像分析;图像理解;技术应用;文献综述;文献统计;文献分类;文献计量学   
      2599
      |
      336
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111017 false
      更新时间:2024-05-07

      图像分析与识别

    • 结合基因表达式编程与空间模糊聚类的图像分割

      李婷婷, 江朝晖, 饶元, 张晓明
      2017, 22(5): 575-583. DOI: 10.11834/jig.160504
      摘要:针对模糊C-均值聚类图像分割方法存在的对初始值敏感及抗噪性能差的问题,提出一种结合基因表达式编程与空间模糊聚类的图像分割方法。 首先,利用基因表达式编程算法对图像进行初次分割,即将聚类中心编码成染色体,通过适应度评价引导搜索获得优化的聚类中心;然后在隶属度计算中引入空间函数,以初次分割结果作为初始值,使用空间模糊聚类对图像进行二次分割。 对加噪的合成图像和Berkeley图像的分割实验显示,本文方法在聚类划分系数()、聚类划分熵()和峰值信噪比(PSNR)等评价指标上总体性能优于经典的模糊C-均值聚类和空间模糊C-均值聚类分割算法,其中值平均高出0.062 4和0.061 1,值平均降低0.117 0和0.101 1,而值平均提升了约13.312 1 dB和3.308 4 dB;在对Berkeley图像库中的6幅图片的分割实验显示,本文方法对图像分割的值均在0.93以上,相比两种对比方法平均提高0.157 6和0.013 3,值保持在0.1附近,均低于对比方法,值平均提高2.896 3 dB和1.934 4 dB;在多目标分割实验上,随着聚类数目增加,3种方法的分割性能均有下降,但本文方法性能曲线最为平缓,受聚类数目的影响最小。虽然本文方法所需的运行时间略有增加,但求解所需的迭代次数却极大地减少。 本文提出的图像分割方法具有很强的抗噪性、更高的分割精度和稳定性,适用于需要更精确结果、对时间要求不高的分割场景。  
      关键词:图像分割;模糊C均值;基因表达式编程;聚类;空间函数   
      2911
      |
      375
      |
      6
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110976 false
      更新时间:2024-05-07
    • 融合背景先验与中心先验的显著性目标检测

      周帅骏, 任福继, 堵俊, 杨赛
      2017, 22(5): 584-595. DOI: 10.11834/jig.160387
      摘要:现有的显著性目标检测算法通常基于单一的先验信息,导致提取的原图像信息不全面,为了解决该问题,提出一种新的基于背景先验与中心先验相融合的显著目标检测算法。 该方法首先以边缘超像素为吸收节点,利用马尔可夫吸收链计算其他超像素的平均吸收时间作为背景先验值,得到背景先验图;然后使用改进Harris角点检测估计目标区域位置,建立峰值位于目标中心的2维高斯函数,计算各超像素的中心先验值,获取中心先验图;最后将背景先验图与中心先验图相融合得到显著图。同时该方法融合多尺度检测结果,进一步提高显著值的准确性。 通过ASD、SED1、SED2和SOD 4个公开数据库对比验证了基于背景先验与中心先验相融合算法具有较高的查准率、查全率和F-measure,相较于基于马尔可夫吸收链算法均提高了3%以上,总体效果明显优于目前的10种主流算法。 相较于基于单一先验信息的算法,基于背景先验与中心先验相融合的算法充分利用了图像信息,在突出全局对比的同时也保留了较多的局部信息,能高亮地凸显图像中的显著性目标。该方法在检测单一目标的图片时效果显著,但对于多目标的显著性检测尚有不足。  
      关键词:显著性检测;中心先验;背景先验;多尺度检测   
      4234
      |
      390
      |
      9
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110624 false
      更新时间:2024-05-07

      计算机图形学

    • 矢量道路拓扑追踪匹配算法

      李翔, 马爽, 杨辉, 张晓楠
      2017, 22(5): 596-609. DOI: 10.11834/jig.160386
      摘要:基于道路形状特征的匹配算法在匹配性能上比较稳定,但当遇到道路交叉口等复杂路况时容易出现误匹配,且实时性上有一定缺陷,而矢量道路良好的拓扑结构,为此提出一种利用矢量道路拓扑关系进行追踪匹配的算法。 算法利用结点、路段和路口这3种对象来对矢量道路进行表达,建立各个对象之间的拓扑关系,并将匹配过程划分为4个不同的状态,根据各个状态实施相应的匹配方法。首先,进行初始化、追踪、路口和搜索4个状态的定义和划分,确定各个状态之间的转换关系;进一步,设计道路中的结点、路段和路口3种对象的数据结构,建立点、线之间的空间拓扑关系;其次,根据4个状态的具体任务和实际特点,对进入该状态的行驶轨迹进行相应地分析处理和匹配计算;最后,根据追踪的结果进行匹配分析,完成对车辆行驶轨迹的误差修正。 采用GPS-RTK采集的北京市西五环及密云地区的矢量道路数据对实地跑车的惯性导航轨迹进行拓扑追踪匹配仿真实验,完成拓扑追踪匹配算法的路口距离阈值选取,并与传统基于道路形状特征的匹配算法在匹配效果和实时性进行性能对比测试,其性能指标为匹配准确率和匹配时间。当矢量道路拓扑追踪算法的路口距离阈值取20 m时,匹配准确率达到了最高值93.5%。在匹配性能对比上,拓扑追踪算法相较于其他两种算法也有一定优势,在相同道路段中匹配准确率达到了90.2%,匹配速度也提高了48倍。 采用矢量道路数据的拓扑信息对车辆轨迹进行追踪匹配的方法,能够用于卫星信号“盲区”或者信号干扰等特殊环境和场合的组合系统辅助导航,弥补传统基于卫星的组合导航在自主性、抗干扰性的不足。同时,算法针对复杂路况的匹配结果也较为理想,能够满足组合导航匹配工作的要求。  
      关键词:道路追踪;拓扑结构;道路匹配;路口;轨迹特征   
      3395
      |
      331
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111314 false
      更新时间:2024-05-07

      遥感图像处理

    • 广义统计区域合并的SAR图像浮筏养殖信息提取

      胡园园, 范剑超, 王钧
      2017, 22(5): 610-621. DOI: 10.11834/jig.160576
      摘要:海水浮筏养殖是海域使用动态监测中的重要类型,合成孔径雷达(SAR)卫星遥感影像可以克服海洋气象环境的影响,有效反映浮筏养殖区域。由于浮筏养殖信息受乘性相干斑噪声污染严重,为了降低噪声敏感性,改进得到广义局部二值模式(GLBP),进而将其用于改进广义统计区域合并算法(GSRM),构建以GLBP_GSRM为核心的多特征集成模型,得到更具纹理一致性的超像素,实现浮筏养殖信息精确提取。 根据SAR数据的乘性噪声特性改进局部二值模式算子得到GLBP算子,将其加入GSRM的合并准则中,结合纹理信息的超像素分割能得到更具纹理一致性的超像素,有效抑制相干斑噪声。进而利用非下采样轮廓波变换得到轮廓信息丰富数据特征,使用FCS(fuzzy compactness and separation)算法聚类实现浮筏养殖信息的无监督提取。 实验选取辽宁省长海县邻近海域作为研究区域,针对C波段的Radarsat-2 SAR和X波段的TerraSAR图像,分别比较同一图像不同区域和不同图像同一区域的提取结果,结合实地现场调查结果表明所提模型对不同类型SAR图像均能精确无监督地提取浮筏养殖信息,分类精度均高于85%,明显优于经典无监督算法,验证模型的有效性。 所提模型充分集成纹理特征、空间特征和轮廓特征,有效解决相干斑噪声干扰信息提取的问题,针对不同类型SAR遥感图像,均能在复杂的海洋背景中实现有效地无监督浮筏养殖信息提取,提高海水养殖自动监测准确度。  
      关键词:浮筏养殖;合成孔径雷达(SAR);无监督;局部二值模式;统计区域合并   
      3809
      |
      422
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111266 false
      更新时间:2024-05-07

      第十一届全国数字娱乐与艺术学术会议栏目

    • 粉笔画艺术风格模拟

      钱文华, 徐丹, 官铮, 普园媛, 喻扬涛, 杨萌
      2017, 22(5): 622-630. DOI: 10.11834/jig.160540
      摘要:对不同艺术风格的模拟和绘制是非真实感绘制技术的主要任务之一,目前非真实感绘制技术已对油画、水彩画、中国书法等国内外艺术风格进行了模拟,然而对粉笔化艺术风格的模拟方法并不多见。本文提出了一种基于滤波扩散和线积分卷积(LIC)的粉笔画艺术风格绘制技术。 首先输入2维目标图像,通过对目标图像二值化处理、边缘提取操作,获得连续、光滑的边缘信息,并采用滤波扩散技术对边缘图像进行扩散处理,模拟粉笔画中笔划的毛糙效果,同时通过采用图像增强方法增强了笔划的细节信息;其次,由于真实粉笔画在创作时,粉笔颜料黏附在图像局部区域,形成具有方向的笔刷纹理效果,算法通过在目标图像中添加白噪声,基于线积分卷积LIC产生具有方向的粉笔画笔刷纹理,并通过形态学膨胀处理获得粉笔画的笔划纹理,模拟出粉笔画中笔划的笔触特征。再次,真实的粉笔画艺术效果往往在黑板、木材等材质中创作,算法将产生的笔刷纹理图像、色彩信息以及边缘图像通过图层映射方法,映射到黑板材质等输入背景图像中,产生最终的粉笔画艺术效果图像。 通过对输入2维图像进行实验,模拟出具有粉笔画艺术效果的结果图像,突出了粉笔画的线条细节信息和笔划艺术特征。 提出了一种粉笔画艺术效果模拟算法,非真实感绘制领域的有效补充,算法简单有效,能模拟出真实的粉笔画艺术效果,增强了艺术表现力。  
      关键词:非真实感绘制;粉笔画风格;边缘提取;图像融合   
      4798
      |
      391
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111600 false
      更新时间:2024-05-07
    • 交互式遗传的3维场景扩展

      张岩, 费广正
      2017, 22(5): 631-642. DOI: 10.11834/jig.160547
      摘要:实现良好的用户体验是3维游戏场景设计的重要目的之一。目前3维场景设计通常多由美术设计师进行创作而非建筑设计及景观规划领域人员,场景空间组织方式没有充分考虑到用户体验,同时由于大型3维场景的制作周期过长,设计效率普遍较低。上述现象直接导致游戏用户在3维游戏场景中交互的体验感较差,但是该问题一直以来没有较好的方法予以解决,也没有引起相关领域研究者的重视。本文提出一种基于交互式遗传的多手段协同操作方法,其目的为实现更加高效、合理的批量生成大型场景单元,并改善空间组织方式,以获得良好的游戏用户体验感。 本文方法主要通过特征聚类、蚁群算法空间布局优化及交互式遗传算法评价的方式来解决交互性差的问题。通过自学习方式进行场景建筑布局及立面层次进行特征聚类,并通过基于包围盒的蚁群优化算法进行场景组织的布局优化,最后结合交互式遗传算法引入用户评价来获得特征适应值评估从而得到新扩展的场景,该方法实现了重构场景的良好用户体验性及空间组织方式的合理性。 对小型场景进行扩展和对单体建筑的布局进行重构,该方法所得到的新的场景具有良好的空间组织结构,基于用户评价通过交互式遗传算法以用户喜好的评价驱动进化,扩展后的场景反映了真实用户的主观感受并取得较为令人满意的效果,提高了用户体验的友好性。 提出一种基于交互式遗传算法的场景重构方法,通过选择特定场景样本进行算法的实现,结果表明该方法具有可行性,并实现了较好的效果。本文方法对于游戏场景设计、文物古迹复原及系统仿真领域具有现实意义和研究价值。  
      关键词:虚拟现实;遗传算法;蚁群算法;自适应共振理论;特征提取   
      3682
      |
      301
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110897 false
      更新时间:2024-05-07

      第十八届全国图像图形学术会议栏目

    • 面向RGBD深度数据的快速点云配准方法

      苏本跃, 马金宇, 彭玉升, 盛敏, 马祖长
      2017, 22(5): 643-655. DOI: 10.11834/jig.160602
      摘要:真实物体的3维重建一直是计算机图形学、机器视觉等领域的研究热点。针对基于RGBD数据的非匀速非固定角度旋转物体的3维重建问题,提出一种利用旋转平台重建物体3维模型的配准方法。 首先通过Kinect采集位于旋转平台上目标物的深度数据和颜色数据,对齐融合并使用包围盒算法去除背景噪声和不需要的外部点云,获得带有颜色信息的点云数据。并使用基于标定物不同角度上的点云数据标定出旋转平台中心轴的位置,从而获得Kinect与旋转平台之间的相对关系;然后通过曲率特征对目标点云进行特征点提取并寻找与相邻点云的对应点;其中对于特征点的选取,首先针对点云中的任意一点利用kd-tree搜寻其个邻近点,对这些点进行曲面拟合,进而计算其高斯曲率,将高斯曲率绝对值较大的个点作为点云的特征点。的取值由点云的点个数、点密度和复杂度决定,具体表现为能反映物体的大致轮廓或表面特征信息即可。对于对应点的选取,考虑到欧氏距离并不能较好反映点云中的点对在旋转过程中的对应关系,在实际配准中,往往会因为点云重叠或距离过远等原因找到大量错误的对应点。由于目标物在扫描过程中仅绕旋转轴进行旋转,因此采用圆弧最小距离寻找对应点可有效减少错误点对。随后,使用二分迭代寻找绕中心轴的最优旋转角度以满足点云间的匹配误差最小;最后,将任意角度获取的点云数据配准到统一的坐标系下并重建模型。 使用斯坦福大学点云数据库和自采集数据库分别对该方法和已有方法在算法效率和配准结果上进行对比实验,实验结果显示在拥有平均75 000个采样点的斯坦福大学点云数据库上与传统ICP算法和改进ICP算法相比,迭代次数分别平均减少86.5%、57.5%,算法运行时间分别平均减少87%、60.75%,欧氏距离误差平方和分别平均减少70%、22%;在具有平均57000个采样点的自采集点云数据库上与传统ICP算法和改进ICP算法相比,迭代次数分别平均减少94%、75%,算法运行时间分别平均减少92%、69%,欧氏距离误差平方和分别平均减少61.5%、30.6%;实验结果显示使用该方法进行点云配准效率较高且配准误差更小;和KinectFusion算法相比在纹理细节保留上也表现出较好的效果。 本文提出的基于旋转平台标定的点云配准算法,利用二分迭代算法能够有效降低算法复杂度。与典型ICP和改进的ICP算法的对比实验也表明了本文算法的有效性。另外,与其他方法在具有纹理的点云配准对比实验中也验证了本文配准方法的优越性。该方法仅采用单个Kinect即可实现对非匀速非固定角度旋转物体的3维建模,方便实用,适用于简单快速的3维重建应用场合。  
      关键词:RGBD数据;3维扫描;点云配准;Kinect;深度数据   
      6421
      |
      454
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110692 false
      更新时间:2024-05-07
    • 分布式视频编码中关键帧丢失错误保护

      荣松, 杨红, 卿粼波, 王正勇
      2017, 22(5): 656-662. DOI: 10.11834/jig.160599
      摘要:分布式视频编码较其传统视频编码具有编码简单、误码鲁棒性高等特点,可以很好地满足如无人机航拍、无线监控等新型视频业务的需求。在分布式视频编码中,视频图像被交替分为关键帧和Wyner-Ziv帧,由于受到信道衰落和干扰等因素的影响,采用传统帧内编码方式的关键帧的误码鲁棒性远不如基于信道编码的Wyner-Ziv帧。关键帧能否正确传输和解码对于Wyner-Ziv帧能否正确解码起着决定性的作用,进而影响着整个系统的压缩效率和率失真性能。为此针对关键帧在异构网络中的鲁棒性传输问题,提出一种基于小波域的关键帧质量可分级保护传输方案。 在编码端对关键帧同时进行传统的帧内视频编码和基于小波域的Wyner-Ziv编码,解码端将经过错误隐藏后的误码关键帧作为基本层,Wyner-Ziv编码产生的校验信息码流作为增强层。为了提高系统的分层特性以便使系统的码率适应不同的网络条件,进一步将小波分解后图像的各个不同层的低频带和高频带组合成不同的增强层,根据不同信道环境,传输不同层的Wyner-Ziv校验数据。同时对误码情况下关键帧的虚拟噪声模型进行了改进,利用第1个增强层已解码重建的频带与其对应边信息来获得第2个和第3个增强层对应频带的更加符合实际的虚拟信道模型的估计。 针对不同的视频序列在关键帧误码率为1%20%时,相比较于传统的帧内错误隐藏算法,所提方案可以提高视频重建图像的主观质量和整体系统的率失真性能。例如在关键帧误码率为5%时,通过传输第1个增强层,不同的视频序列峰值信噪比(PSNR)提升可达25 dB左右;如果继续传输第2个增强层的校验信息,视频图像的PSNR也可以提升0.51.6 dB左右;如果3个增强层的校验信息都传输的话,基本上可以达到无误码情况下关键帧的PSNR。 本文所提方案可以很好地解决分布式视频编码系统中的关键帧在实际信道传输过程中可能出现的误码问题,同时采用的分层传输方案可以适应不同网络的信道情况。  
      关键词:分布式视频编码;关键帧;小波域;分级;误码信道   
      4102
      |
      704
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111381 false
      更新时间:2024-05-07
    • 适应物体形状的虚拟手抓取

      胡晨, 张学聃, 马惠敏
      2017, 22(5): 663-670. DOI: 10.11834/jig.160590
      摘要:虚拟手抓取是虚拟交互中的核心技术之一,直接影响沉浸感。已有的虚拟手抓取规则基于接触点法矢夹角和接触点与体心连线的夹角,但在部分形状上不能正确抓取。为此提出一种适应物体形状的抓取规则。 针对长方体、球、圆柱这些构成物体的基本几何体,利用形状特征和手指抓握的接触关系制定抓取规则:1)长方体的规则是至少有3个不共线的接触点,并且一对接触点法矢夹角超过90°;2)球的规则要对接触点和球心的空间关系进行计算;3)圆柱的规则根据接触点是否在曲面上,使用长方体规则,或是仿照球的规则判断。对于需要使用多个几何体描述外形的复杂物体,先按照这3种基本几何体分解、单独计算,然后筛选出其中不稳定状态的几何体,把整体的接触点位置、法矢信息集中在这些不稳定状态几何体上,用单一几何体的抓取规则计算整体的抓取。同时加入力矩平衡可能性的计算,抓取规则和力矩平衡二者都满足才判定抓取成功,进一步减少了错误判断的发生。 使用unity3d构建虚拟场景,并用neuron的数据手套采集人体、手指数据,进行虚拟交互的仿真。该方法可以正确处理类似水杯这样的多几何体组合物体的抓取判断。 本文提出了基于物体形状的抓取规则,和用简单基本形状分解复杂物体的计算方法,准确计算抓取,符合直观感受。  
      关键词:虚拟手;基本几何体;抓取规则;碰触检测;不稳定状态;力矩平衡   
      4274
      |
      389
      |
      6
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110809 false
      更新时间:2024-05-07
    • 基于Fast R-CNN的车辆目标检测

      曹诗雨, 刘跃虎, 李辛昭
      2017, 22(5): 671-677. DOI: 10.11834/jig.160600
      摘要:在传统车辆目标检测问题中,需要针对不同图像场景选择适合的特征。为此提出一种基于快速区域卷积神经网络(Fast R-CNN)的场景图像车辆目标发现方法,避免传统车辆目标检测问题中需要设计手工特征的问题。 该方法基于深度学习卷积神经网络思想。首先使用待检测车辆图像定义视觉任务。利用选择性搜索算法获得样本图像的候选区域,将候选区域坐标与视觉任务示例图像一起输入网络学习。示例图像经过深度卷积神经网络中的卷积层,池化层计算,最终得到深度卷积特征。在输入时没有规定示例图像的规格,此时得到的卷积特征规格不定。然后,基于Fast R-CNN网络结构,通过感兴趣区域池化层规格化特征,最后将特征输入不同的全连接分支,并行回归计算特征分类,以及检测框坐标值。经过多次迭代训练,最后得到与指定视觉任务强相关的目标检测模型,具有训练好的权重参数。在新的场景图像中,可以通过该目标检测模型检测给定类型的车辆目标。 首先确定视觉任务包含公交车,小汽车两类,背景场景是城市道路。利用与视觉任务强相关的测试样本集对目标检测模型进行测试,实验表明,当测试样本场景与视觉任务相关度越高,且样本中车辆目标的形变越小,得到的车辆目标检测模型对车辆目标检测具有良好的检测效果。 本文提出的车辆目标检测方法,利用卷积神经网络提取卷积特征代替传统手工特征提取过程,通过Fast R-CNN对由示例图像组成定义的视觉任务训练得到了效果良好的车辆目标检测模型。该模型可以对与视觉任务强相关新场景图像进行效果良好的车辆目标检测。本文结合深度学习卷积神经网络思想,利用卷积特征替代传统手工特征,避免了传统检测问题中特征选择问题。深层卷积特征具有更好的表达能力。基于Fast R-CNN网络,最终通过多次迭代训练得到车辆检测模型。该检测模型对本文规定的视觉任务有良好的检测效果。本文为解决车辆目标检测问题提供了更加泛化和简洁的解决思路。  
      关键词:快速区域卷积神经网络;深度学习;车辆;视觉任务;目标检测   
      8603
      |
      621
      |
      28
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110466 false
      更新时间:2024-05-07
    • 自然场景图像与合成图像的快速分类

      刘国帅, 仲伟峰, 殷飞, 刘成林
      2017, 22(5): 678-687. DOI: 10.11834/jig.160597
      摘要:随着现代通信和传感技术的快速发展,互联网上多媒体数据日益增长,既为人们生活提供了便利,又给信息有效利用提出了挑战。为充分挖掘网络图像中蕴含的丰富信息,同时考虑到网络中图像类型的多样性,以及不同类型的图像需要不同的处理方法,本文针对当今互联网中两种主要的图像类型:自然场景图像与合成图像,设计层次化的快速分类算法。 该算法包括两层,第1层利用两类图像在颜色,饱和度以及边缘对比度上表现出来的差异性提取全局特征,并结合支持向量机(SVM)进行初步分类,第1层分类结果中低置信度的图像会被送到第2层中。在第2层中,系统基于词袋模型(bag-of-words)对图像不同类型的局部区域的纹理信息进行编码得到局部特征并结合第2个SVM分类器完成最终分类。针对层次化分类框架,文中还提出两种策略对两个分类器进行融合,分别为分类器结果融合与全局+局部特征融合。为测试算法的实用性,同时收集并发布了一个包含超过30 000幅图像的数据库。 本文设计的全局与局部特征对两类图像具有较强的判别性。在单核Intel Xeon(R)(2.50 GHz)CPU上,分类精度可达到98.26%,分类速度超过40帧/s。另外通过与基于卷积神经网络的方法进行对比实验可发现,本文提出的算法在性能上与浅层网络相当,但消耗更少的计算资源。 本文基于自然场景图像与合成图像在颜色、饱和度、边缘对比度以及局部纹理上的差异,设计并提取快速有效的全局与局部特征,并结合层次化的分类框架,完成对两类图像的快速分类任务,该算法兼顾分类精度与分类速度,可应用于对实时性要求较高的图像检索与数据信息挖掘等实际项目中。  
      关键词:图像类型快速分类;特征提取;词袋模型;层次化分类算法   
      4735
      |
      349
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111422 false
      更新时间:2024-05-07
    • 分频能量调整在高分辨傅里叶显微技术中的应用

      旷雅唯, 段侪杰, 马辉
      2017, 22(5): 688-693. DOI: 10.11834/jig.160591
      摘要:高分辨傅里叶显微技术(FPM)是利用一组不同角度入射光下采集的低分辨率图像重建高分辨率图像的技术,该技术主要的理论基础是相位还原和综合孔径技术。低分辨图像和高分辨率图像在频域中的差异体现在高频段中的能量,高分辨率图像高频段能量更多。但是此前的方法重建的图像在高频段内的能量仍然较少。针对该问题,提出了一种新的FPM迭代更新模式——分频能量调整(BE)。 基于高分辨率图像在傅里叶空间的能量分布的先验,在迭代过程中加入分频能量调整,来约束更新过程中的能量分布,从而使重建图像在能量上更接近于高分辨率图像,进一步提高图像的分辨率,突出边缘信息。 在光学分辨率检验板和蚕豆气孔数据上对比增加光瞳函数恢复的FPM方法(EPRY-FPM)和添加分频能量调整的FPM方法(BE-FPM),实验表明,BE-FPM能进一步提高重建图像分辨率,突出边缘信息。为验证算法的鲁棒性,对样本添加模拟产生的高斯噪声和椒盐噪声,重建结果的视觉效果表明本文方法对噪声的鲁棒性更优。 本文方法能进一步提高重建图像的分辨率,并且突出边缘信息。在噪声图像中比EPRY-FPM的更新模式具有更高的鲁棒性。在生物样本中,很多的图像具有相似的分布,而相似分布的样本在傅里叶空间的能量分布具有一致性,因此,BE-FPM方法在部分高分辨率样本重建大样本,单幅高分辨率样本重建同类样本等问题上有较大的应用潜力。  
      关键词:高分辨傅里叶显微技术;高分辨率;图像重建;能量分布;傅里叶空间   
      3898
      |
      304
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111556 false
      更新时间:2024-05-07
    • 虚拟结肠镜中皱襞预匹配的结肠配准

      郭志飞, 段侪杰, 梁正荣
      2017, 22(5): 694-701. DOI: 10.11834/jig.160601
      摘要:虚拟结肠镜是一种采用CT或者MRI图像重建出结肠3维结构,通过漫游虚拟结肠来检测结肠组织,一般用于早期结直肠癌筛查。结肠配准能够有效提高息肉检测的效率和精确度,但由于仰卧和俯卧位下的结肠图像形变太大,现有的配准方案中特征点的提取没有考虑到较多特殊情况,因此需要寻找一个新的配准方案完成完整的结肠配准。 提出了一种新的结肠图像配准方法,能够完成不同体位获取的虚拟结肠图像之间的配准。首先提取可以反映结肠结构信息的皱襞特征,用模板匹配和特征匹配方法找出两幅结肠中匹配的皱襞对。然后将匹配对的中心点作为标记点,做基于标记点的非刚性粗配准,最后将两幅图做B样条配准完成细配准。这种方法能够将结肠内部较大的形变先矫正,使得两幅图之间的形变缩小到一定范围,然后利用传统配准方法能够完成配准。 在5套数据中,找到能够成功匹配的皱襞区域数量占所有分割出的皱襞区域总数量的62%左右,匹配错误率为4.7%左右。完成皱襞粗配准后,结肠形变明显趋于一致,灰度值相对误差减小,最终完成了结肠配准。 先进行皱襞匹配再做基于匹配好的皱襞的映射关系做结肠配准,能够将存在较大形变的两套结肠匹配起来。在之后的工作中需要量化特征点选取对配准结果的影响,同时在做配准评估时,单纯采用灰度差值不能很好完成评估,因为灰度特征只能一定程度反映整体差异,不能很好体现结构差异,需要添加其他评估标准辅助配准评估。  
      关键词:虚拟结肠镜;展平;配准;皱襞;匹配   
      3508
      |
      339
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111408 false
      更新时间:2024-05-07
    • 遥感图像飞机目标分类的卷积神经网络方法

      周敏, 史振威, 丁火平
      2017, 22(5): 702-708. DOI: 10.11834/jig.160595
      摘要:遥感图像飞机目标分类,利用可见光遥感图像对飞机类型进行有效区分,对提供军事作战信息有重要意义。针对该问题,目前存在一些传统机器学习方法,但这些方法需人工提取特征,且难以适应真实遥感图像的复杂背景。近年来,深度卷积神经网络方法兴起,网络能自动学习图像特征且泛化能力强,在计算机视觉各领域应用广泛。但深度卷积神经网络在遥感图像飞机分类问题上应用少见。本文旨在将深度卷积神经网络应用于遥感图像飞机目标分类问题。 在缺乏公开数据集的情况下,收集了真实可见光遥感图像中的8种飞机数据,按大致4∶1的比例分为训练集和测试集,并对训练集进行合理扩充。然后针对遥感图像与飞机分类的特殊性,结合深度学习卷积神经网络相关理论,有的放矢地设计了一个5层卷积神经网络。 首先,在逐步扩充的训练集上分别训练该卷积神经网络,并分别用同一测试集进行测试,实验表明训练集扩充有利于网络训练,测试准确率从72.4%提升至97.2%。在扩充后训练集上,分别对经典传统机器学习方法、经典卷积神经网络LeNet-5和本文设计的卷积神经网络进行训练,并在同一测试集上测试,实验表明该卷积神经网络的分类准确率高于其他两种方法,最终能在测试集上达到97.2%的准确率,其余两者准确率分别为82.3%、88.7%。 在少见使用深度卷积神经网络的遥感图像飞机目标分类问题上,本文设计了一个5层卷积神经网络加以应用。实验结果表明,该网络能适应图像场景,自动学习特征,分类效果良好。  
      关键词:可见光遥感;飞机;分类;深度学习;卷积神经网络   
      6307
      |
      595
      |
      21
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110591 false
      更新时间:2024-05-07
    0