最新刊期

    2017 22 7

      图像处理和编码

    • 屏幕内容索引图的马尔可夫预测算法

      宋传鸣, 何兴, 傅博, 王相海
      2017, 22(7): 863-874. DOI: 10.11834/jig.170043
      摘要:调色板编码是屏幕内容编码的典型方法之一,其索引图的编码效率直接影响到调色板编码算法的总体压缩性能。但是,在处理物体前景和文字边缘的过渡区或连接区索引时,现有索引图预测编码方法的效率仍有待改善。为此提出一种基于马尔可夫模型的索引图预测算法。 随机选取了2 000个局部预测失败的索引值并将它们划分为3类典型分布,发现前2类分布的索引值往往处于边缘的灰度平滑过渡区,相邻索引值间呈现较为明显的线性变化,进而提出采用1阶2维马尔可夫随机过程来刻画这种线性性。对于一个待预测索引值,首先利用1阶2维马尔可夫模型计算相邻索引值的线性相关得到初始预测值,再利用颜色转移概率最大化确定其最优预测值。 本文算法的预测准确率为97.53%,比多级预测算法(MSP)和基于局部方向相关性的预测算法分别平均提高了4.33%和2.10%,尤其适用于包含大量文字字符和几何图元的视频序列的索引图预测。并且,渐近时间复杂度与基于局部方向相关性的预测算法相当,明显低于MSP。具体地,本文算法的实际运行时间比MSP算法节省了95.08%,比基于局部方向相关性的预测算法增加了35.46%。 本文提出的基于马尔可夫模型的索引图预测算法通过发掘索引值在边缘区域的线性相关性和特定的颜色转移模式,提高了索引预测效率,并保持了较低的计算复杂度,可应用在屏幕内容文本/图形块的调色板编码中。  
      关键词:图像编码;屏幕内容;预测编码;索引图;马尔可夫   
      2199
      |
      435
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110658 false
      更新时间:2024-05-07
    • 线积分卷积与双色调映射相结合的彩色素描模拟方法

      潘龙, 纪庆革, 陈靖
      2017, 22(7): 875-885. DOI: 10.11834/jig.160578
      摘要:目前学者已经设计了很多模拟油画、水彩、水墨等风格的非真实感绘制方法,而能够生成彩色素描的算法还不是很多。针对这一课题,在前人工作的基础上,结合线积分卷积与双色调映射技术,改进了一种彩色素描模拟方法。 首先基于K-means聚类对彩色图像进行分割,通过计算色彩差异性为每个区域指定两种基本色,并利用双色调映射技术计算每种颜色的密度。而后利用线积分卷积分别生成两个基本色层的素描纹理,并将两层纹理相融合来生成彩色纹理。与此同时,利用霓虹变换生成素描轮廓线。最后,将轮廓与彩色纹理相融合来得到彩色素描效果。 实验结果表明,本文方法能够实现由彩色图像到彩铅画的自动、实时转化。 本文方法从轮廓和纹理两个角度模拟了真实的彩铅绘画过程。基于K-means聚类的分割方法得到的结果能够更好地反映彩色图像的颜色分布特性。通过色彩差异性计算指定基本色的策略提高了该环节的效率,满足了实时性要求。由于粉笔、蜡笔等绘画风格的调色与彩铅画类似,本文不同颜色层上下叠加的方式可以扩展到对其他介质绘画的模拟当中。  
      关键词:非真实感绘制;彩色素描;双色调映射;线积分卷积   
      2829
      |
      407
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110549 false
      更新时间:2024-05-07
    • 家装设计渲染图增强

      戴雨彤, 姜晓彤, 唐慧
      2017, 22(7): 886-896. DOI: 10.11834/jig.160556
      摘要:提出一种亮度、对比度、饱和度三要素与神经网络相结合的家装设计渲染图增强方法。 该方法分析了图像增强的3个要素:亮度、对比度和饱和度。算法从下列几个方面着手进行三要素的调节:1)根据原图饱和度和图像融合方法实现亮度和对比度增强;2)采用颜色矩阵实现饱和度增强;3)采用直方图均衡实现对比度进一步增强。这3个要素对图像增强的效果均有贡献,本文为三要素分别赋予一个权值,并引入神经网络方法,自动建立图像亮度分量均值、方差和饱和度分量均值、方差与三要素的权值系数的非线性映射关系。 根据图像本身的信息自动获取图像增强三要素的增强系数,实现家装设计渲染图的自适应增强。算法的有效性在不同程度偏灰暗的家装设计渲染图上得到了验证,并与几种经典方法进行了直方图、信息熵、平均对比度(AC)和平均灰度(AG)的定量比较。实验结果显示,本文算法实验结果的直方图具有很少的信息丢失和较好的特征保持,与遗传算法相比,信息熵提高了约0.2,AC值提高了约0.1,AG值提高了约15,本文算法在多数情况下评价指标优于改进的直方图方法。 通过对实验结果的直观评价与定量评价,证明与某些现有的方法相比,本文方法适用于不同程度偏灰暗的渲染图,具有较好的通用性,并能达到更优的渲染图像增强效果。  
      关键词:家装设计渲染图;自适应增强;增强系数;神经网络;定量评价   
      2390
      |
      372
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112064 false
      更新时间:2024-05-07
    • 结合天空检测与纹理平滑的图像去雾

      沈逸云, 邵雅琪, 刘春晓, 周华健, 赵锦威
      2017, 22(7): 897-905. DOI: 10.11834/jig.170030
      摘要:针对已有图像去雾方法中存在的天空灰暗以及透射率分布与实际情况不一致导致的对比度增强不足等问题,以暗通道先验图像去雾方法为基础,提出结合天空检测与纹理滤波的图像去雾算法。 首先,设计了一个基于天空检测的大气光自适应估计策略,以天空区域亮度值较低的像素为依据估计大气光值,能够避免天空色彩失真,获得更明亮且干净的天空恢复结果;其次,对输入图像进行纹理平滑预处理以保持同一平面物体内的像素颜色一致性,并提出一个基于块偏移与导向滤波的透射率精确化计算策略,使透射率估值更符合深度信息的变化趋势,以提升无雾图像的对比度与色彩饱和度;最后,对复原结果进行联合双边滤波后处理,以降低噪声的影响。 本文算法得到的大气光估值更为合理,对于不符合暗通道先验的天空区域,能够取得更为自然的天空复原结果;本文算法得到的透射率的变化趋势与实际场景深度之间具有更高的一致性,对于符合暗通道先验的非天空区域,能够取得高对比度与高色彩饱和度的恢复结果。 本文算法在大气光与透射率的估值的准确性以及无雾图像的对比度与清晰度增强方面都得到了有效提升,具有较高的鲁棒性,适用于视频监控、交通监管和目标识别等户外获取图像的诸多应用领域。  
      关键词:图像去雾;大气光;透射率;天空检测;纹理平滑   
      3432
      |
      618
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110605 false
      更新时间:2024-05-07

      图像分析和识别

    • 分类错误指导的分层B-CNN模型用于细粒度分类

      沈海鸿, 杨兴, 汪凌峰, 潘春洪
      2017, 22(7): 906-914. DOI: 10.11834/jig.160497
      摘要:细粒度分类近年来受到了越来越多研究者的广泛关注,其难点是分类目标间的差异非常小。为此提出一种分类错误指导的分层双线性卷积神经网络模型。 该模型的核心思想是将双线性卷积神经网络算法(B-CNN)容易分错、混淆的类再分别进行重新训练和分类。首先,为得到易错类,提出分类错误指导的聚类算法。该算法基于受限拉普拉斯秩(CLR)聚类模型,其核心“关联矩阵”由“分类错误矩阵”构造。其次,以聚类结果为基础,构建了新的分层B-CNN模型。 用分类错误指导的分层B-CNN模型在CUB-200-2011、 FGVC-Aircraft-2013b和Stanford-cars 3个标准数据集上进行了实验,相比于单层的B-CNN模型,分类准确率分别由84.35%,83.56%,89.45%提高到了84.67%,84.11%,89.78%,验证了本文算法的有效性。 本文提出了用分类错误矩阵指导聚类从而进行重分类的方法,相对于基于特征相似度而构造的关联矩阵,分类错误矩阵直接针对分类问题,可以有效提高易混淆类的分类准确率。本文方法针对比较相近的目标,尤其是有非常相近的目标的情况,通过将容易分错、混淆的目标分组并进行再训练和重分类,使得分类效果更好,适用于细粒度分类问题。  
      关键词:细粒度分类;分类错误;分层模型;双线性卷积神经网络;受限拉普拉斯秩   
      4367
      |
      389
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111800 false
      更新时间:2024-05-07
    • 结合四元数与最小核值相似区的边缘检测

      李姗姗, 陈莉, 张永新, 尹化荣, 袁娅婷
      2017, 22(7): 915-925. DOI: 10.11834/jig.160605
      摘要:针对传统彩色图像边缘检测方法中未充分利用图像色度信息、颜色模型间非线性转换过程中时间和空间的大量耗费、算法实现复杂等问题,将四元数引入最小核值相似区(SUSAN)算法中,提出一种RGB空间下的结合四元数与最小核值相似区的边缘检测算法。 该算法首先对彩色图像进行四元数描述,然后用改进的SUSAN算子进行边缘检测。针对其中单一几何阈值的限制,以及检测出的边缘较粗等问题,本文采用Otsu算法自适应获取双几何阈值,再对弱边缘点集进行边缘生长,最后根据USAN重心及其对称最长轴来确定边缘局部方向,实现对边缘点的局部非极大值抑制,得到最终细化后的边缘图像。 实验选取1幅合成彩色图像及3幅标准图像库图像,与彩色Canny算法、SUSAN算法,及采用单阈值的本文算法进行对比,并采用Pratt品质因数衡量边缘定位精度。本文算法能够检测出亮度相近的不同颜色区域之间的边缘,且提取的边缘比较连续、细致,漏检边缘较少。与公认边缘检测效果较好的彩色Canny算法相比,本文算法的品质因数提高了0.012 0,耗时缩短了2.527 9 s。 本文提出了一种结合四元数与最小核值相似区的边缘检测算法,实现了四元数与SUSAN算子的有效融合。实验结果表明,该算法能够提高边缘定位精度,对弱噪声具有较好的抑制能力,适用于对实时性要求不高的低层次彩色图像处理。  
      关键词:彩色图像边缘检测;四元数;SUSAN算子;Otsu算法;局部非极大值抑制   
      2600
      |
      315
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110826 false
      更新时间:2024-05-07
    • 结合分水岭的纹理梯度各向异性图像分割

      冀甜甜, 崔嘉, 董新锋, 贺云隆, 郑元杰
      2017, 22(7): 926-934. DOI: 10.11834/jig.160629
      摘要:目前,许多图像分割算法对含有丰富纹理信息的图像的分割效果并不理想,尤其是在不同纹理的边缘信息的保持方面。为了解决这一问题,提出一种基于连续纹理梯度信息的各向异性图像分割算法。 在分水岭算法的基础上,引入纹理梯度各向异性算法,能够在避免纹理信息影响分割效果的前提下,最大限度地保证纹理边缘信息的完整。针对纹理特征数据敏感的特性,本文将离散的图像高度信息映射到连续的纹理梯度空间,能够有效减少由细小差异造成的过分割现象。 本文方法在BSD500 Dataset和Stanford Background Dataset中选择了大量的纹理信息丰富的图片与最新的分割算法进行了实验与对比。本文方法在分割效果(降低过分割现象)、保持边缘信息和分割准确率等方面均获得明显改进,并在图像分割的平均准确率方面与最新算法进行比较发现,本文算法的平均分割准确率达到90.9%,明显超过了其他最新算法,验证了本文方法的有效性。 本文提出的基于分水岭的纹理梯度各向异性算法对纹理图像的分割具有保边和准确的特点,采用连续梯度空间的方法能够有效地减少传统分水岭算法的过分割现象。本文方法主要适用于纹理信息丰富(自然纹理和人工纹理)的图片。  
      关键词:分水岭算法;纹理;图像分割;Patch Shift;纹理梯度;图像滤波   
      2986
      |
      402
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110394 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 三焦点张量重投影视频稳像算法

      王敬东, 薛重飞, 魏雪迎, 刘云霄
      2017, 22(7): 935-945. DOI: 10.11834/jig.160657
      摘要:目前,特征点轨迹稳像算法无法兼顾轨迹长度、鲁棒性及轨迹利用率,因此容易造成该类算法的视频稳像结果扭曲失真或者局部不稳。针对此问题,提出基于三焦点张量重投影的特征点轨迹稳像算法。 利用三焦点张量构建长虚拟轨迹,通过平滑虚拟轨迹定义稳定视图,然后利用三焦点张量将实特征点重投影到稳定视图,以此实现实特征点轨迹的平滑,最后利用网格变形生成稳定帧。 对大量不同类型的视频进行稳像效果测试,并且与典型的特征点轨迹稳像算法以及商业软件进行稳像效果对比,其中包括基于轨迹增长的稳像算法、基于对极几何点转移的稳像算法以及商业软件Warp Stabilizer。本文算法的轨迹长度要求低、轨迹利用率高以及鲁棒性好,对于92%剧烈抖动的视频,稳像效果优于基于轨迹增长的稳像算法;对于93%缺乏长轨迹的视频以及71.4%存在滚动快门失真的视频,稳像效果优于Warp Stabilizer;而与基于对极几何点转移的稳像算法相比,退化情况更少,可避免摄像机阶段性静止、摄像机纯旋转等情况带来的算法失效问题。 本文算法对摄像机运动模式和场景深度限制少,不仅适宜处理缺少视差、场景结构非平面、滚动快门失真等常见的视频稳像问题,而且在摄像机摇头、运动模糊、剧烈抖动等长轨迹缺乏的情况下,依然能取得较好的稳像效果,但该算法的时间性能还有所不足。  
      关键词:视频稳像;三焦点张量;虚拟轨迹;长轨迹;重投影   
      2859
      |
      387
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112263 false
      更新时间:2024-05-07
    • 视觉感知正反馈的显著性检测

      吴祯, 潘晨, 殷海兵
      2017, 22(7): 946-956. DOI: 10.11834/jig.160598
      摘要:人类视觉系统性能远超当前机器视觉,模拟人类视觉机制改进当前算法是有效研究途径,为此提出一种视觉感知正反馈模型,通过循环迭代、重复叠加视觉刺激生成更符合人类感知的视觉显著性图。 首先用多种常规方法检测图像显著度,模拟人类视觉多通道特性,再组合这些显著图为综合显著图;利用显著度大的像素构建初始注视区。其次借助集成RVFL(随机向量功能网络)模拟人脑神经网络产生视觉刺激,对注视与非注视区内像素在线“随机采样—学习建模”,图像像素经模型分类获得新注视区。对新注视区与非注视区,可重复迭代进行“随机采样—学习建模—像素分类”;迭代中若注视区连续相同,则表明感知饱和,迭代终止。若将每次像素分类结果看做是一种视觉刺激,则多次视觉刺激输出叠加,可生成新的图像显著性图。最终的像素分类结果就是图像分割目标。 将本文算法与现有方法在标准图像数据库上进行对比评测,包括通过对6种算法在ECSSD、SED2和MSRA10K 3个图像数据库上的P-R曲线,F-measure值和平均绝对误差(MAE)值上进行定量分析,对6种模型生成的显著性图作定性比较。数据表明,本文算法在SED2和MSRA10K图象数据库中性能最好,在ECSSD图象数据库中稍低于BL(bootstrap learning)和RBD(robust background detection)算法。本文算法的显著图与人类视觉感知更接近。且算法的正反馈迭代过程一般可迅速饱和,并未显著增加算法负担。实验结果表明,本文方法可作为一种有效的后处理手段,显著提升常规显著性检测算法的性能。 提出了一种模拟人类视觉机制的数据驱动显著性检测算法,无需图像先验知识和事先的标记样本。面对多目标,背景复杂等情况,本文方法具有相对好的鲁棒性和适用性,并且能够较好解决现实环境中图像处理算法的通用性、可靠性和准确性问题。  
      关键词:视觉显著性检测;注视眼动;机器学习;正反馈;视觉感知饱和;迭代   
      3618
      |
      421
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111844 false
      更新时间:2024-05-07
    • 定位图像匹配尺度与区域的摄像机位姿实时跟踪

      苗菁华, 孙延奎
      2017, 22(7): 957-968. DOI: 10.11834/jig.160612
      摘要:提出一种定位图像匹配尺度及区域的有效算法,通过实现当前屏幕图像特征点与模板图像中对应尺度下部分区域中的特征点匹配,实现摄像机对模板图像的实时跟踪,解决3维跟踪算法中匹配精度与效率问题。 在预处理阶段,算法对模板图像建立多尺度表示,各尺度下的图像进行区域划分,在每个区域内采用ORB(oriented FAST and rotated BRIEF)方法提取特征点并生成描述子,由此构建图像特征点的分级分区管理模式。在实时跟踪阶段,对于当前摄像机获得的图像,首先定位该图像所对应的尺度范围,在相应尺度范围内确定与当前图像重叠度大的图像区域,然后将当前图像与模板图像对应的尺度与区域中的特征点集进行匹配,最后根据匹配点对计算摄像机的位姿。 利用公开图像数据库(stanford mobile visual search dataset)中不同分辨率的模板图像及更多图像进行实验,结果表明,本文算法性能稳定,配准误差在1个像素左右;系统运行帧率总体稳定在2030 帧/s。 与多种经典算法对比,新方法能够更好地定位图像匹配尺度与区域,采用这种局部特征点匹配的方法在配准精度与计算效率方面比现有方法有明显提升,并且当模板图像分辨率较高时性能更好,特别适合移动增强现实应用。  
      关键词:增强现实;3维跟踪;特征匹配;移动平台;模板图像;定位匹配尺度和区域   
      2949
      |
      330
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111157 false
      更新时间:2024-05-07

      计算机图形学

    • 可变形网格引导的群体队形仿真

      李祖宁, 何武
      2017, 22(7): 969-977. DOI: 10.11834/jig.160585
      摘要:许多群体运动仿真算法侧重于模拟由大量自由移动个体所组成的群体行为,而针对具有特定队形的群体运动仿真算法较少。为解决这一问题,采用改进的网格引导方法,利用可变形网格对群体运动进行控制。 首先,对群体队形进行三角划分,建立一个连接所有智能体的队形网格。然后,利用障碍势场法在群体运动的过程中对队形网格进行变形,使智能体在避免与障碍物发生穿透的同时尽可能保持整体队形稳定。最后,针对障碍物穿过队形网格时可能造成的局部智能体 “错位现象”,提出了基于吸引点的网格引导方法,使群体绕过障碍物后能迅速恢复原来队形。 使用Unity软件对军队行进、动态车流、群体表演等场景中的智能体编队移动进行仿真,并设置了不同规模的群组交换实验进行对比。本文算法的实时计算花销主要集中在网格变形阶段:在队形网格顶点总数为1 000时,单位仿真步内网格变形阶段的平均运行时间为20.15 ms。队形网格划分阶段是一个预先进行的过程,不影响算法实时性。基于吸引点的网格引导方法提高了智能体的全局移动效率,使队形变化更加自然流畅。 实验结果表明,可变形网格引导的群体队形仿真算法在群体运动过程中能有效维持队形稳定,无论障碍环境是静态的还是动态的都能实现良好的群体避障,说明算法的有效性。  
      关键词:群体仿真;变形网格;碰撞避免;吸引点;引导网格;障碍势场   
      2422
      |
      389
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111918 false
      更新时间:2024-05-07

      医学图像处理

    • 动态功能脑网络模型的多任务融合Lasso方法

      王鑫, 任燕双, 张文生
      2017, 22(7): 978-987. DOI: 10.11834/jig.170055
      摘要:传统的静息态功能性磁共振成像(fMRI)的功能脑网络(FBN)研究是基于在整个扫描过程中FBN固定不变的假设。但是,最近的研究表明FBN是动态变化的,而且其中蕴含着丰富的信息。本文提出一种多任务融合最小绝对值收缩和选择算子(Lasso)方法来构建静息态fMRI的动态FBN。 提出的多任务融合Lasso方法可以在构建动态FBN时,保留网络的稀疏性及子序列的时间平滑性。具体来说,首先用滑动窗方法得到交叠的静息态fMRI子序列;然后用多任务融合Lasso方法联合地估计一个样本的所有子序列的功能连接从而构建动态FBN,用均值聚类算法得到每类样本子序列的功能连接的聚类中心,并将所有类的聚类中心组成回归矩阵;最后根据回归矩阵求样本的回归系数,将其作为特征进行分类,验证多任务融合Lasso方法对动态FBN建模的有效性。 采用公开的fMRI数据集来验证多任务融合Lasso模型构建动态FBN的分类效果。实验使用阿尔兹海默症神经影像学计划(ADNI)公开的fMRI数据集中的阿尔兹海默症患者、早期轻度认知功能障碍患者和健康被试3组数据,并用准确率、灵敏度和特异度来评估算法的分类性能。在3组二分类实验中,本文方法分别达到了92.31%、80.00%和84.00%的准确率。实验结果表明,与静态FBN模型和其他传统的动态FBN模型相比,本文方法能取得更好的分类效果。 本文提出的多任务融合Lasso构建动态FBN的方法,能有效地保留网络的稀疏性和子序列的时间平滑性,同时提高算法的分类效果,在一定程度上为脑部疾病的诊断提供帮助。多任务融合Lasso模型可以用于动态FBN的构建,挖掘功能连接的动态信息,同时整个算法可以用于基于fMRI数据的脑部疾病的分类研究中。  
      关键词:静息态fMRI;动态功能脑网络;功能连接;多任务融合Lasso;稀疏;分类;阿尔兹海默症   
      3261
      |
      332
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111333 false
      更新时间:2024-05-07

      遥感图像处理

    • 利用包含度和隶属度的遥感影像模糊分割

      赵泉华, 刘冬, 李晓丽, 李玉
      2017, 22(7): 988-995. DOI: 10.11834/jig.170088
      摘要:传统FCM算法及其改进算法均只采用隶属度作为分割判据实现图像分割。然而,在分割过程中聚类中心易受到同质区域内几何噪声的影响,导致此类算法难以有效分割具有几何噪声的图像。为了解决这一类问题,提出一种利用包含度和隶属度的遥感影像模糊分割算法。 该算法假设同一聚类对每个像素都有不同程度的包含度,将包含度作为一种新测度来描述聚类与像素间关系,并将包含度纳入目标函数中。该算法通过迭代最小化目标函数来得到最优的隶属度和包含度,然后,通过反模糊化隶属度和包含度之积实现带有几何噪声的遥感图像的分割。 采用本文算法分别对模拟图像,真实遥感影像进行分割实验,并与FCM算法和FLICM算法进行对比,定性结果表明,对含有几何噪声的区域,提出算法的用户精度和产品精度均高于FCM算法和FLICM算法,且总精度和Kappa值也高于对比算法。实验结果表明,本文算法能够抵抗几何噪声对图像分割的影响,且分割精度远远高于其他两种算法的分割精度。 提出算法通过考虑聚类对像素的包含性,能够有效抵抗几何噪声对图像分割的影响,使得算法具有较高的抗几何噪声能力,进而提高该算法对含有几何噪声图像的分割精度。提出算法适用于包含几何噪声的高分辨率遥感图像,具有很好的抗几何噪声性。  
      关键词:遥感图像分割;模糊C均值;包含度;隶属度;几何噪声   
      2466
      |
      359
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111716 false
      更新时间:2024-05-07
    • 高分辨卫星图像卷积神经网络分类模型

      周明非, 汪西莉, 王磊, 陈粉
      2017, 22(7): 996-1007. DOI: 10.11834/jig.160627
      摘要:卫星图像往往目标、背景复杂而且带有噪声,因此使用人工选取的特征进行卫星图像的分类就变得十分困难。提出一种新的使用卷积神经网络进行卫星图像分类的方案。使用卷积神经网络可以提取卫星图像的高层特征,进而提高卫星图像分类的识别率。 首先,提出一个包含六类图像的新的卫星图像数据集来解决卷积神经网络的有标签训练样本不足的问题。其次,使用了一种直接训练卷积神经网络模型和3种预训练卷积神经网络模型来进行卫星图像分类。直接训练模型直接在文章提出的数据集上进行训练,预训练模型先在ILSVRC(the ImageNet large scale visual recognition challenge)-2012数据集上进行预训练,然后在提出的卫星图像数据集上进行微调训练。完成微调的模型用于卫星图像分类。 提出的微调预训练卷积神经网络深层模型具有最高的分类正确率。在提出的数据集上,深层卷积神经网络模型达到了99.50%的识别率。在数据集UC Merced Land Use上,深层卷积神经网络模型达到了96.44%的识别率。 本文提出的数据集具有一般性和代表性,使用的深层卷积神经网络模型具有很强的特征提取能力和分类能力,且是一种端到端的分类模型,不需要堆叠其他模型或分类器。在高分辨卫星图像的分类上,本文模型和对比模型相比取得了更有说服力的结果。  
      关键词:卫星图像;分类;卷积神经网络;模型;特征   
      3862
      |
      568
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112358 false
      更新时间:2024-05-07
    • 残差点退化的统计费用网络流机载相位解缠算法

      刘怡君, 韩春明, 岳昔娟
      2017, 22(7): 1008-1016. DOI: 10.11834/jig.160659
      摘要:相位解缠是InSAR干涉数据处理的关键步骤,而解缠不连续(即相位跳变)问题却普遍存在,尤其在机载InSAR系统中,由于数据的高分辨率,使得低矮地物如树木带在数据中表现为相位不一致,因而相位跳变问题更加显著。星载InSAR相位解缠广泛使用统计费用网络流(SNAPHU)算法,借鉴其经验将SNAPHU算法引入高分辨机载InSAR相位解缠。而残差点退化方法能有效补偿局部相位不一致区域。因此本文提出一种结合残差点退化方法与SNAPHU算法的高分辨率机载InSAR相位解缠算法。 将原始InSAR数据滤波且去除平地相位,再对其进行残差点退化处理。残差点退化包含残差点定位,及残差点补偿两部分。根据残差点及其邻域像元的性质,对残差点进行补偿使其退化为非残差点,不断迭代这一过程,以减少图像中的残差点,优化局部数据。根据机载InSAR系统定标参数,修正SNAPHU算法中的参数及几何模型,使用修正后算法进行相位解缠。 利用2011年四川江油地区的单轨双天线X波段机载InSAR数据进行了试验,试验结果表明,在相位不一致,相干性低的连续树木带区域,该算法显著缩小了解缠相位不连续区域,修正了大面积的相位跳变。 验证了残差点退化方法结合统计费用网络流算法可有效解决解缠相位大面积跳变问题,且对噪声具有鲁棒性。  
      关键词:机载干涉合成孔径雷达;相位解缠;残差点;统计费用网络流(SNAPHU)   
      2562
      |
      306
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56110908 false
      更新时间:2024-05-07
    0