最新刊期

    2018 23 12

      图像处理和编码

    • 类别信息生成式对抗网络的单图超分辨重建

      杨云, 张海宇, 朱宇, 张艳宁
      2018, 23(12): 1777-1788. DOI: 10.11834/jig.180331
      类别信息生成式对抗网络的单图超分辨重建
      摘要:目的基于生成式对抗网络的超分辨模型(SRGAN)以感知损失函数作为优化目标, 有效解决了传统基于均方误差(MSE)的损失函数导致重建图像模糊的问题。但是SRGAN的感知损失函数中并未添加明确指示模型生成对应特征的标志性信息, 使得其无法精准地将数据的具体维度与语义特征对应起来, 受此局限性影响, 模型对于生成图像的特征信息表示不足, 导致重建结果特征不明显, 给后续识别处理过程带来困难。针对上述问题, 在SRGAN方法的基础上, 提出一种类别信息生成式对抗网络的超分辨模型(class-info SRGAN)。方法对SRGAN模型增设类别分类器, 并将类别损失项添加至生成网络损失中, 再利用反向传播训练更新网络参数权重, 以达到为模型提供特征类别信息的目的, 最终生成具有可识别特征的重建图像。创新及优势在于将特征类别信息引入损失函数, 改进了超分辨模型的优化目标, 使得重建结果的特征表示更加突出。结果经CelebA数据集测试表明:添加性别分类器的class-info SRGAN的生成图像性别特征识别率整体偏高(58%~97%); 添加眼镜分类器的class-info SRGAN的生成图像眼镜框架更加清晰。此外, 模型在Fashion-mnist与Cifar-10数据集上的结果同样表明其相较于SRGAN的重建质量更佳。结论实验结果验证了本方法在超分辨重建任务中的优势和有效性, 同时结果显示:虽然class-info SRGAN更适用于具有简单、具体属性特征的图像, 但总体而言仍是一种效果显著的超分辨模型。  
      关键词:SRGAN;感知损失函数;MSE;类别信息;class-info SRGAN   
      19
      |
      62
      |
      6
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115802 false
      更新时间:2024-05-07

      图像分析和识别

    • 遮挡判别下的多尺度相关滤波跟踪算法

      刘万军, 张壮, 姜文涛, 张晟翀
      2018, 23(12): 1789-1800. DOI: 10.11834/jig.180237
      遮挡判别下的多尺度相关滤波跟踪算法
      摘要:目的复杂环境下,运动目标在跟踪过程中受尺度变换以及遮挡因素的影响,跟踪准确率较低。针对这一问题,提出一种遮挡判别下的多尺度相关滤波跟踪方法。方法首先选取第1帧图像的前景区域,训练目标的位置、尺度滤波器和GMS(grid-based motion statistics)检测器。然后,通过位置滤波器估计目标位置,尺度滤波器计算目标尺度,得到初选目标区域。最后,利用相关滤波响应情况对初选目标区域进行评估,通过相关滤波响应值的峰值和峰值波动情况判断是否满足遮挡和更新条件。若遮挡,启动检测器检测目标位置,检测到目标位置后,更新目标模型;若更新,则更新位置、尺度滤波器和GMS检测器,完成跟踪。结果本文使用多尺度相关滤波方法作为算法的基本框架,对尺度变化目标跟踪具有较好的适应性。同时,利用目标模型更新机制和GMS检测器检索目标,有效地解决了遮挡情况下的目标丢失问题。在公开数据集上的测试结果表明,本文算法平均中心误差为5.58,平均跟踪准确率为94.2%,跟踪速度平均可达27.5帧/s,与当前先进的跟踪算法相比,本文算法兼顾了跟踪速度和准确率,表现出更好的跟踪效果。结论本文提出一种新的遮挡判别下的多尺度相关滤波跟踪算法。实验结果表明,本文算法在不同的尺度变换及遮挡条件下能够快速准确跟踪目标,具有较好的跟踪准确率和鲁棒性。  
      关键词:目标跟踪;安全监控;遮挡判别;尺度变换;相关滤波   
      13
      |
      4
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115806 false
      更新时间:2024-05-07
    • 多任务分段紧凑特征的车辆检索方法

      何霞, 汤一平, 陈朋, 王丽冉, 袁公萍
      2018, 23(12): 1801-1812. DOI: 10.11834/jig.180312
      多任务分段紧凑特征的车辆检索方法
      摘要:目的随着公共安全领域中大规模图像监控及视频数据的增长以及智能交通的发展,车辆检索有着极其重要的应用价值。针对已有车辆检索中自动化和智能化水平低、难以获取精确的检索结果等问题,提出一种多任务分段紧凑特征的车辆检索方法,有效利用车辆基本信息的多样性和关联性实现实时检索。方法首先,利用相关任务之间的联系提高检索精度和细化图像特征,因此构造了一种多任务深度卷积网络分段学习车辆不同属性的哈希码,将图像语义和图像表示相结合,并采用最小化图像编码使学习到的车辆的不同属性特征更具有鲁棒性;然后,选用特征金字塔网络提取车辆图像的实例特征并利用局部敏感哈希再排序方法对提取到的特征进行检索;最后,针对无法获取查询车辆目标图像的特殊情况,采用跨模态辅助检索方法进行检索。结果提出的检索方法在3个公开数据集上均优于目前主流的检索方法,其中在CompCars数据集上检索精度达到0.966,在VehicleID数据集上检索精度提升至0.862。结论本文提出的多任务分段紧凑特征的车辆检索方法既能得到最小化图像编码及图像实例特征,还可在无法获取目标检索图像信息时进行跨模态检索,通过实验对比验证了方法的有效性。  
      关键词:深度哈希算法;车辆检索;多任务;跨模态检索;卷积神经网络   
      15
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115803 false
      更新时间:2024-05-07
    • 运动目标检测的ViBe算法改进

      杨丹, 戴芳
      2018, 23(12): 1813-1828. DOI: 10.11834/jig.180304
      运动目标检测的ViBe算法改进
      摘要:目的目标检测在智能交通、自动驾驶以及安防监控中均有重要的地位,ViBe算法是常用的运动目标检测算法,它主要由背景模型初始化、前景检测、背景模型更新3部分组成,其思想简单,易于实现,运算效率高,但当初始帧有运动目标时,检测结果会出现“鬼影”现象,且易受噪声和光照变化影响,不能适应动态场景。同时,其逐帧逐像素进行前景检测,在计算复杂度方面有较大提升空间。为解决这些问题,提出一种改进的ViBe算法,称为ViBeImp算法。方法在背景模型初始化时,用多帧平均法给出初始背景,采用该初始背景构建初始背景样本模型。在前景检测过程中,采用背景差分法、帧差法与OTSU算法相结合给出半径阈值的自适应计算方法。同时,根据背景差分法找出运动区域,只对运动区域进行前景判断和模型更新,降低算法的计算复杂度。结果对25个不同场景视频分别给出ViBeImp算法在初始化背景,自适应半径阈值和计算复杂度方面改进的结果及有效性指标,实验结果表明,与ViBe、ViBeDiff2、ViBeIniR,以及Surendra等算法和高斯混合模型相比,ViBeImp算法对噪声、光照和背景动态变化有较好的鲁棒性,检测结果更完整,且实时性较好。同时,ViBeImp算法将ViBe算法的查准率、查全率以及${\rm{F}}1 $值分别提高了17.98%、11.40%和15.96%。结论ViBeImp算法采用多帧平均法构建初始背景可有效地消除“鬼影”,并给出半径阈值的自适应计算方法,使ViBe算法更快适应视频环境变化,准确且完整地检测出运动目标,具有较低的误检率和漏检率。该方法克服了ViBe算法对初始背景以及视频环境的依赖,很大程度上提高了运算速度,具有很好的鲁棒性和适用性。  
      关键词:智能交通;运动目标检测;ViBe算法;自适应半径阈值;背景差分法;帧差法   
      20
      |
      68
      |
      11
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115804 false
      更新时间:2024-05-07
    • 复杂热红外监控场景下行人检测

      许茗, 于晓升, 陈东岳, 吴成东, 贾同, 茹敬雨
      2018, 23(12): 1829-1837. DOI: 10.11834/jig.180299
      复杂热红外监控场景下行人检测
      摘要:目的复杂热红外监控场景中的行人检测问题是计算机视觉领域的重要研究内容之一,是公共安全、灾难救援以及智慧城市等实际应用中的重要基础任务。现今的热红外行人检测算法大多依据图像中人体目标的灰度值高于场景环境这一假设,导致当环境温度升高热红外图像发生灰度值反转时行人检测率较低。为提高行人检测系统在不同场景中的鲁棒性以及行人目标检测率,提出一种面向热红外监控场景的基于频域显著性检测的全卷积网络行人目标检测算法。方法该算法首先对热红外图像进行基于频域的显著性检测,生成对行人目标全覆盖的显著图;然后结合热红外原图像生成感兴趣区域图作为输入,以行人目标概率图为输出,搭建全卷积网络;最后,对热红外行人检测系统进行端对端训练,获取网络输出的行人目标概率图,进而实现行人目标检测。结果论文使用俄亥俄州立大学建立的红外视频数据集OTCBVS中的OSU热红外行人数据库对算法进行验证,与目前5种较为成熟的算法进行对比。实验结果表明,本文算法可以在各种场景中准确检测出行人目标,以MR-FP(丢失率—假阳率)为对比依据,本文算法7%的平均丢失率低于其他算法,具有更高的检测率,对热红外图像中的灰度值反转问题具有更好的鲁棒性。结论本文提出一种面向热红外监控场景的基于频域显著性检测的全卷积网络行人目标检测算法,在实现检测算法端对端训练的同时,提高了其对各种复杂场景的鲁棒性以及行人目标检测率,提升热红外监控系统中行人目标检测性能。  
      关键词:计算机视觉;热红外监控;行人目标检测;显著性检测;全卷积网络   
      16
      |
      5
      |
      7
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115805 false
      更新时间:2024-05-07
    • 快速鲁棒核空间模糊聚类分割

      吴其平, 吴成茂
      2018, 23(12): 1838-1851. DOI: 10.11834/jig.180332
      快速鲁棒核空间模糊聚类分割
      摘要:目的传统模糊C-均值聚类应用于图像分割仅考虑像素本身的聚类问题,无法克服噪声干扰对图像分割结果的影响,不利于受到噪声干扰的工业图像、医学影像和高分遥感影像等进行目标提取、识别和解译。嵌入像素空间邻域信息或局部信息的鲁棒模糊C-均值聚类分割算法是近年来图像分割理论研究中的热点课题。为此,针对现有的鲁棒核空间模糊聚类算法非常耗时且抑制噪声能力弱、不适合强噪声干扰下大幅面图像快速分割等问题,提出一种快速鲁棒核空间模糊聚类分割算法。方法利用待分割图像中像素邻域的灰度信息和空间位置等信息构建线性加权滤波图像,对其进行鲁棒核空间模糊聚类。为了进一步提高算法实时性,引入当前聚类像素与其邻域像素均值所对应的2维直方图信息,构造一种基于2维直方图的鲁棒核空间模糊聚类快速分割最优化数学模型,采用拉格朗日乘子法获得图像分割的像素聚类迭代表达式。结果对大幅面图像添加一定强度的高斯、椒盐以及混合噪声,以及未加噪标准图像的分割测试结果表明,本文算法比基于邻域空间约束的核模糊C-均值聚类等算法的峰值信噪比至少提高1.5 dB,误分率降低约5%,聚类性能评价的划分系数提高约10%,运行速度比核模糊C-均值聚类和基于邻域空间约束的鲁棒核模糊C-均值聚类算法至少提高30%,与1维直方图核空间模糊C-均值聚类算法具有相当的时间开销,所得分割结果具有较好的主观视觉效果。结论通过理论分析和实验验证,本文算法相比现有空间邻域信息约束的鲁棒核空间模糊聚类等算法具有更强的抗噪鲁棒性、更优的分割性能和实时性,对大幅面遥感、医学等影像快速解译具有积极的促进作用,能更好地满足实时性要求较高场合的图像分割需要。  
      关键词:图像分割;核函数;模糊聚类;线性加权和图像;2维直方图;鲁棒性;聚类有效性   
      17
      |
      4
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115958 false
      更新时间:2024-05-07
    • 并行马尔可夫随机场计算变分光流方法

      江少锋, 赵鹏, 杨素华, 陈震, 张聪炫
      2018, 23(12): 1852-1863. DOI: 10.11834/jig.180342
      并行马尔可夫随机场计算变分光流方法
      摘要:目的基于马尔可夫随机场(MRF)的变分光流计算是一种较为鲁棒的光流计算方法,但是计算效率很低。置信传播算法(BP)是一种针对MRF较为高效的全局优化算法。本文提出一种MRF变分光流计算模型并采用并行BP方法实现,极大提高计算效率。方法提出的MRF变分光流计算模型中的数据项采用了Horn等人根据灰度守恒假设得到的光流基本约束方程,并采用非平方惩罚函数进行调整以平滑边界影响。为在CUDA平台上实现高效并行处理,本文提出了一种优化的基于置信传播的MRF并行光流计算方法。该优化方法在采用置信传播最小化MRF光流能量函数时,采用了一种4层的3维网络结构进行并行计算,每层对应MRF4邻域模型中的一个方向的信息传播,同时在每层中为每个像素分配多个线程采用并行降维法计算所要传递的信息,大大降低单线程计算负荷,大幅度提高计算效率。结果采用旋转小球图像序列进行实验,计算效率提高314倍;采用旋转小球、Yosemite山谷和RubberWhale 3种不同图像序列,与Horn算法、Weickert算法、Hossen并行Lucas算法、Grauer-Gray并行MRF算法进行对比实验,本文方法得到最低的平均端点误差(AEE),分别为0.13、0.55和0.34。结论本文提出了一种新的MRF光流计算模型,并在CUDA平台上实现了并行优化计算。实验结果表明,本文提出的并行计算方法在保持计算精度的同时极大提高了计算效率。本文方法对内存需求巨大,在处理高分辨率图像时,限制了采样点数,难以计算大位移。  
      关键词:光流场;马尔可夫随机场;CUDA并行计算;置信传播;非平方惩罚函数   
      12
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115962 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 融合深度模型和传统模型的显著性检测

      方正, 曹铁勇, 洪施展, 项圣凯
      2018, 23(12): 1864-1873. DOI: 10.11834/jig.180073
      融合深度模型和传统模型的显著性检测
      摘要:目的显著性检测是图像和视觉领域一个基础问题,传统模型对于显著性物体的边界保留较好,但是对显著性目标的自信度不够高,召回率低,而深度学习模型对于显著性物体的自信度高,但是其结果边界粗糙,准确率较低。针对这两种模型各自的优缺点,提出一种显著性模型以综合利用两种方法的优点并抑制各自的不足。方法首先改进最新的密集卷积网络,训练了一个基于该网络的全卷积网络(FCN)显著性模型,同时选取一个现有的基于超像素的显著性回归模型,在得到两种模型的显著性结果图后,提出一种融合算法,融合两种方法的结果以得到最终优化结果,该算法通过显著性结果Hadamard积和像素间显著性值的一对一非线性映射,将FCN结果与传统模型的结果相融合。结果实验在4个数据集上与最新的10种方法进行了比较,在HKU-IS数据集中,相比于性能第2的模型,$\text{F}$值提高了2.6%;在MSRA数据集中,相比于性能第2的模型,$\text{F}$值提高了2.2%,MAE降低了5.6%;在DUT-OMRON数据集中,相比于性能第2的模型,$\text{F}$值提高了5.6%,MAE降低了17.4%。同时也在MSRA数据集中进行了对比实验以验证融合算法的有效性,对比实验结果表明提出的融合算法改善了显著性检测的效果。结论本文所提出的显著性模型,综合了传统模型和深度学习模型的优点,使显著性检测结果更加准确。  
      关键词:显著性检测;密集卷积网络;全卷积网络;融合算法;Hadamard积   
      66
      |
      4
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115964 false
      更新时间:2024-05-07
    • 动态匹配核函数图像检索

      洪睿, 康晓东, 李博, 王亚鸽
      2018, 23(12): 1874-1885. DOI: 10.11834/jig.180137
      动态匹配核函数图像检索
      摘要:目的在传统的词袋模型图像搜索问题中,许多工作致力于提高局部特征的辨识能力。图像搜索得到的图像在细节部分和查询图像相似,但是有时候这些图像在语义层面却差别很大。而基于全局特征的图像搜索在细节部分丢失了很多信息,致使布局相似实则不相关的图像被认为是相关图像。为了解决这个问题,本文利用深度卷积特征来构建一个动态匹配核函数。方法利用这个动态匹配核函数,在鼓励相关图像之间产生匹配对的同时,抑制不相关图像之间匹配对的个数。该匹配核函数将图像在深度卷积神经网络全连接层最后一层特征作为输入,构建一个动态匹配核函数。对于相关图像,图像之间的局部特征匹配数量和质量都会相对增强。反之,对于不相关的图像,这个动态匹配核函数会在减少局部特征匹配的同时,降低其匹配得分。结果从数量和质量上评估了提出的动态匹配核函数,提出了两个指标来量化匹配核函数的表现。基于这两个指标,本文对中间结果进行了分析,证实了动态匹配核函数相比于静态匹配核函数的优越性。最后,本文在5个公共数据集进行了大量的实验,在对各个数据集的检索工作中,得到的平均准确率从85.11%到98.08%,均高于此领域的同类工作。结论实验结果表明了本文方法是有效的,并且其表现优于当前这一领域的同类工作。本文方法相比各种深度学习特征提取方法具有一定优势,由于本文方法使用特征用于构建动态匹配内核,而不是粗略编码进行相似性匹配,因此能在所有数据集上获得更好的性能。  
      关键词:图像检索;词袋模型;匹配核函数;深度学习;卷积神经网络;AlexNet   
      13
      |
      4
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115963 false
      更新时间:2024-05-07

      计算机图形学

    • 面向反馈运动控制器的多目标求解

      张迎凯, 谢文军, 刘晓平
      2018, 23(12): 1886-1900. DOI: 10.11834/jig.180271
      面向反馈运动控制器的多目标求解
      摘要:目的基于物理模拟的人体运动生成方法由于能够合成符合自然规律的运动片段,可实时响应环境的变化,且生成的物理运动不是机械性的重复,因此是近年来计算机动画和虚拟现实领域中最活跃的研究方向之一。然而人体物理模型具有高维、非线性及关节间强耦合性等特点,求解人体物理运动十分困难。反馈控制器常用于人体物理运动控制,求解时通常需要对多个目标函数加权求和,然而权重的设置需多次试验,烦杂耗时。针对运动控制器求解困难的问题,本文提出了一种面向反馈运动控制器的多目标求解方法。方法首先,对运动数据进行预处理并提取关键帧求解初始控制器,并设计一种改进的反馈控制机制;在此基础上,种群父代个体变异产生子代,采用禁选区域预筛选策略去除不满足约束的个体,并通过重采样获取新解;然后,通过物理仿真获得多目标适应度值,采用区域密度多层取优选取分布均匀的优秀个体作为下一代父代,并通过基于剪枝的多阶段物理求解算法决定是否进入下一阶段优化;经过多次迭代后获得物理控制器,从而生成具有反馈的人体物理运动。结果针对提出的方法,本文针对多个测试函数和物理运动分别进行实验:在测试函数实验中,本文分别采用经典的测试函数进行实验对比,在相同的迭代次数下,相比之前算法,本文算法中满足约束的优秀个体命中率更高,反转世距离更小,且最优解集的分布更加均匀;物理运动生成实验中,分别针对走路、跑步和翻滚等运动进行物理运动生成,与之前算法进行对比,本文算法可以更早地完成收敛,同时目标函数值更小,表明生成的运动效果更好。结论本文提出的进化求解方法可以生成不同运动的控制器,该控制器不仅可以生成物理运动,而且还具备外力干扰下保持平衡的能力,解决了运动控制器求解中多目标权重设置困难、优化时间长的问题;除此之外,本文算法还对具有约束的多目标问题具有较好的求解效果。  
      关键词:物理动画;运动控制;多目标进化;反馈;非线性约束优化;运动合成   
      11
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115966 false
      更新时间:2024-05-07
    • 三次B样条插值的网格拼接和融合

      刘姝玉, 韩燮, 贾彩琴
      2018, 23(12): 1901-1909. DOI: 10.11834/jig.180250
      三次B样条插值的网格拼接和融合
      摘要:目的 网格模型的拼接和融合是3维模型编辑的一个重要方面。为了提高3维模型之间拼接曲面的精度和效率,提出一种基于三次均匀B样条曲线曲面的网格融合方法。方法 首先,利用协变分析和数据驱动方法在目标模型上选定融合区域、确定要融合模型的大小及方向;其次,根据选定的3维网格模型,确定待拼接区域的边界,识别并记录边界点集,利用三次B样条插值边界点集;然后,对边界曲线进行双三次B样条曲面插值得到拼接区域连续曲面,并以此作为两模型拼接时的过渡面;最后,对拼接区域重采样,并对其三角化,以实现网格模型的无缝光滑拼接和融合。结果 为了验证本文方法对3维模型拼接的有效性,选取4组不同的模型,分别对其使用本文提出的融合拼接方法进行实验,对前两组模型的拼接效果进行了对比试验,实验结果表明,本文方法可以达到很好的拼接效果,对于融合区域以外的部分能够保持源模型的细节特征,拼接部分的过渡区域光顺平滑,拼接后的模型完整性佳。在运行时间相差0.05 s内,与数据驱动的建模方法相比,本文方法可以处理的节点数至少多2 000个,面片数至少多5 000个。结论 本文方法能够适用于具有任何边界的模型,在选取模型时,对于模型的形状、大小、拓扑结构等的要求较低,适用于新模型的快速建造,因此,该算法可应用于医学、商业广告、动画娱乐以及几何建模和制造等较为广阔的应用领域。  
      关键词:3维重组;网格拼接;网格融合;三次B样条;曲线曲面   
      12
      |
      4
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116120 false
      更新时间:2024-05-07
    • 带两个参数的三角多项式曲线曲面构造

      汪凯, 张贵仓, 龚进慧
      2018, 23(12): 1910-1924. DOI: 10.11834/jig.180328
      带两个参数的三角多项式曲线曲面构造
      摘要:目的 为了使扩展的曲线曲面保留传统Bézier方法以及B样条方法良好性质的同时,具备保形性、形状可调性、高阶连续性以及广泛的应用性,本文在拟扩展切比雪夫空间利用开花的性质构造了一组最优规范全正基,并利用该基进行曲线曲面构造。方法 首先构造一组最优规范全正基,并给出该基生成的拟三次TC-Bézier曲线的割角算法;接着利用最优规范全正基的线性组合构造拟三次均匀TC-B样条基,根据曲线的性质假设拟三次均匀B样条基函数具有规范性和${{\rm{C}}^2}$连续性,进而得到其表达式;然后证明拟三次均匀TC-B样条基具有全正性和高阶连续性;最后定义拟三次均匀TC-B样条曲线曲面,并证明曲线曲面的性质,给出曲线表示整圆和旋转曲面的表示方法,设计出球面和旋转曲面的直接生成方法。结果 实验表明,本文在拟扩展切比雪夫空间构造的具有全正性曲线曲面,不仅能够灵活地进行形状调整,而且具有高阶连续性、保形性。结论 本文在三角函数空间利用两个形状参数进行曲线曲面构造,大量的分析以及案例说明本文构造的曲线曲面不仅保留了传统的Bézier方法以及B样条方法的良好性质,而且具备保形性、形状可调性、高阶连续性以及广泛的应用性,适合用于曲线曲面设计。  
      关键词:拟扩展切比雪夫空间;最优规范全正基;全正性;高阶连续性;保形性   
      12
      |
      4
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116121 false
      更新时间:2024-05-07

      虚拟现实与增强现实

    • 结合轴对齐包围盒和空间划分的碰撞检测算法

      于瑞云, 赵金龙, 余龙, 张倩妮
      2018, 23(12): 1925-1937. DOI: 10.11834/jig.180050
      结合轴对齐包围盒和空间划分的碰撞检测算法
      摘要:目的 碰撞检测是虚拟现实,特别是虚拟装配中的关键技术。针对基于包围盒的碰撞检测算法的准确性和检测效率不足的问题,提出一种结合AABB轴对齐包围盒和空间划分的碰撞检测算法。方法 本文算法采用分步检测的方法,利用AABB算法来确定两包围盒的相交区域后,结合模型移动方向和运动趋势进行空间划分,利用碰撞检测的时空相关性,对时空相关的部分进行相交测试,通过将包围盒还原成三角面以及点的方式来保证检测的准确性。结果 本文算法与AABB层次包围盒二叉树算法、$k$-Dops包围盒算法以及BPS空间分割树算法进行对比实验分析。在碰撞的几何精度上,本文算法在大部分情况下与AABB算法和$k$-Dops算法的距离差超过阈值0.02,证明本文算法在碰撞几何精度上有明显的提高。在碰撞检测时耗上,随着碰撞检测难度的不断增加,本文算法在平移自由度下比AABB算法和BSP算法、在旋转自由度下比AABB算法和$k$-Dops算法的检测时间均降低了50%以上。在三角面数对算法碰撞检测时耗的影响上,当运动模型的三角面数较多时,本文算法表现出更高的稳定性。结论 结合AABB包围盒和空间划分方法的碰撞检测算法,在减少碰撞检测所需时间的同时提高了碰撞检测的准确性,可以满足虚拟装配技术中对碰撞检测算法准确性的要求,同时也能满足使用者实时性的交互习惯。  
      关键词:虚拟装配;AABB包围盒;空间划分;碰撞检测;分步检测;时空相关性;三角面   
      17
      |
      4
      |
      12
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116132 false
      更新时间:2024-05-07

      遥感图像处理

    • 机载SAR图像的动态金字塔实时显示技术

      项海兵, 刘劲松, 吴涛, 赵洪立, 孙龙
      2018, 23(12): 1938-1946. DOI: 10.11834/jig.180245
      机载SAR图像的动态金字塔实时显示技术
      摘要:目的 随着机载SAR(合成孔径雷达)图像分辨率越来越高,幅宽越来越大,传统雷达显控系统将整幅图像放入内存、抽样显示的现有方法存在内存资源紧张、显示图像的等待时间过长等问题,为解决此类问题,提出一种动态金字塔实时显示技术。方法 机载SAR图像实时显示软件包括动态金字塔构建和显示技术。动态金字塔构建技术包括:当接收到一个瓦片的图像数据时,输出第0层级的金字塔瓦片;分6种情况,生成高层级瓦片,随着接收数据不断增多,逐步补全金字塔文件。动态金字塔显示技术是指在瓦片数据不全的情况下,采用递归算法,读取较低层级瓦片,合成、显示当前显示层级图像的技术。这两种技术分属两个独立线程,以硬盘文件(瓦片)为接口,实时交互,协同工作。结果 机载SAR图像实时显示软件仅仅占用30 MB内存,且与图像大小无关;显示第1块SAR图像瓦片的时延小于1 s,与传统显控系统对比,减少约一帧图像的传输时延;显示整帧图像的时延因存储介质读写文件的速率存在差异较大,固态硬盘的时延比较稳定,显示1 GB图像的时延为12.55 s;机械盘的时延受读写速度的影响,当发送时间间隔大于6 ms时,显示1 GB图像的时延仅比传输时延多1.47 s。结论 机载SAR图像实时显示软件能实时向用户呈现接收中的SAR图像,提高了机载SAR图像的显示时效性,降低了机载雷达显控终端的内存需求,改善了机载雷达显控终端的用户体验。  
      关键词:遥感;图像金字塔;机载合成孔径雷达;实时显示;递归算法   
      13
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116142 false
      更新时间:2024-05-07
    • 联合显著性特征与卷积神经网络的遥感影像舰船检测

      余东行, 张保明, 郭海涛, 赵传, 徐俊峰
      2018, 23(12): 1947-1958. DOI: 10.11834/jig.180323
      联合显著性特征与卷积神经网络的遥感影像舰船检测
      摘要:目的 针对高分辨率遥感影像舰船检测受云雾、海浪以及海岛等复杂因素干扰,存在虚警率高、漏检率高、目标检测和识别困难等问题,提出一种联合视觉显著性特征与卷积神经网络的海面舰船目标检测方法。方法 基于频率域相位谱显著性检测能够有效抑制高分辨率遥感影像上云层、海面杂波干扰的特点,计算影像多尺度显著图并进行加权融合。采用对数变换对融合后的图像进行空间域灰度增强以提高目标与背景的区分度,利用灰度形态学闭运算填充舰船目标孔洞,采用大津分割法来提取疑似舰船目标作为兴趣区域。最后构建舰船样本库,利用迁移学习的思想训练卷积神经网络模型,对所有兴趣区域切片进行分类判断和识别,得到最终检测结果。结果 利用多幅不同背景下的高分辨率遥感影像,分别从视觉显著性检测、舰船粗检测与船只类型识别3个方面进行实验验证,选取检测率、虚警率、识别率3个指标进行定量评价。结果表明,本文方法相比于其他方法能有效排除云雾、海岛等多种因素的干扰,检测率、虚警率、识别率分别为93.63%、3.01%、90.09%,明显优于其他算法,能够实现大范围影像上多种类型舰船的快速准确检测和识别。结论 本文将图像视觉显著性检测快速获取图像显著目标的特点与卷积神经网络在图像分类的优势相结合,应用于遥感影像的海域舰船目标检测,能够实现对复杂背景下舰船目标的检测和船只类型的精细化识别。  
      关键词:舰船检测;遥感影像;频率域显著性检测;卷积神经网络;迁移学习   
      18
      |
      4
      |
      7
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116183 false
      更新时间:2024-05-07
    0