最新刊期

    2017 22 1

      图像处理和编码

    • 面向水下图像的质量评价方法

      郭继昌, 李重仪, 张艳, 顾翔元
      2017, 22(1): 1-8. DOI: 10.11834/jig.20170101
      摘要:针对目前水下图像质量评价方法少和现有方法存在局限性等问题,提出一种无参考并且无需手工设计特征的水下图像质量评价方法。 提出的水下图像质量评价方法将深度学习网络框架与随机森林回归模型相结合,首先采用深度神经网络提取水下图像的特征;然后使用提取的特征和标定的水下图像质量分数训练回归模型;最终,利用训练好的回归模型预测水下图像的质量。 在本文收集的水下图像数据集和水下图像清晰化算法处理结果上评测本文方法,并与多种质量评价方法进行比较,其中包括预测结果与主观质量分数比较、水下图像清晰化结果评测比较、预测结果与主观质量分数相关性比较、鲁棒性比较等。主观实验结果表明本文的评价方法可以相对准确地给出符合人类视觉感知的水下图像质量分数,并且具有更好的鲁棒性。定量实验结果表明本文方法与其他方法相比,预测的图像质量分数与主观分数具有更高的相关性。 提出的水下图像质量评价方法无需参考图像,省去了手工设计的特征,充分利用了深度学习网络的学习和表征能力。本文方法的准确性较好,普适性和鲁棒性较高,预测的质量分数与人类视觉感知具有较高的一致性。本方法适用于原始的水下图像和水下图像清晰化算法的处理结果。  
      关键词:水下图像;无参考图像质量评价;深度学习;人类视觉感知;水下图像清晰化   
      8212
      |
      2886
      |
      11
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113268 false
      更新时间:2024-05-08
    • 半张量积压缩感知模型的l

      王金铭, 叶时平, 徐振宇, 陈超祥, 蒋燕君
      2017, 22(1): 9-19. DOI: 10.11834/jig.20170102
      摘要:半张量积压缩感知模型是一种可以有效降低压缩感知过程中随机观测矩阵所占存储空间的新方法,利用该模型可以成倍降低观测矩阵所需的存储空间。为寻求基于该模型新的重构方法,同时提升降维后观测矩阵的重构性能,提出一种采用光滑高斯函数拟合l-范数方法进行重构。 构建降维随机观测矩阵,对原始信号进行采样;构建可微且期望值为零的光滑高斯函数来拟合不连续的l-范数,采用最速下降法进行重构,最终得到稀疏信号的估计值。 实验分别采用1维稀疏信号和2维图像信号进行测试,并从重构概率、收敛速度、重构信号的峰值信噪比等角度进行了测试和比较。验证结果表明,本文所述算法的重构概率、收敛速度较该模型的l-范数(0 < <1)方法有一定的提升,且当观测矩阵大小降低为通常的1/64,甚至1/256时,仍能保持较高的重构性能。 本文所述的重构算法,能在更大程度上降低观测矩阵的大小,同时基本保持重构的精度。  
      关键词:压缩感知;随机观测矩阵;存储空间;半张量积;拟合l;-范数最小化   
      3933
      |
      1740
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114324 false
      更新时间:2024-05-08

      图像分析和识别

    • CCD比色测温中辐射图像滤波与分割

      孙元, 彭小奇, 宋彦坡
      2017, 22(1): 20-28. DOI: 10.11834/jig.20170103
      摘要:高温热辐射图像存在较为严重的环境光、烟雾和粉尘干扰,因此图像滤波和分割是CCD比色测温法中实现准确测温的关键步骤。但传统的彩色图像处理方法不适合直接应用于辐射图像处理。 热辐射图像相邻像素间具有较强的相关性,为了量化表征不同空间距离像素颜色值之间的相互关联程度,设计了一种归一化空间距离加权函数,并与能同时滤除色调和亮度噪声的距离方向滤波器相结合,构建一种归一化空间距离加权距离方向滤波器。热辐射图像B基色接近于零,R、G基色分布在特定的直线方向上,且在该直线方向上呈现易于分割的双峰特性。为此提出利用Fisher准则构建R-G基色2维向量最佳1维投影,在1维空间利用最大类间方差法进行图像分割。 将本文方法与传统图像处理方法(采用距离方向滤波器滤波,彩色空间聚类法进行图像分割)进行比较,在高温工业炉上,经传统方法处理后的测量最大相对误差为1.99%,本文方法处理后为1.10%;在铜锍熔炼闪速炉上,传统方法最大相对误差为3.67%,本文方法为1.31%。经河南省计量院校验,基于本文方法构建的高温场测量仪在880℃~1 520℃的温度范围内测温最大绝对误差为4.2℃,最大相对误差为0.43%。 归一化空间距离加权使得滤波器在抑制冲击噪声的同时具有更好的保留细节的能力,图像分割算法能够克服与目标亮度相近的干扰,准确分割出待测目标。因此本文提出的图像处理方法能够有效克服高温辐射图像中的各种干扰,提高辐射测温的精确度和可靠性。  
      关键词:矢量滤波法;彩色图像分割;Fisher准则;彩色CCD;比色测温法;辐射测温方法   
      2648
      |
      1234
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113340 false
      更新时间:2024-05-08
    • 融合互补性外形先验信息的改进参数最小割模型

      黄瑞阳, 朱俊光
      2017, 22(1): 29-38. DOI: 10.11834/jig.20170104
      摘要:似物性推荐为近年来提出的一种快速物体定位方法,而参数最小割模型作为似物性推荐的一种重要模型受到广泛关注。针对传统的参数最小割模型受颜色分布影响较大的问题,提出融合多个具有信息互补作用的外形先验予以改进。 首先构造了一种数据驱动的基于形状共享的外形先验,以发现具有相似外形的物体区域;其次,从格式塔完形心理学的角度入手,引出了一种测地星形凸面性的外形先验,约束外形的拓扑结构,生成外形不同的物体区域;最后,结合外形先验、颜色分布、边缘响应强度以及尺度线索,构建能量函数以表征新的模型,从而增强模型对复杂颜色分布的鲁棒性。 分别在Seg VOC12和BSDS300数据集中进行了外形先验有效性验证、复杂颜色分布下算法鲁棒性分析和前沿似物性推荐算法对比分析等实验,结果表明,本文采用融合互补性外形先验能提高候选区域定位精度,具有更好的颜色分布鲁棒性,当颜色简单性位于[0.7,,08]之间时,算法结合外形先验后平均最佳重叠率最高可达到9.8%的提升,且在与13种具有代表性的似物性推荐算法进行区域级物体定位能力对比实验中,本文算法在不同的重叠率阈值下均达到了相近的查全率。 本文算法具有更高的前景与背景的区分能力,能够适应各种复杂颜色分布,同时具有较好的物体定位能力。  
      关键词:参数最小割;外形先验;颜色分布;能量函数;测地星形凸面性;似物性推荐   
      2850
      |
      1286
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112678 false
      更新时间:2024-05-08
    • 复合时空特征的双模态情感识别

      王晓华, 侯登永, 胡敏, 任福继
      2017, 22(1): 39-48. DOI: 10.11834/jig.20170105
      摘要:针对体积局部二值模式应用到视频帧特征提取上,特征维数大,对光照及噪声鲁棒性差等问题,提出一种新的特征描述算法—时空局部三值模式矩(TSLTPM)。考虑到TSLTPM描述的仅是纹理特征,本文进一步融合3维梯度方向直方图(3DHOG)特征来增强对情感视频的描述。 首先对情感视频进行预处理获得表情和姿态序列;然后对表情和姿态序列分别提取TSLTPM和3DHOG特征,计算测试序列与已标记的情感训练集特征间的最小欧氏距离,并将其作为独立证据来构造基本概率分配;最后使用D-S证据联合规则得到情感识别结果。 在FABO数据库上进行实验,表情和姿态单模态分别取得83.06%和94.78%的平均识别率,在表情上分别比VLBP(体积局部二值模式)、LBP-TOP(三正交平面局部二值模式)、TSLTPM、3DHOG高9.27%、12.89%、1.87%、1.13%;在姿态上分别比VLBP、LBP-TOP、TSLTPM、3DHOG高24.61%、27.55%、1.18%、0.98%。将两种模态进行融合以后平均识别率达到96.86%,说明了融合表情和姿态进行情感识别的有效性。 本文提出的TSLTPM特征将VLBP扩展成时空三值模式,能够有效降低维数,减少光照和噪声对识别的影响,与3DHOG特征形成复合时空特征有效增强了情感视频的分类性能,与典型特征提取算法的对比实验也表明了本文算法的有效性。另外,与其他方法的对比实验也验证了本文融合方法的优越性。  
      关键词:表情;姿态;时空局部三值模式矩;3维方向梯度直方图;Dempster-Shafer证据理论   
      3827
      |
      1807
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112859 false
      更新时间:2024-05-08
    • 刚性区域特征点的3维人脸识别

      袁姮, 王志宏, 姜文涛
      2017, 22(1): 49-57. DOI: 10.11834/jig.20170106
      摘要:针对3维人脸识别中存在表情变化的问题,提出了一种基于刚性区域特征点的3维人脸识别方法。 该方法首先在人脸纹理图像上提取人脸图像的特征点,并删除非刚性区域内的特征点,然后根据采样点的序号,在人脸空间几何信息上得到人脸图像特征点的3维几何信息,并建立以特征点为中心的刚性区域内的子区域,最后以子区域为局部特征进行人脸识别测试,得到不同子区域对人脸识别的贡献,并以此作为依据对人脸识别的结果进行加权统计。 在FRGC v2.0的3维人脸数据库上进行实验测试,该方法的识别准确率为98.5%,当错误接受率(FAR)为0.001时的验证率为99.2%,结果表明,该方法对非中性表情下的3维人脸识别具有很好的准确性。 该方法可以有效克服表情变化对3维人脸识别的影响,同时对3维数据中存在的空洞和尖锐噪声等因素具有较好的鲁棒性,对提高3维人脸识别性能具有重要意义。  
      关键词:3维人脸识别;刚性区域;纹理图像;几何图像;人脸特征点   
      4000
      |
      1569
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112577 false
      更新时间:2024-05-08
    • 动态时间规整下的列车车钩缓冲图像区域校正

      赵耀, 陈建胜
      2017, 22(1): 58-65. DOI: 10.11834/jig.20170107
      摘要:在铁路货车故障轨边图像检测系统(TFDS)采集的车钩缓冲区域影像中,托架、车钩等关键部件是刚体,但部件之间的连接是软连接,存在相对位移,造成传统的全局校正模型在该类图像校正中无法实现高精度校正,本文基于动态时间归整(DTW)方法,提出一种基于DTW区域划分的影像校正方法,实现影像的高精度校正。 本文将成像良好的车钩缓冲图像作为标准图像,首先对待校正图像进行预处理,消除标准图像与待校正图像之间在灰度、角度与尺度方面的差异,并针对车钩缓冲图像在车辆行进的垂直方向上偏移较小的特点,将2维图像校正问题转化为1维匹配问题,与待校正的车钩缓冲图像进行基于DTW的区域匹配,实现关键部件所在区域的区域划分,在对应的区域内分别进行校正,能够达到较高的校正精度。 将传统的车钩缓冲图像校正方法与本文方法进行校正精度对比,经验证,本文方法的均方误差比传统校正方法小20个像元,并且本文方法成功实现了关键部件的区域划分,为后面的关键部件识别奠定了基础。 经验证,本文校正方法适用于定向移动的复合刚体部件的区域校正,能够实现车钩缓冲图像中各个软连接部件的高精度校正,满足车钩缓冲图像校正的需要。  
      关键词:动态时间归整;区域匹配;货车故障轨边图像检测系统;降维;图像校正   
      2818
      |
      1197
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112319 false
      更新时间:2024-05-08
    • 大位移变分光流计算的快速算法

      刘博文, 魏伟波, 潘振宽, 王守润
      2017, 22(1): 66-74. DOI: 10.11834/jig.20170108
      摘要:多尺度方法的提出解决了传统HS(Horn Schunck)算法不能计算大位移光流的问题,但同时也增加了迭代运算的步数。为加快迭代收敛速度,研究大位移变分光流计算的快速算法,并分析其性能。 将用于加快变分图像处理迭代运算的Split Bregman方法、对偶方法和交替方向乘子法应用到大位移光流计算中。 分别进行了精度、迭代步数、运行时间的对比实验。引入3种快速方法的模型均能够在保证精度的同时,在较少时间内计算出图像序列的光流场,所需时间为传统方法的11%~42%。 将3种快速方法应用到大位移变分光流计算中,对于不同图像序列均可以较大地提高计算效率。  
      关键词:光流计算;大位移光流;多尺度方法;Split Bregman方法;对偶方法;交替方向乘子法   
      4200
      |
      1697
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113791 false
      更新时间:2024-05-08

      图像理解和计算机视觉

    • 结合背景信息的自适应加权压缩跟踪算法

      罗会兰, 严源, 张文赛
      2017, 22(1): 75-85. DOI: 10.11834/jig.20170109
      摘要:为了提高目标跟踪的准确度,提出结合背景信息的自适应加权压缩跟踪算法。 针对目标边缘背景信息的干扰问题,提出对目标框架分块提取特征,根据区域分配权值,弱化特征提取过程中背景信息的干扰;利用正负样本特征概率分布的Bhattacharyya距离,自适应地选取区分度较大的特征进行分类器训练,提高分类器的鲁棒性;针对目标遮挡导致分类器分类不准确问题,提出设置目标遮挡检测机制,结合目标和局部背景信息对目标实现遮挡环境下的跟踪。 与目前较流行的5种算法在6个具有挑战性的序列中进行比较,本文提出的算法平均跟踪率达到90%,平均每帧耗时0.088 6 s。 本文算法在背景干扰,光线变换,目标旋转、形变、遮挡和复杂背景环境下的跟踪具有较高鲁棒性。  
      关键词:压缩跟踪;目标跟踪;自适应加权;Bhattacharyya距离;目标检测;背景信息   
      2308
      |
      1360
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114212 false
      更新时间:2024-05-08
    • 刚体碎块的断裂面匹配

      赵夫群, 周明全, 耿国华
      2017, 22(1): 86-95. DOI: 10.11834/jig.20170110
      摘要:刚体碎块匹配已经在考古、生物工程以及遥感数据处理等领域得到了较为广泛的应用,为了进一步提高碎块匹配的精度、速度和算法的抗噪性,提出一种先粗配再细配的刚体碎块匹配方法。 首先采用基于显著性区域的碎块断裂面匹配方法实现碎块的粗匹配,然后通过加入高斯概率模型、角度约束和动态迭代系数的方式来改进迭代最近点(ICP)算法,并采用该算法来实现两个刚体碎块断裂面的细匹配,从而完成两个碎块的最终精确匹配。 通过分别对公共碎块数据集和带有噪声的秦俑碎块数据模型的匹配实验结果表明,与ICP(iterative closest point)算法和概率迭代最近点(PICP)算法相比,提出的改进ICP算法在精度方面分别提高了约50%和15%,在速度方面分别提高了约65%和50%,是一种精度更高、速度更快、抗噪性更强的点集匹配算法。 该方法不仅能够实现公共碎块数据集的完美匹配,而且对于秦俑这种特殊的刚体碎块也具有良好的匹配效果,会有更加广阔的应用领域和发展前景。  
      关键词:碎块匹配;显著性区域;迭代最近点;高斯概率模型;角度约束;动态迭代系数   
      2912
      |
      1471
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112202 false
      更新时间:2024-05-08

      计算机图形学

    • 步态驱动的四足动物低维物理运动生成方法

      谢文军, 杨智为, 刘晓平
      2017, 22(1): 96-107. DOI: 10.11834/jig.20170111
      摘要:为了解决四足动物运动数据难以获取的问题,建立一种快速易用的四足动物运动重建和制作途径,提出了一种面向四足动物的实时低维运动生成方法。 首先,建立以质点、刚体和弹簧为基础的低维物理解算器,将四足动物骨架抽象为低维物理模型;其次,依据步态模式建立足迹约束,自脚向上分肢体求解全身物理质点的运动信息;最后,依据通用约束修正后的质点位置,反算全身动画骨骼节点,生成目标运动。 针对不同步态、不同体型、不同风格的四足动物进行多组实验,本文方法能够达到330帧/s的生成速度,且具备良好的视觉效果和通用性。 本文方法的输入数据易于学习和获取,计算过程实时稳定,可以快速生成符合视觉真实感的多风格运动数据。  
      关键词:角色动画;四足动物;运动生成;低维物理模型;步态   
      3926
      |
      1617
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56111079 false
      更新时间:2024-05-08

      全国第27届CACIS学术会议栏目

    • 无人机影像物方多视匹配算法

      于英, 张永生, 薛武, 莫德林
      2017, 22(1): 108-114. DOI: 10.11834/jig.20170112
      摘要:像方无人机影像多视匹配方法忽视了影像之间的几何关系,而以MVLL(multi-view vertical line locus)为代表的物方多视匹配方法缺乏对地形之间相互约束的考虑。为此构建一种融合两类多视匹配方法优点的无人机影像物方多视匹配算法。 在MVLL匹配结构的基础上添加半全局匹配的相容性约束,不仅继承了原半全局算法对有弱纹理区域匹配效果好和物体边缘突出的优点,而且摆脱了需制作核线影像的繁琐过程;采用物方窗口SNCC(summed normalized cross correlation)一致性匹配测度计算方法,有效降低摄影角度和遮挡对匹配结果的影响;采用金字塔分层的策略以提高匹配的速度和可靠性。 选取自主研制的旋翼无人机三轴稳定平台获取了高分辨率无人机影像作为实验数据,从匹配效果、新匹配测度性能和匹配精度3个方面对算法进行了测试实验。本文算法整体匹配效果良好,物方窗口SNCC一致性匹配测度可有效消除匹配测度中的粗差,经过测定本文匹配算法生成的点云数据的高程精度为0.049 m,即约为1个GSD(ground space resolution)对应的地面大小。 本文算法充分利用了无人机影像的多视信息进行匹配计算,具有匹配效果好、鲁棒性强和匹配精度高的优势。  
      关键词:无人机影像;多视匹配;半全局;SNCC一致性匹配测度   
      4666
      |
      1925
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113519 false
      更新时间:2024-05-08
    • 多失真混杂的无人机图像质量盲评价

      李从利, 薛松, 陆文骏
      2017, 22(1): 115-125. DOI: 10.11834/jig.20170113
      摘要:面向多失真混杂的图像质量盲评价问题目前仍然是计算机视觉领域具有挑战性的工作之一,无人机图像受成像条件影响混杂多类失真,图像质量的准确评价是其效能发挥的关键环节。为此,引入并改进了基于自然场景统计的距离度量评价模型,提出多失真混杂的无人机图像质量盲评价方法。 从图像的结构性、信息完整性和颜色性3个不同的角度研究并提取了与无人机图像质量敏感的特征因子集;以实拍标准测绘图像库为原始图像获得MVG特性参数作为度量基准解决了盲评价中缺乏训练集的问题;构建了以实飞图像为样本的无人机图像质量数据库(UAV image set),为相关问题的研究提供数据集和评价参考。 针对所构建的数据库,本文算法在主客观一致性、算法运行时间上与其他算法进行了对比实验。相比较其他经典算法,本文算法的主客观一致性较高,达到了0.8以上,运行时间较快,过到1.2 s。此外本文还给出了块大小对算法影响以及单特征对图像的评价结果,证明算法选择的图像块大小和图像特征符合质量评价的需要。 针对无人机图像所包含的多失真构建质量评价综合模型,该模型可满足无人机图像质量需求。  
      关键词:无人机图像;多失真混杂;图像质量评价;自然场景统计   
      4889
      |
      1928
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114360 false
      更新时间:2024-05-08
    • 非合作面部晃动情况下的心率检测

      戚刚, 杨学志, 吴秀, 霍亮
      2017, 22(1): 126-136. DOI: 10.11834/jig.20170114
      摘要:心率是直接反映人体健康的重要指标之一,基于视频的非接触式心率检测在医疗健康领域具有广泛的应用前景。然而,现有的基于视频的方法不适用于复杂的现实场景,主要原因是没有考虑视频中目标晃动干扰和空间尺度特征,使得血液容积脉冲信号提取不准确,检测精度不尽人意。为了克服以上缺陷,提出一种抗人脸晃动干扰的非接触式心率检测方法。 本文方法主要包含3个步骤:首先,针对目标晃动干扰人脸区域选择的问题,利用判别响应图拟合检测参考图像的人脸区域及主要器官特征点,在人脸跟踪时首次引入倾斜校正思想,输出晃动干扰抑制后的人脸视频;然后,结合空间尺度的差异,采用颜色放大方法对晃动干扰抑制后的人脸视频进行时空处理,提取干净的血液容积脉冲信号;最后,考虑到小样本问题,通过傅里叶系数迭代插值的频域分析方法估计心率。 在人脸静止的合作情况以及人脸晃动的非合作情况下采集视频,对心率检测结果进行定量分析,本文方法在两种情况下的准确率分别为97.84%和97.30%,与经典和最新的方法相比,合作情况准确率提升大于1%,非合作情况准确率提升大于7%,表现了出色的性能。 提出了一种基于人脸视频处理的心率检测方法,通过有效分析人脸的晃动干扰和尺度特性,提取到干净的血液容积脉冲信号,提高了心率检测的精度和鲁棒性。  
      关键词:血液容积脉冲;判别响应图拟合;倾斜校正;视频颜色放大;心率估计   
      5406
      |
      1936
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112007 false
      更新时间:2024-05-08
    • 肺实质CT图像细化分割

      曲彦, 魏本征, 尹义龙, 楚陪陪, 丛金玉
      2017, 22(1): 137-145. DOI: 10.11834/jig.20170115
      摘要:由于肺部CT图像中各组织结构复杂、灰度分布不均匀,造成肺实质部分难以准确分割和提取。为了提高肺实质分割的准确率,本文提出了一种基于超像素的细化分割与模糊C均值聚类相结合的自动分割算法。 该算法充分利用肺部CT图像的灰度、纹理特征,同时为了正确标记超像素的分类,引入一种空间邻域信息来增强空间约束进而有效地解决灰度不均匀的问题,它能够对肺实质进行分割并除去其周围的主血管,然后利用形态学知识去除肺部的分支血管。 在临床患有四类疾病的患者CT图像数据集上采用改进的图像特征,使得肺实质分割的准确率提高了0.8%。同时,算法准确率提高到99.46%。 实验结果表明,本文算法能够实现肺部CT图像肺实质的自动细化分割,结果准确适用。该算法鲁棒性好、速度快,是一种精确有效的自动肺实质分割方法。  
      关键词:肺实质分割;超像素;CT图像;模糊C均值聚类;细化分割   
      9745
      |
      2266
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113167 false
      更新时间:2024-05-08
    0