最新刊期

    2016 21 6

      图像处理和编码

    • 区域拟合的背景去除图像分割模型

      陈鹏翔, 杨晟院
      2016, 21(6): 683-690. DOI: 10.11834/jig.20160601
      摘要:图像分割是图像处理领域的重要研究内容之一,且应用广泛。在基于PDE和变分法的图像分割方法中,大部分图像分割模型的能量泛函均为非凸性,较容易陷入局部极小解,因而分割结果往往不尽如人意,且运算时间较慢。为此,本文根据背景去除模型的思想结合区域拟合的方法,提出了一种区域拟合的背景去除图像分割模型。 首先对背景去除模型进行改造;再结合区域拟合的方法对模型进行改进,并对改进模型进行凸优化处理;最后结合水平集和Split Bregman法对改进模型进行快速求解,获得全局最小值解。 针对改进模型在分割效果、计算效率及初始化位置对实验结果的影响这3个方面了进行数值实验,相较于ICV(improved Chan-Vese)模型、LK(Li-Kim)模型及CV(Chan-Vese)模型,本文模型能得到更优的分割效果,且在分割效果相似的情况下,本文模型较RSF(region-scalable fitting)模型耗时更短,同时当实验初始化位置不同时,实验亦能取得良好的分割效果。 在对于MRI(magnetic resonance imaging)图像以及合成图像等进行处理时,本文所给出的模型不仅能获得良好的分割效果,并且效率较高,而且从实验结果来看,本文模型具有一定的鲁棒性。  
      关键词:图像分割;区域拟合;凸优化;全局最小解;水平集;Split Bregman   
      3098
      |
      632
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112754 false
      更新时间:2024-05-07
    • 多模图像交叉双域滤波算法

      魏宁, 杨元琴, 董方敏
      2016, 21(6): 691-697. DOI: 10.11834/jig.20160602
      摘要:为解决目前多模图像时域联合滤波算法对图像细节信息保持较差的问题,提出一种多模图像交叉双域滤波算法。 在时域中使用交叉双边带滤波,通过多模图像边界上的信息互补保持边缘信息,然后对图像残量使用小波收缩算法恢复细节信息并叠加到时域滤波结果中。在此基础上构造时域和频域交替迭代并通过逐步递减缩小滤波核的范围获得最终滤波结果。 通过对多模医学图像和自然多模图像进行测试,相比目前联合滤波算法和单模双域算法,本文算法在峰值信噪比(PSNR)和视觉上都有较明显提高。 算法能够有效利用多模图像之间的互补信息,同时通过迭代有效抑制振铃负效应,将时域滤波及频率滤波的优势进行结合,使得滤波结果在保持高对比边缘的同时对图像细节也进行了较好的保留。并且该算法适用于所有含噪多模图像。  
      关键词:图像去噪;多模图像;双边带滤波;小波收缩;短时傅里叶变换   
      3263
      |
      574
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114426 false
      更新时间:2024-05-07
    • 整合ChaCha20哈希运算的分块扩散自适应图像加密算法

      宋金林, 张绍武
      2016, 21(6): 698-710. DOI: 10.11834/jig.20160603
      摘要:针对数字图像网络传输安全性和混沌加密算法自适应差的问题,提出一种基于ChaCha20哈希运算的分块扩散自适应图像加密算法(BDCH)。 BDCH算法首先通过分段线性混沌映射(PWLCM)产生的混沌序列填充明文图像,使其成为方形图像;其次,利用初始输入密钥及明文图像总和,通过ChaCha20哈希运算生成8×8的初始哈希矩阵,并与PWLCM混沌映射生成的伪随机序列作用,联合产生哈希密钥矩阵,PWLCM的迭代初值选取为初始密钥矩阵均值、初始密钥及明文图像归一化均值;然后,利用Arnold和PWLCM映射同步置乱扩散整幅图像,并分成互不重叠的8×8大小图像块;最后,采用哈希密钥矩阵对图像块进行两轮扩散,完成图像加密。 灰度及彩色图像的计算机仿真与性能分析表明,BDCH算法的信息熵、峰值性噪比、密钥敏感性指标优于其他加密算法,并且解决了直接使用初始哈希矩阵会产生的弱密钥问题,密钥空间大。 结合同步置乱扩散和哈希密钥矩阵非线性分块扩散的BDCH算法可有效抵抗各种攻击,安全性高、自适应性强,适合各种类型的灰度及彩色图像加密,潜在应用价值大。  
      关键词:ChaCha20哈希运算;置乱;扩散;分块;图像加密   
      2571
      |
      411
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56117859 false
      更新时间:2024-05-07
    • 视觉信息损失先验的图像分层去雾方法

      胡子昂, 王卫星, 陆健强, 石颖
      2016, 21(6): 711-722. DOI: 10.11834/jig.20160604
      摘要:针对自然场景下含雾图像呈现出低对比度和色彩失真的问题,提出一种基于视觉信息损失先验的图像去雾算法,将透射图预估转化成求解信息损失函数最小值的目标规划问题。 首先通过输入图像的视觉特性将图像划分成含雾浓度不同的3个视觉区域。然后根据含雾图像的视觉先验知识构造视觉信息损失函数,通过像素值溢出映射规律对透射率取值范围进行约束,采用随机梯度下降法求解局部最小透射率图。最后将细化后的全局透射率图代入大气散射模型求解去雾结果。 结合现有的典型去雾算法进行仿真实验,本文算法能够有效地复原退化场景的对比度和清晰度,相比于传统算法,本文算法在算法实时性方面提升约20%。 本文算法在改善中、浓雾区域去雾效果的同时,提升了透射图预估的效率,对改善雾霾天气下视觉成像系统的能见度和鲁棒性具有重要意义。  
      关键词:图像去雾;视觉信息损失先验;目标规划;透射图分层;人类视觉感知   
      2416
      |
      483
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56112874 false
      更新时间:2024-05-07

      图像分析和识别

    • 视觉注意机制下结合语义特征的行人检测

      黎宁, 龚元, 许莙苓, 顾晓蓉, 徐涛, ZhouHuiyu
      2016, 21(6): 723-733. DOI: 10.11834/jig.20160605
      摘要:为研究多场景下的行人检测,提出一种视觉注意机制下基于语义特征的行人检测方法。 首先,在初级视觉特征基础上,结合行人肤色的语义特征,通过将自下而上的数据驱动型视觉注意与自上而下的任务驱动型视觉注意有机结合,建立空域静态视觉注意模型;然后,结合运动信息的语义特征,采用运动矢量熵值计算运动显著性,建立时域动态视觉注意模型;在此基础上,以特征权重融合的方式,构建时空域融合的视觉注意模型,由此得到视觉显著图,并通过视觉注意焦点的选择完成行人检测。 选用标准库和实拍视频,在Matlab R2012a平台上,进行实验验证。与其他视觉注意模型进行对比仿真,本文方法具有良好的行人检测效果,在实验视频上的行人检测正确率达93%。 本文方法在不同的场景下具有良好的鲁棒性能,能够用于提高现有视频监控系统的智能化性能。  
      关键词:行人检测;视觉注意模型;语义特征;显著图;肤色;运动矢量熵值   
      3530
      |
      573
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113983 false
      更新时间:2024-05-07
    • 城市交叉路口背景提取与车道标定算法

      高飞, 梅凯城, 高炎, 卢书芳, 肖刚
      2016, 21(6): 734-744. DOI: 10.11834/jig.20160606
      摘要:为解决车辆对车道标记的遮挡问题,提出一种新的背景提取算法,同时基于透视变换实现了城市交叉路口的多车道标定。 首先,通过均值与帧间差分方法的融合,进行城市交叉路口的背景稳定与更新;然后,利用Canny算子及Hough直线检测得到各类直线;其次,基于透视变换、聚类分析和先验知识建立了车道线的筛选数学模型,实现了车道线标定;最后,通过实验对算法进行了验证。 采用10min长度、分辨率为2592×2048像素的某城市交叉路口实际监控视频进行交叉路口背景提取。本文算法的背景提取准确率比均值法和传统高斯混合模型法分别提升20%和30%左右,车道线标定也优于其他类似方法。 算法具有收敛速度快、准确率较高、稳定性较好等特点,在车流量大时可快速更新并消除车辆虚影,适用于光照条件正常的城市交叉种口的车道线标定。  
      关键词:视频处理;背景提取;透视变换;背景差分;车道标定   
      2621
      |
      571
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115380 false
      更新时间:2024-05-07
    • 利用选择性模型不定时更新的视觉跟踪算法

      范舜奕, 管桦, 侯志强, 余旺盛, 戴铂
      2016, 21(6): 745-755. DOI: 10.11834/jig.20160607
      摘要:在目标跟踪中,基本粒子滤波算法和传统模型更新策略在遮挡、光照变化以及自身旋转等情况下通常存在鲁棒性较差的问题。为解决该问题,提出一种基于选择性模型不定时更新的粒子滤波视觉跟踪算法。 本文算法在粒子滤波框架下,定时检测目标变化,采用最速梯度下降法判断更新时机。仅当目标本身逐渐姿态改变而不受背景干扰时更新目标模型;在发生遮挡或光照改变较大时则不更新,保持当前模型继续跟踪。 通过对示例视频的计算机视觉跟踪,在跟踪目标中心位置误差、覆盖率、精度及成功率比较上,本文算法均能表现出较优的实验结果,这表明:本文算法能够对目标模型进行选择性更新,与对比算法比较,总体能够更加有效解决视频中遮挡、光照变化以及自身旋转等情况下的鲁棒跟踪问题。 由于本文算法未考虑尺度,在尺度不变的多种复杂变化条件下,本文算法均具有较好的鲁棒性。  
      关键词:目标跟踪;粒子滤波;最速梯度下降法;定时检测;选择性;不定时模型更新   
      2425
      |
      503
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56113836 false
      更新时间:2024-05-07
    • 偏振编码方式的LDP人脸识别算法

      魏莉, 蒋建国, 齐美彬
      2016, 21(6): 756-763. DOI: 10.11834/jig.20160608
      摘要:局部二值模式(LBP)作为一种简单高效的纹理特征描述算子,被广泛地应用在纹理分类和人脸识别中。针对LBP及其改进算法局部导数模式(LDP)对噪声敏感的问题,以及仅利用局部像素差分的符号信息进行二值量化提取的纹理特征信息单一的问题,提出一种基于偏振编码方式的LDP改进算法。 首先,提取改进的LDP局部一阶差分信息;然后,构建人脸Stokes矢量图像;其次,按照偏振方位角的编码方式提取人脸图像的多方向纹理特征;最后,分块加权统计各子块的直方图向量得到最终的人脸特征向量。 在ORL和YALE两个人脸库中进行实验,得到97.4%,92.22%的正确识别率,所用时间与LBP和LDP算法相差无几。当样本数目较大时,复杂度低于LBP方法。在存在高斯噪声和椒盐噪声的情况下,分别得到了93.88%、86.27%和96.13%、84.71%的识别率,均高于LBP算法和LDP算法。 本文提出的偏振编码方式的人脸识别算法提取的人脸纹理特征更加丰富,即使在噪声干扰下仍具有较高的识别率,并且对于其他的纹理分类、目标识别也具有一定的参考价值。  
      关键词:人脸识别;纹理特征;偏振角;局部导数模式;局部二值模式;直方图   
      3063
      |
      870
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115046 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 多重约束下的近景影像线特征匹配方法

      宋伟东, 朱红, 王竞雪, 刘玉轩
      2016, 21(6): 764-770. DOI: 10.11834/jig.20160609
      摘要:针对影像匹配时提取特征线断裂而影响匹配结果及可靠性的问题,提出多重约束条件下的近景影像线特征匹配方法。 首先,采用SIFT算法获取同名点,并使用RANSAC算法进行优化,通过同名点计算仿射变换矩阵;建立格网点,利用仿射变换、Harris兴趣值及最小二乘法提高密集匹配结果的精度;其次,采取Freeman链码优先级算法提取直线,根据搜索区域内密集匹配点与直线位置关系完成特征线的初始匹配;最后通过线段重合度对初始匹配结果进行优化,并利用核线约束确定同名直线端点。 选取存在旋转、尺度、遮挡的近景影像进行线特征匹配实验,结果表明,与其他直线匹配方法相比,本文方法不仅在直线匹配成功数目上约为经典算法的1.07~4.1倍,而且直线匹配正确率也提升0.6%~53.3%,具有较好的准确性和鲁棒性。 通过多重约束有效地减小了立体影像中线特征匹配时的搜索范围,提高了直线匹配速率,且该方法适用于不同类型几何变化下的近景影像数据,并能较好地改善直线断裂及遮挡问题。  
      关键词:近景影像;直线匹配;Freeman链码;多重约束;密集匹配   
      2875
      |
      467
      |
      9
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115562 false
      更新时间:2024-05-07
    • 动态背景下的稀疏光流目标提取与跟踪

      兰红, 周伟, 齐彦丽
      2016, 21(6): 771-780. DOI: 10.11834/jig.20160610
      摘要:针对背景和摄像机同时运动情况下的运动目标提取与跟踪,提出一种基于稀疏光流的目标提取与跟踪新方法。 首先,利用金字塔LK光流法生成光流图像匹配相邻两幅图像的特征点,依据光流图像中的位移、方向等光流信息初步划分背景和前景目标的特征点;然后利用中心迭代法去除不属于目标运动区域的噪声特征点;最后,通过前帧图像目标特征点的最大交集得到属于目标的稳定特征点并在后续帧中进行跟踪。对于后续跟踪图像中存在的遮挡问题,引入了一个基于特征点的遮挡系数,运用Kalman预估算法得到目标位置的预测,并且在目标重新出现时能够迅速定位目标。 与已有的光流匹配算法相比,本文算法的目标特征点误检率降低了10%左右,成功跟踪率达到97%;引入预估器使得本文算法对有遮挡运动目标也能够实现准确跟踪和定位。 本文算法对复杂动态背景下无遮挡和有遮挡的持续运动目标跟踪均具有准确识别定位性能,满足实时要求,适用于缓慢或者快速移动的运动场景目标提取和目标跟踪。  
      关键词:稀疏光流;金字塔LK光流法;光流信息;Kalman预估算法;中心迭代法;动态背景;目标跟踪   
      3599
      |
      494
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115671 false
      更新时间:2024-05-07
    • 张量核范数回归的目标跟踪

      亚森江·木沙, 木合塔尔·克力木, 赵春霞
      2016, 21(6): 781-795. DOI: 10.11834/jig.20160611
      摘要:视觉目标跟踪中,不同时刻的目标状态是利用在线学习的模板数据线性组合近似表示。由于跟踪中目标受到自身或场景中各种复杂干扰因素的影响,跟踪器的建模能力很大程度地依赖模板数据的概括性及其误差的估计精度。很多现有算法以向量形式表示样本信号,而改变其原始数据结构,使得样本数据各元素之间原有的自然关系受到严重破坏;此外,这种数据表述机制会提高数据的维度,而带来一定的计算复杂度和资源浪费。本文以多线性分析的角度更进一步深入研究视频跟踪中的数据表示及其建模机制,为其提供更加紧凑有效的解决方法。 本文跟踪框架中,候选样本及其重构信号以张量形式表示,从而保证其数据的原始结构。跟踪器输出候选样本外观状态时,以张量良好的多线性特性来组织跟踪系统的建模任务,利用张量核范数及L范数正则化其目标函数的相关成分,在多任务状态学习假设下充分挖掘各候选样本外观表示任务的独立性及相互依赖关系。 用结构化张量表示的数据原型及其多任务观测模型能够较为有效地解决跟踪系统的数据表示及计算复杂度难题。同时,为候选样本外观模型的多任务联合学习提供更加简便有效的解决途径。这样,当跟踪器遇到破坏性较强的噪声干扰时,其张量核范数约束的误差估计机制在多任务联合学习框架下更加充分挖掘目标全面信息,使其更好地适应内在或外在因素所引起的视觉信息变化。在一些公认测试视频上的实验结果表明,本文算法在候选样本外观模型表示方面表现出更为鲁棒的性能。因而和一些优秀的同类算法相比,本文算法在各测试序列中跟踪到的目标图像块平均中心位置误差和平均重叠率分别达到4.2和0.82,体现出更好的跟踪精度。 大量实验验证本文算法的张量核范数回归模型及其误差估计机制能够构造出目标每一时刻状态更接近的最佳样本信号,在多任务学习框架下严格探测每一个候选样本的真实状态信息,从而较好地解决模型退化和跟踪漂移问题。  
      关键词:多线性分析;张量核范数回归;模型表示;误差估计;目标跟踪   
      2939
      |
      544
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114802 false
      更新时间:2024-05-07

      计算机图形学

    • 约束规则下的城市线路变形

      路强, 梁翀, 曹书博, 谭啸
      2016, 21(6): 796-804. DOI: 10.11834/jig.20160612
      摘要:针对现实中城市道路网的复杂性容易对人产生视觉干扰的缺点,提出一种规整道路的基于约束规则的自动布局变形算法。 将实际地图数据经过预处理得到将要布局的初始线路图,继而使用力导向算法将图中邻边的角度最大化,然后进行爬山算法迭代完成线路的方向限定。 通过实验结果及对比分析可知,在易读性、美观性、方便性和实用性这4个方面,平均有69.6%的用户觉得具有实际意义。同时与传统地图相比,在用户规划路径实验中,平均每组节省26.2%的时间。 本文基于约束规则的线路变形,缓解了城市线路复杂与人脑有限记忆力之间的矛盾,适用于城市公交与地铁换乘、快速定位、线路规划等,具有实际应用价值。  
      关键词:线路变形;线路布局;约束规则;电子地图;信息可视化   
      2359
      |
      757
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114886 false
      更新时间:2024-05-07

      虚拟现实与增强现实

    • 快速3维坐标变换的绘制算法

      汪辉, 彭宗举, 焦仁直, 陈芬, 郁梅, 蒋刚毅
      2016, 21(6): 805-814. DOI: 10.11834/jig.20160613
      摘要:基于深度图的绘制(DIBR)是一种新型的虚拟视点生成技术,在诸多方面得到了广泛的应用。然而,该技术还不能满足实时性的绘制需求。为了在保证绘制质量不下降的前提下,尽可能地提高绘制速度,提出了一种高效的3D-Warping(3维坐标变换)算法。 主要在以下3个方面进行了改进:1)引入了深度—视差映射表技术,避免了重复地进行视差求取操作。2)对深度平坦的像素块进行基于块的3D-Warping,减少了映射的次数。对深度非平坦像素块中的像素点采取传统的基于像素点的3D-Warping,保证了映射的准确性。3)针对两种不同的3D-Warping方式,分别提出了相应的插值算法。在水平方向上,改进的像素插值算法对紧邻插值和Splatting(散射)插值算法进行了折中,只在映射像素点与待插值像素点很近的情况下才进行紧邻插值,否则进行Splatting插值;在深度方向上,它对Z-Buffer(深度缓存)技术进行了改进,舍弃了与前景物体太远的映射像素点,而对其他映射像素点按深度值进行加权操作。 实验结果表明,与标准绘制方案的整像素精度相比,绘制时间平均节省了72.05%;与标准绘制方案的半像素精度相比,PSNR平均提高了0.355dB,SSIM平均提高了0.00115。 改进算法非常适用于水平设置相机系统的DIBR技术中的整像素精度绘制,对包含大量深度平坦区域的视频序列效果明显,不但能够提高绘制的速度,而且可以有效地改善绘制的客观质量。  
      关键词:自由视点视频;基于深度图的绘制;绘制;虚拟视点;3维坐标变换;像素插值   
      3086
      |
      548
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56115182 false
      更新时间:2024-05-07

      医学图像处理

    • GPU加速的交互式医学CT图像区域分割

      曹小鹏, 董梁
      2016, 21(6): 815-822. DOI: 10.11834/jig.20160614
      摘要:为了解决交互式医学CT图像区域分割问题,本文提出了基于证据推理规则的区域生长算法(ERRG)。 算法综合考虑了医学图像的灰度直方图,Gabor特征和灰度共生矩阵能量3个重要特征,采用Bhattacharyya系数度量相邻像素的相似程度,用效用函数将度量系数合并。针对算法计算效率较低问题,对算法进行并行化,采用GPU进行加速处理。 本文算法与基于Random-Walk图像分割算法针对医学CT胃部图像,进行对比实验,表明使用本文算法,真阳性目标像素数占目标区域所有正确像素数的比例(TPF)显著提高,背景像素错误地分割为目标像素的数目占背景正确像素数的比例(FPF)显著降低;通过GPU加速后,算法执行效率显著提高,加速比达到12。 本文算法减少了医学CT图像过分割现象,采用GPU加速后能够实现实时交互式医学CT图像分割。  
      关键词:GPU;医学图像;图像分割;区域生长算法;证据推理规则;并行计算   
      3126
      |
      578
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56116640 false
      更新时间:2024-05-07

      遥感图像处理

    • 基于目标优化的高光谱图像亚像元定位

      赵辽英, 范明阳, 厉小润, 陈辰
      2016, 21(6): 823-833. DOI: 10.11834/jig.20160615
      摘要:高光谱图像混合像元的普遍存在使得传统的分类技术难以准确确定地物空间分布,亚像元定位技术是解决该问题的有效手段。针对连通区域存在孤立点或孤立两点等特例时,通过链码长度求周长最小无法保证最优结果及优化过程计算量大的问题,提出了一种改进的高光谱图像亚像元定位方法。 以光谱解混结合二进制粒子群优化构建算法框架,根据光谱解混结果近似估计每个像元对应的亚像元组成,通过分析连通区域存在特例时基于链码长度求周长最小无法保证结果最优的原因,提出修改孤立区域的周长并考虑连通区域个数构造代价函数,最后利用二进制粒子群优化实现亚像元定位。为了减少算法的时间复杂度,根据地物空间分布特点,采用局部分析代替全局分析,提出了新的迭代优化策略。 相比直接基于链码长度求周长最小的优化结果,基于改进的目标函数优化后,大部分区域边界更明显,并且没有孤立1点和孤立两点的区域,识别率可以提高2%以上,Kappa系数增加0.05以上,新的优化策略可以使算法运算时间减少近一半。 实验结果表明,本文方法能有效提高亚像元定位精度,同时降低时间复杂度。因为高光谱图像中均匀混合区域不同地物的分布空间相关性不强,因此本文方法适用于非均匀混合的高光谱图像的亚像元定位。  
      关键词:二进制粒子群优化;高光谱图像;亚像元定位;空间相关性;光谱解混   
      2878
      |
      468
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56114994 false
      更新时间:2024-05-07
    0