最新刊期

    2012 17 8

      综述

    • 可计算图像美学研究进展

      王伟凝, 蚁静缄, 贺前华
      2012, 17(8): 893-901. DOI: 10.11834/jig.20120801
      摘要:可计算图像美学研究目的是希望计算机能够模拟人类的视觉系统与审美思维对图像进行美学价值的判断。其研究成果可以应用到融合主观感知的基于语义的图像检索、图像美学质量评估、图像的美学修正、摄影的美学预测、艺术作品风格分析、人机交互等方面。该研究涉及美学、艺术、认知科学、计算机科学、心理学等多个学科,属于多学科交叉的创新性前沿研究课题,具有重要的理论研究价值和应用前景。总结国际上最新研究成果,对该研究的常用方法和存在问题进行了系统的分析及综述,给出了可计算图像美学分析研究的一般框架,对图像的审美度量、美学视觉特征提取和美学推导等关键技术,以及图像美学的应用与发展前景等进行了详细讨论,并且针对当前研究存在的问题提出关键的解决方案。  
      关键词:图像美学;美学视觉特征;美学度量;美学分类   
      4693
      |
      102
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126356 false
      更新时间:2024-05-08

      图像处理和编码

    • 利用混沌PSO或分解的2维Tsallis灰度熵阈值分割

      吴一全, 吴诗婳, 张晓杰
      2012, 17(8): 902-910. DOI: 10.11834/jig.20120802
      摘要:现有最大Shannon熵或Tsallis熵阈值选取方法没有从类内灰度均匀性出发,而仅依据图像灰度直方图,并且Tsallis熵法的分割效果通常优于Shannon熵法。为此,提出了基于混沌粒子群优化(PSO)和基于分解的两种2维Tsallis灰度熵阈值分割方法。首先,给出了1维Tsallis灰度熵阈值选取方法并将其推广到2维,导出了相应的2维Tsallis灰度熵阈值选取公式及其递推算法;其次,利用混沌PSO算法搜寻2维Tsallis灰度熵法的最佳阈值,并采用递推方式去除迭代过程中适应度函数的冗余运算,大大提高了运行速度;最后,将2维Tsallis灰度熵阈值选取方法的运算转化为两个1维Tsallis灰度熵法的运算,计算复杂度从O()进一步降低到O()。实验结果表明,与2维最大Shannon熵法、2维最大Tsallis熵法及2维Tsallis交叉熵法相比,所提出的两种方法可以大幅提高图像分割质量和算法运行速度。  
      关键词:图像分割;阈值选取;2维Tsallis灰度熵;混沌粒子群优化;分解;递推算法   
      3570
      |
      69
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126380 false
      更新时间:2024-05-08
    • H.264并行编码中负载平衡方法

      侯兴松, 刘大齐, 盛凯, 顿玉洁
      2012, 17(8): 911-918. DOI: 10.11834/jig.20120803
      摘要:针对在多核处理器上Slice并行编码H.264高清视频中的负载不平衡问题,首先利用已编码帧的编码统计信息,根据帧间时间相关性预测下一帧各宏块的编码负载,然后据此预测的编码负载划分Slice,使各个处理器核上编码的Slice具有相接近的计算负载,从而达到动态负载平衡目的。在Tile64多核平台上的实际测试结果表明,与传统的基于宏块区域的动态数据分配算法相比,该方法可以将编码并行加速比和并行效率提高5%左右。  
      关键词:H.264;并行编码;多核处理器;负载平衡   
      2829
      |
      52
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126404 false
      更新时间:2024-05-08
    • 提升细节捕捉能力的非下采样轮廓波变换

      郭洪, 李雪军
      2012, 17(8): 919-922. DOI: 10.11834/jig.20120804
      摘要:针对传统NSCT(非下采样轮廓波变换)算法中NSP(多尺度分解方法)对细节信息捕捉能力较差及利用其进行图像融合得到的融合图像出现细节丢失问题,提出改进的NSCT算法。不同于传统NSCT算法,该算法首先采用细节捕捉能力较强的非下采样形态学小波分解替代NSP分解,实现对源图像的多尺度分解,将源图像分解成水平高频、垂直高频、对角高频和低频4部分;然后利用NDFB(非下采样的方向性滤波器)对高频部分进行多方向分解得到一系列高频信息,实现改进型NSCT分解。实验结果表明,该算法的细节捕捉能力较传统算法好,在相同融合规则下其图像融合效果更好,各项融合指标值均有所提高,其中平均梯度提高了10%,且易于实现,可广泛用于多分辨率图像融合,是一种有效的融合图像算法。  
      关键词:非下采样轮廓波变换;形态学小波分解;图像融合;边缘检测   
      3247
      |
      40
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126112 false
      更新时间:2024-05-08
    • SVD域的图像高斯噪声强度估计

      柳薇
      2012, 17(8): 923-933. DOI: 10.11834/jig.20120805
      摘要:精确估计图像或视频中的噪声强度对于后续的信号处理是至关重要的先决条件。通过对含噪图像的奇异值特性的研究,提出一种精确的SVD域的图像噪声强度估计算法。该算法对噪声强度估计提出了创新的解决方法:1)利用奇异值的尾部数据进行噪声强度估计,这样达到尽可能地降低图像信息对噪声估计的干扰;2)对含噪图像加入已知强度的高斯白噪声,以计算噪声估计时需要设置的与图像内容相关的参数,因此该算法可以自适应图像的结构,能够广泛地适应各种类型的图片。实验结果表明SVD域噪声强度估计算法适用于各种图片类型,而且在极大的噪声强度范围内都能够稳定精确地估计噪声强度。  
      关键词:噪声估计;高斯白噪声;奇异值分解;图像处理   
      4338
      |
      64
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126278 false
      更新时间:2024-05-08
    • 图像扩散去噪模型的分析与改进

      傅绪加, 刘峰, 王信松
      2012, 17(8): 934-945. DOI: 10.11834/jig.20120806
      摘要:总结与分析了已有图像扩散去噪模型的优缺点。在理论上明确解释了张量型扩散模型的物理意义,通过分析P-M扩散模型的局部扩散行为,提出一个新的扩散系数,进一步给出一个改进的张量型扩散模型。从主观与客观两个方面比较各种扩散去噪模型的效果都不容易,因为需要合适耦合各个模型的参数及数值离散方法等,为此给出了扩散模型统一的数值实现算法,可用来比较各个模型的去噪效果。数值模拟实验的结果表明,改进的扩散模型在有效去除噪声的同时,能很好地对图像中的边缘、角点、纹理等特征进行保护,去噪后的图像有较好的视觉效果。  
      关键词:扩散去噪模型;扩散系数;角点;纹理   
      4033
      |
      82
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125738 false
      更新时间:2024-05-08
    • 小波域最小嵌入失真函数设计及其在隐写中的应用

      李军, 潘峰, 杨晓元, 刘镇
      2012, 17(8): 946-952. DOI: 10.11834/jig.20120807
      摘要:为了提高隐写方案的安全性,提出一种基于最小嵌入失真原理和网格码的图像隐写算法。首先在离散小波域结合人眼视觉特性和整数提升小波变换设计了失真测度函数,主要考虑了亮度、频率和纹理掩蔽因子对载体失真的影响。然后结合网格码设计了隐写算法,将嵌入信息对载体的修改最小化并且集中在人眼不敏感区域。实验结果显示,方案具有良好的视觉不可见性,且能抵抗空域、小波域等隐写分析的攻击,安全容量达到0.4 bits/pixel。  
      关键词:隐写;最小嵌入失真;网格码;人眼视觉特性;整数提升小波   
      2699
      |
      48
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125598 false
      更新时间:2024-05-08

      图像分析和识别

    • 抗压缩的照片图像与真实感计算机图形识别

      张荣, 王让定
      2012, 17(8): 953-959. DOI: 10.11834/jig.20120808
      摘要:数字图像取证是计算机取证、信息安全领域的一门新学科。为实现照片图像与真实感计算机图形的可靠识别,提出一种基于图像稀疏表示的数字图像取证方法,该方法在抵抗压缩方面具有较好性能,从而保证图像压缩不会改变照片图像与真实感计算机图形的真实性本质。Tetrolet变换为保护图像局部几何结构,在L-范数最小约束下搜索4×4图像块的最优覆盖(Covering)形式,获得图像的稀疏表示。观察自适应值c的统计分布,得到一幅图像中117种Covering出现次数的归一化直方图,从而得到图像的HoC(histogram of covering)特征。实验结果表明,在饱和度(S)分量提取的HoC特征能够很好地刻画照片图像与真实感计算机图形在局部几何结构上的不同统计特性,算法在识别能力、泛化能力,尤其是抵抗压缩能力上表现出良好性能,能够应用于图像真实性检测及照片图像与计算机图形的自动分类。  
      关键词:图像稀疏表示;tetrolet变换;数字图像取证;抗压缩   
      2601
      |
      45
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56127220 false
      更新时间:2024-05-08
    • 云的自适应阈值检测方法

      黄茜, 王少龙, 徐道磊, 廖婷婷
      2012, 17(8): 960-965. DOI: 10.11834/jig.20120809
      摘要:为确保夜间自动拍摄的星空观测图像不受云污染,须对低亮度和对比度不均的夜空图像进行检测。考虑现有云检测不准和检测精度低等问题,文中对大量样本统计分析,发现星体邻域出现云的概率低,密集星体区域出现云的概率也低。根据先验概率建立了一个自适应阈值模型,即不同图像所用阈值由模型根据星云局部背景自动计算调节。通过随机抽取以月为周期的一系列星空图像,分析其天空背景,证明该自适应阈值的变化与整体图像背景灰度的变化趋势相吻合。实验结果表明本文方法对夜空云检测准确度达95%以上,较文中对比的算法有很大提高,并投入实际应用。  
      关键词:云检测;先验知识;自适应;阈值   
      2988
      |
      73
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126571 false
      更新时间:2024-05-08
    • 煤矸区分中的间隔灰度压缩扩阶共生矩阵

      于国防
      2012, 17(8): 966-970. DOI: 10.11834/jig.20120810
      摘要:为了有效提高共生矩阵惯性矩在图像纹理分析及检索中的作用,在常规纹理分析方法的基础上,研究了一种基于间隔灰度压缩的扩阶共生矩阵惯性矩。该方法采用对原图像的灰度信息进行部分压缩和部分保留的综合处理方式,并通过矩阵的扩阶提取未压缩的灰度信息,达到灰度信息随机与有序兼容利用的效果。实验结果表明,该算法比基于图像全局灰度压缩的常规共生矩阵惯性矩具有更大的目标类型区分度,其目标区分正确率大于82%,也更容易设置相应的区分阈值,而且具有较高的图像分析实时性。  
      关键词:块煤与矸石区分;图像纹理;间隔灰度压缩;扩阶共生矩阵惯性矩   
      2502
      |
      36
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126615 false
      更新时间:2024-05-08
    • 离群样本划分的半监督模糊学习策略

      宋晓宁, 杨静宇, 杨习贝
      2012, 17(8): 971-978. DOI: 10.11834/jig.20120811
      摘要:建立一种离群样本划分的半监督模糊学习算法模型。首先,提出一种基于Hopfield参数估计的松弛条件模糊鉴别分析算法,重新定义每一个样本的隶属度,并在特征抽取的过程中,根据隶属度对散布矩阵的定义所做的贡献获得每个样本相应的类别信息,由此获得普通样本分类信息。其次,根据样本隶属度的分布信息划分出离群样本空间,将普通样本分类结果作为离群样本聚类的先验类属信息,并对该空间样本提出一种新的半监督模糊学习策略进行动态聚类。该算法同时具备了监督学习和无监督学习方法的优势,克服了传统聚类缺乏类过程知识的缺点,可以有效地解决特征空间中特殊样本的分类问题。性能分析表明,该方法优于单一的特征抽取方法,在NUST603、ORL、XM2VTS和FERET人脸数据库上的识别性能均得到有效提高。  
      关键词:特征抽取;模糊线性鉴别分析;离群样本;半监督学习;图像识别   
      3435
      |
      42
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126705 false
      更新时间:2024-05-08
    • 多相Chan-Vese模型的直接对偶方法

      刘存良, 潘振宽, 郑永果, 王国栋, 丁洁玉
      2012, 17(8): 979-986. DOI: 10.11834/jig.20120812
      摘要:多相图像分割的变分模型采用水平集函数定义不同区域的特征函数,其极值问题需要迭代求解一系列动态演化方程,计算效率低。较快的方法是对离散的二值标记函数凸松弛后设计对偶方法或Split Bregman方法,并结合阈值化技术得到分割结果。提出一种无需凸松弛和阈值化的快速分割方法—直接对偶方法(DDM)。DDM利用二值标记函数的二值特性,并根据KKT条件得到原变量的二值解析解和对偶变量的简单迭代格式。该方法首先应用到两相Chan-Vese模型,然后拓展到多相Chan-Vese模型。实验结果表明,DDM比梯度降方法、对偶方法和Split Bregman方法分割效果好、计算效率高。  
      关键词:多相图像分割;Chan-Vese模型;二值标记函数;凸松弛;对偶方法   
      3215
      |
      52
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125674 false
      更新时间:2024-05-08
    • 利用梯度信息快速提取直线边缘特征

      夏军营, 徐小泉, 熊九龙
      2012, 17(8): 987-994. DOI: 10.11834/jig.20120813
      摘要:立足于视觉检测系统的实时性需要,提出一种利用梯度信息的快速直线边缘提取方法。该方法首先利用梯度信息和两点确定一条直线进行线段基元的快速定位和扫描;然后对扫描得到的线段基元进行基于几何距离最小化的最佳直线拟合;最后使用端点投影距离的方法对线段基元进行共线性检测,连接共线的线段基元并对连接结果重新进行最佳直线拟合,得到最终的直线边缘特征。实验结果表明:该方法进行直线边缘特征提取的速度比目前文献中最快的Hough变换改进算法提高了1倍左右,适应能力强,可以满足视觉检测系统对直线边缘特征提取的实时性和精度要求。  
      关键词:计算机视觉;直线检测;梯度;线段基元;直线拟合   
      3299
      |
      90
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125712 false
      更新时间:2024-05-08
    • 2维双树复小波不确定度加权融合的人脸识别

      王仕民, 叶继华, 邓涛, 王明文
      2012, 17(8): 995-1001. DOI: 10.11834/jig.20120814
      摘要:在人脸识别中,传统小波、Gabor小波不能很好地表征人脸特征。提出2维双树复小波多频带不确定度加权融合的人脸识别算法,使用了人脸2维双树复小波多频带特征,计算多频带不确定度及其权值并结合多频带特征进行加权融合,能很好得到人脸的特征。该加权融合算法首先计算人脸2维双树复小波多个频带特征图,然后计算多个频带滤波不确定度权值,最后进行加权融合。同时使用了2维主成分分析(2DPCA)方法对特征向量进行子空间投影,应用欧氏距离作为相似测度实现分类识别。使用英国剑桥Olivetti实验室(ORL)图像库进行了测试,实验结果表明,提出的方法相对于使用2DPCA、Wavelet和Gabor小波的特征提取方法,取得了更好的识别效果。  
      关键词:人脸识别;2维双树复小波;不确定度;2维主成分分析   
      2678
      |
      65
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126494 false
      更新时间:2024-05-08

      图像理解和计算机视觉

    • 流形学习与非线性回归结合的头部姿态估计

      范进富, 陈锻生
      2012, 17(8): 1002-1010. DOI: 10.11834/jig.20120815
      摘要:流形学习的目的是发现非线性数据的内在结构,可用于非线性降维。广义回归网络是人工神经网络的一种,可用于非线性回归。基于流形学习和非线性回归,提出了用于解决头部姿态估计的ManiNLR方法。该方法首先用流形学习对图像数据进行降维,然后用非线性回归的方法将数据映射到线性可分空间,利用非线性回归的结果对人脸的头部姿态进行估计。实验结果表明,ManiNLR算法能够较好地估计图像中的头部姿态,并具有较快的速度和较高的鲁棒性。  
      关键词:流形学习;头部姿态估计;非线性回归;人工神经网络   
      3810
      |
      71
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126263 false
      更新时间:2024-05-08

      计算机图形学

    • 角点距离矩阵和同心圆划分的曲线描述与匹配

      曾接贤, 刘秀朋, 符祥
      2012, 17(8): 1011-1020. DOI: 10.11834/jig.20120816
      摘要:曲线匹配对于物体识别、目标跟踪、碎片拼接等有着重要的意义。针对曲线匹配的效率与鲁棒性问题,提出了一种基于角点距离矩阵和同心圆划分的曲线描述与匹配算法。该算法分为粗略匹配和精确匹配两个阶段。粗略匹配阶段首先采用角点距离矩阵来描述曲线;然后通过子矩阵的方法来匹配曲线。精确匹配阶段首先采用同心圆划分的方法描述曲线;然后通过两条曲线同心圆描述集的差异度度量函数来度量他们的相似性。算法不仅具有平移、旋转、缩放不变性,而且具有较强的鲁棒性,可用于遮挡物体的匹配以及基于轮廓的图形拼接。实验结果表明了该算法的有效性和可行性。  
      关键词:曲线描述;曲线匹配;角点距离矩阵;子矩阵;同心圆   
      3499
      |
      58
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126528 false
      更新时间:2024-05-08
    • 弹性二次曲面模型下的3维形状表现与平滑

      郝世杰, 蒋建国, 郭艳蓉, 詹曙
      2012, 17(8): 1021-1028. DOI: 10.11834/jig.20120817
      摘要:本文研究了能够保持几何特征并且对噪声鲁棒的形状表示方法。根据弹性二次曲线(Elastic Quadratic Wire, EQW)的基本思想,对模型加以推广,提出用于曲面表示的弹性二次曲面(Elastic Quadratic Patch, EQP)模型。通过对曲面上每一点构造在参数平面上彼此重叠的二次曲面片,进而建立相邻曲面片之间0阶与1阶不连续势能函数。由于此势能函数是关于该曲面点的二次型,因而容易求得使其最小的二次曲面参数向量。对整个曲面的逐点迭代,进而获得稳定且保持显著几何特征的形状EQP表示。实验部分以3维人脸成像数据为例,验证了本文模型在平滑与细节保持等方面的性能。在不同噪声水平下,分析了参数变化对EQP模型性能影响。与常见样条与小波方法结果进行定量和定性比较,分析了不同噪声水平下(方差=1,5,10)整体与局部区域中各方法优劣。在噪声水平较高时,在信噪比和直观效果等定量与定性方面上,EQP模型与对比方法相比具备一定优势。  
      关键词:形状表现;弹性二次曲面;几何特征;形状平滑;特征保持   
      2678
      |
      49
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126646 false
      更新时间:2024-05-08

      医学图像处理

    • 主动学习的白细胞图像自动分割

      崔凤, 潘晨, 吴向平, 徐军
      2012, 17(8): 1029-1034. DOI: 10.11834/jig.20120818
      摘要:提出利用极端学习机算法(ELM)在线构建像素分类模型分割白细胞图像。训练阶段根据白细胞核深染色的特点,先利用一个Mean-shift过程在RGB空间定位白细胞核区;再经核区形态学膨胀,得到一个熵与面积之比最大的区域作为正样本候选区域, 而此区域外像素则作为负样本候选区域;通过正负样本像素抽样组成训练集,能在线训练得到一个两分类ELM模型。多次抽样得到的训练集可以产生多个ELM模型。测试阶段利用上述ELM模型集成分类全体像素,可实现白细胞自动分割。与传统图像分割算法相比,本文方法基本无参数调整,可自适应光照和染色条件导致的图像颜色变化,分割效果好。相关实验结果表明算法的有效性。  
      关键词:白细胞;图像分割;均值移动(Mean-shift);极端学习机;分类器集成   
      3005
      |
      85
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126157 false
      更新时间:2024-05-08

      遥感图像处理

    • Bregman交替迭代遥感图像复原方法

      徐焕宇, 孙权森, 罗楠, 夏德深
      2012, 17(8): 1035-1041. DOI: 10.11834/jig.20120819
      摘要:针对多种退化因素的遥感图像复原问题,提出一种基于Bregman迭代的遥感图像消除不规则采样、去模糊和去噪总变差复原方法。在此基础上,结合非局部正则化方法,提出一种自适应计算非局部均值滤波器参数的方法。求解时使用交替最小化方法将复杂的复原问题分割为两个容易求解的子问题。实验结果表明,本文方法比其他基于Bregman迭代的方法收敛速度快、复原效果好,且加入非局部正则化后具有更好的纹理细节信息保持能力。  
      关键词:图像复原;总变差;Bregman迭代;非局部正则化   
      3275
      |
      73
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56125861 false
      更新时间:2024-05-08
    • 李晓冬, 凌峰, 杜耘
      2012, 17(8): 1042-1048. DOI: 10.11834/jig.20120820
      摘要:基于遥感影像的建筑物自动提取方法容易受混合像元影响,目标提取精度不高。亚像元定位可以提取亚像元尺度地物分布信息,减轻混合像元对目标提取结果造成的影响。传统亚像元定位模型采用各向同性邻域描述地物的空间相关性,并没有考虑地物特有的形状信息,难以满足建筑物提取的需要。在考虑建筑物光谱特征的基础上,建立了平行与垂直于目标建筑物主方向的各向异性邻域,并采用基于各向异性Markov随机场的亚像元定位模型进行了亚像元尺度的建筑物提取。基于QuickBird多光谱数据与AVIRIS高光谱数据的实验结果表明,该模型提取的建筑物不仅具有更高的空间分辨率,而且能够较好地保持建筑物边缘与角点的形状信息,是一种有效的亚像元尺度建筑物提取方法。  
      关键词:建筑物提取;亚像元定位;Markov随机场;各向异性邻域   
      3767
      |
      75
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 56126459 false
      更新时间:2024-05-08
    0