最新刊期

    2019 24 1

      图像处理和编码

    • 增强奇异值分解的自适应零水印

      肖振久, 姜东, 张晗, 唐晓亮, 陈虹
      2019, 24(1): 1-12. DOI: 10.11834/jig.180443
      增强奇异值分解的自适应零水印
      摘要:目的 针对增强奇异值分解(BN-SVD)中引入最抗攻击缩放比例的参数$β$,需要进行大量的实验来获取且存在随机性的问题,提出一种增强奇异值分解的自适应零水印算法。方法 首先对原始图像进行不重叠分块,每一个子块都做斜变换处理,再分别对斜变换后得到的每一个块矩阵进行增强奇异值分解,依据每一个块矩阵的最大奇异值与整体最大奇异值均值的大小关系构成特征向量;对水印图像进行Arnold变换和混沌映射得到二次加密的水印图像;最后利用特征向量与二次加密后的水印图像做异或运算构造零水印;利用天牛须优化算法(BAS)中的适应度函数循环迭代自适应确定参数$β$,更好地解决奇异值分解(SVD)算法在水印的提取时存在的虚警率和对角线失真的问题。结果 仿真实验结果表明,在JPEG压缩、噪声、滤波、旋转、剪切以及混合攻击下,提取水印图像与原水印图像的归一化系数NC值均可达到98%以上,性能较好。结论 利用BAS算法自适应地确定BN-SVD中参数$β$,找到最佳抗攻击缩放比例,增强了图像的奇异值,降低了图像矩阵在受到攻击时的敏感性。有效地解决奇异值分解带来的对角线失真和虚警错误的问题,最终提高了算法的鲁棒性。  
      关键词:自适应零水印;增强奇异值分解(BN-SVD);斜变换;天牛须优化算法(BAS);Arnold变换;混沌映射   
      11
      |
      22
      |
      7
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680620 false
      更新时间:2024-05-07
    • 减少相邻位平面间冗余度的加密图像可逆信息隐藏

      袁源, 和红杰, 陈帆
      2019, 24(1): 13-22. DOI: 10.11834/jig.180305
      减少相邻位平面间冗余度的加密图像可逆信息隐藏
      摘要:目的 针对现有的加密域可逆信息隐藏算法在对位平面压缩时未能充分利用位平面间的相关性的问题,为了降低位平面的压缩率从而提高嵌入容量,提出一种减少相邻位平面间冗余度的加密域可逆信息隐藏算法。方法 算法将图像进行分块并将块的位置进行置乱,置乱并未改变位平面的块内像素的相关性,使得位平面的块同样利于压缩。将块置乱后的图像的高位平面与次高位进行异或操作后得到新的次高位平面,再用新的次高位异或比它低一位的位平面。依次对其余的低位平面进行同样的操作后得到新的低7个位平面,将它们与原始最高位相结合得到新的图像的8个位平面。使用BBE(binary-block embeding)算法对新的图像的位平面进行压缩为嵌入信息腾出空间。为了保证加密图像的安全性,对腾出空间后的图像进行异或加密。结果 对相邻位平面进行异或后使除了最高位平面外的低位平面更平滑,减少了不能使用BBE算法压缩的块及压缩的不好的块的个数,更有利于用BBE算法对图像进行压缩。提出的算法与现有的基于位平面压缩的算法相比得到了较高的嵌入率,对不同纹理的图像而言,嵌入的容量平均提高了0.4 bit/像素。结论 实验结果表明,提出的算法在保证安全性的同时可以腾出更多的空间来嵌入额外的信息,在实际生活中能根据需求灵活地嵌入信息。嵌入的信息能无损地提取,且图像能完全恢复。总的来说,提出的算法具有良好的性能。  
      关键词:位平面冗余度;图像加密域;可逆信息隐藏;BBE(binary-block embeding);位平面压缩;高嵌入率   
      27
      |
      39
      |
      8
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680617 false
      更新时间:2024-05-07
    • 使用线约束运动最小二乘法的视差图像拼接

      樊逸清, 李海晟, 楚东东
      2019, 24(1): 23-30. DOI: 10.11834/jig.180343
      使用线约束运动最小二乘法的视差图像拼接
      摘要:目的 图像配准是影响拼接质量的关键因素。已有的视差图象拼接方法没有解决匹配特征点对间的错误配准问题,容易引起不自然的拼接痕迹。针对这一问题,提出了使用线约束运动最小二乘法的配准算法,减少图像的配准误差,提高拼接质量。方法 首先,计算目标图像和参考图像的SIFT(scale-invariant feature transform)特征点,应用RANSAC(random sample consensus)方法建立特征点的匹配关系,由此计算目标到参考图像的最佳单应变换。然后,使用线约束运动最小二乘法分别配准两组图像:1)第1组是目标图像和参考图像;2)第2组是经单应变换后的目标图像和参考图像。第1组用逐点仿射变换进行配准,而第2组配准使用了单应变换加上逐点仿射变换。最后,在重叠区域,利用最大流最小割算法寻找最优拼接缝,沿着拼接缝评估两组配准的质量,选取最优的那组进行融合拼接。结果 自拍图库和公开数据集上的大量测试结果表明,本文算法的配准精度超过95%,透视扭曲比例小于17%。与近期拼接方法相比,本文配准算法精度提高3%,拼接结果中透视扭曲现象减少73%。结论 运动最小二乘法可以准确地配准特征点,但可能会扭曲图像中的结构对象。而线约束项则尽量保持结构,阻止扭曲。因此,线约束运动最小二乘法兼顾了图像结构的完整性和匹配特征点的对准精度,基于此配准模型的拼接方法能够有效减少重影和鬼影等人工痕迹,拼接结果真实自然。  
      关键词:图像配准;视差图像;线约束;运动最小二乘法;图像拼接;最大流最小割   
      12
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680619 false
      更新时间:2024-05-07

      图像分析和识别

    • 多特征融合的复杂环境海洋涡旋识别

      黄冬梅, 刘佳佳, 苏诚, 杜艳玲
      2019, 24(1): 31-38. DOI: 10.11834/jig.180324
      多特征融合的复杂环境海洋涡旋识别
      摘要:目的 海洋涡旋识别研究已成为物理海洋领域的研究热点之一。传统的海洋涡旋识别算法多是基于物理参数法、流场几何特征法以及两种方法的混合,通过设置统一的阈值对海洋涡旋进行识别。在特定环境的海域中,传统算法的识别效果较好。但引起海洋涡旋生成的环境复杂多变且具有快速运动的特性,导致其具有快速连续变化的特点,依赖专家经验进行单一阈值设置的方法存在显著的主观性和不确定性,通常会导致海洋涡旋的漏判和错判,缺乏通用性。针对以上问题,为构建具有泛化能力的海洋涡旋自动识别方法,兼顾考虑海洋涡旋的全局和局部特征,提出一种复杂环境下海洋涡旋多特征融合识别方法。方法 首先通过数据预处理对数据集进行扩充;其次提取海洋涡旋的纹理特征(GLCM)、傅里叶描述子(FD)和Harris角点特征;接着将提取的GLCM特征进行均值化,并通过主成分分析法(PCA)对FD描述子和Harris角点特征进行降维;然后将处理后的特征向量进行串行融合;最后通过分类器完成对海洋涡旋的识别。结果 实验结果表明,提出的多特征融合方法的识别率高于单一特征方法的识别率,采用DT分类算法的识别精度最高,达86.904 5%;本文方法中采用PCA降维能有效提高识别精度,FD特征经PCA降维后,识别精度从83.906 0%提高到86.904 5%,Harris特征经PCA降维后,识别精度从84.009 7%提高到85.354 7%;且对于形态多样的海洋涡旋具有良好的鲁棒性。结论 本文融合了基于SAR影像海洋涡旋的3种特征信息,包括GLCM、FD和Harris角点特征,有效克服了阈值选取以及单一特征的不足,提高了基于SAR影像海洋涡旋的识别率,本文方法适用于复杂环境下的海洋涡旋识别。  
      关键词:海洋涡旋;目标识别;SAR影像;特征提取;多特征融合   
      15
      |
      4
      |
      4
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680618 false
      更新时间:2024-05-07
    • 基于局部连接度和差异度算子的水平集纹理图像分割

      周力, 闵海
      2019, 24(1): 39-49. DOI: 10.11834/jig.180435
      基于局部连接度和差异度算子的水平集纹理图像分割
      摘要:目的 复杂纹理的图像分割一直是图像分割的难题,现有的一些纹理图像分割方法主要通过提取图像确定方向的灰度变化特征或者提取图像的局部灰度相似性特征得到特征图像,从而进行纹理图像的分割,然而,自然纹理中普遍存在局部形态相似和方向不确定的现象,导致现有方法不能准确地分割纹理图像。方法 本文提出局部连接算子和局部差异算子来描述局部纹理的形态相似性和局部纹理的差异度。一方面,通过设定一定阈值,将局部区域的灰度差异分为两类,分析两类差异的分布特征,从而提取图像的形态特性及局部连接度算子;另一方面,设置一种无方向性的灰度差异分析算子,提取图像局部的灰度差异值从而得到局部差异度算子。两个算子结合以更好地提取纹理图像的局部特征,然后通过融合局部相似度特征、局部差异度特征和灰度信息,构造水平集能量泛函,进而通过最小化能量泛函实现纹理图像分割。结果 相比基于Gabor变换、结构张量、局部相似度因子的纹理分割方法,提出的局部算子能够更好地区分自然图像的不同纹理区域,且对实验图像的平均分割准确率高达97%,远高于其他方法。因此,提出的模型对于自然纹理图像具有更好的分割效果。结论 本文提出了两种新颖的纹理特征局部描述子:局部连接度算子和局部差异度算子,能够有效地提取纹理特征,且有一定的互补性。实验表明,提出的方法对于复杂自然纹理图像具有良好的分割效果。  
      关键词:图像分割;水平集;多特征;局部连接度;局部差异度   
      12
      |
      4
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680621 false
      更新时间:2024-05-07

      图像理解和计算机视觉

    • 复杂场景下的交通视频显著性前景目标提取

      郎洪, 丁朔, 陆键, 马晓丽
      2019, 24(1): 50-63. DOI: 10.11834/jig.180313
      复杂场景下的交通视频显著性前景目标提取
      摘要:目的在城市交通检测中,智能视频的广泛应用使得人工智能技术及计算机视觉先进技术对视频中的前景目标检索、识别、特征提取、行为分析等成为视觉研究的热点,但由于复杂场景中动态背景具有不连续的特点,使得少部分的前景目标图像信息丢失,从而造成漏检、误判。方法本文提出一种RPCA(鲁棒主成分分析)优化方法,为了快速筛选与追踪前景目标,以基于帧差欧氏距离方法设计显著性目标帧号快速提取算法,确定关键帧邻域内为检测范围,对经过稀疏低秩模型初筛选的前景目标图像进行前景目标种子并行识别和优化连接,去除前景目标图像中的动态背景,同时将MASK(掩膜)图像中的前景目标分为规则类和非规则类两种,对非规则类前景目标如行人、动物等出现的断层分离现象设计前景目标区域纵向种子生长算法,对规则类前景目标如汽车轮船等设计区域内前景目标种子横纵双向连接以消除空洞、缺失的影响。结果本文前景目标提取在富有挑战性干扰因素的复杂场景下体现出较高的鲁棒性,在数据库4组经典视频和山西太长高速公路2组视频中,动态背景有水流流动、树叶摇曳、摄像头轻微抖动、光照阴影,并从应用效果、前景目标定位的准确性以及前景目标检测的完整性3个角度对实验结果进行了分析,本文显著性前景目标提取算法取得了90.1%的平均准确率,88.7%的平均召回率以及89.4%的平均$ {\rm{F}}$值,均优于其他同类算法。结论本文以快速定位显著性前景目标为前提,提出对稀疏低秩模型初筛选的图像进行并行种子识别和优化连接算法,实验数据的定性与定量分析结果表明,本文算法能够更快速地将前景目标与动态背景分离,并减小前景目标与背景之间的粘连情况,更有效地保留了原始图像中前景目标的结构信息。  
      关键词:智能交通检测;稀疏低秩;帧差欧氏距离方法;前景目标种子并行搜索;种子生长;区域规则填充   
      16
      |
      14
      |
      2
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680769 false
      更新时间:2024-05-07
    • 结合全卷积神经网络的室内场景分割

      黄龙, 杨媛, 王庆军, 郭飞, 高勇
      2019, 24(1): 64-72. DOI: 10.11834/jig.180364
      结合全卷积神经网络的室内场景分割
      摘要:目的视觉假体通过向盲人体内植入电极刺激视神经产生光幻视,盲人所能感受到的物体只是大体轮廓,对物体识别率低,针对视觉假体中室内应用场景的特点,提出一种快速卷积神经网络图像分割方法对室内场景图像进行分割,通过图像分割技术把物品大致的位置和轮廓显示出来,辅助盲人识别。方法构建了用于室内场景图像分割的FFCN(fast fully convolutional networks)网络,通过层间融合的方法,避免连续卷积对图像特征信息的损失。为了验证网络的有效性,创建了室内环境中的基本生活物品数据集(以下简称XAUT数据集),在原图上通过灰度标记每个物品的类别,然后附加一张颜色表把灰度图映射成伪彩色图作为语义标签。采用XAUT数据集在Caffe(convolutional architecture for fast feature embedding)框架下对FFCN网络进行训练,得到适应于盲人视觉假体的室内场景分割模型。同时,为了对比模型的有效性,对传统的多尺度融合方法FCN-8s、FCN-16s、FCN-32s等进行结构微调,并采用该数据集进行训练得到适用于室内场景分割的相应算法模型。结果各类网络的像素识别精度都达到了85%以上,均交并比(MIU)均达到60%以上,其中FCN-8s at-once网络的均交并比最高,达到70.4%,但其分割速度仅为FFCN的1/5。在其他各类指标相差不大的前提下,FFCN快速分割卷积神经网络上平均分割速度达到40帧/s。结论本文提出的FFCN卷积神经网络可以有效利用多层卷积提取图像信息,避免亮度、颜色、纹理等底层信息的影响,通过尺度融合技术可以很好地避免图像特征信息在网络卷积和池化中的损失,相比于其他FCN网络具有更快的速度,有利于提高图像预处理的实时性。  
      关键词:室内场景;视觉假体;语义分割;卷积神经网络;深度学习   
      12
      |
      4
      |
      7
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680779 false
      更新时间:2024-05-07
    • 结合Faster R-CNN的多类型火焰检测

      回天, 哈力旦·阿布都热依木, 杜晗
      2019, 24(1): 73-83. DOI: 10.11834/jig.180430
      结合Faster R-CNN的多类型火焰检测
      摘要:目的火焰检测可有效防止火灾的发生。针对目前火焰检测方法,传统图像处理技术的抗干扰能力差、泛化性不强,检测效果对数据波动比较敏感;机器学习方法需要根据不同的场景设定并提取合适火焰的特征,过程比较繁琐。为此提出一种基于Faster R-CNN的多类型火焰检测方法,避免复杂的人工特征提取工作,在面对复杂背景、光照强度变化和形态多样的火焰图像时依然保证较好的检测精度。方法基于深度学习的思想,利用卷积神经网络自动学习获取图像特征。首先,利用自建数据集构建视觉任务。根据火焰的尖角特性、直观形态和烟雾量等,将火焰类数据划分为单尖角火焰、多尖角火焰和无规则火焰3类。此外,通过深度网络特征可视化实验发现,人造光源与火焰在轮廓上具有一定的相似性,为此建立了人造光源圆形和方形两个数据集作为干扰项来保证检测模型的稳定性;然后,细化训练参数并调整预训练的卷积神经网络结构,改动分类层以满足特定视觉任务。将经过深度卷积神经网络中卷积层和池化层抽象得到的图像特征送入区域生成网络进行回归计算,利用迁移学习的策略得到每一类目标物体相应的探测器;最后,得到与视觉任务相关的目标检测模型,保存权重和偏置参数。并联各类目标物体的子探测器作为整体探测器使用,检测时输出各类探测器的分数,得分最高的视为正确检测项。结果首先,利用训练好的各探测器与相应测试集样本进行测试,然后,再利用各类目标物的测试集来测试其他类探测器的检测效果,以此证明各探测器之间的互异性。实验结果表明,各类探测器都具有较高的专一性,大大降低了误判的可能性,对于形变剧烈和复杂背景的火焰图像也具有良好的检测准确率。训练得到的检测模型在应对小目标、多目标、形态多样、复杂背景和光照变化等检测难度较大的情况时,均能获得很好的效果,测试集结果表明各类探测器的平均准确率提高了3.03% 8.78%不等。结论本文提出的火焰检测方法,通过挖掘火焰的直观形态特征,细分火焰类别,再利用深度卷积神经网络代替手动特征设置和提取过程,结合自建数据集和根据视觉任务修改的网络模型训练得到了检测效果良好的多类型火焰检测模型。利用深度学习的思想,避免了繁琐的人工特征提取工作,在得到较好的检测效果的同时,也保证了模型具有较强的抗干扰能力。本文为解决火焰检测问题提供了更加泛化和简洁的解决思路。  
      关键词:火焰;深度学习;区域卷积神经网络;视觉任务;目标检测   
      13
      |
      5
      |
      13
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680783 false
      更新时间:2024-05-07

      计算机图形学

    • 任意阶参数连续的形状可调过渡曲线

      严兰兰, 樊继秋, 周其华
      2019, 24(1): 84-95. DOI: 10.11834/jig.180231
      任意阶参数连续的形状可调过渡曲线
      摘要:目的针对现有研究未能给出可以使过渡曲线在端点处与被过渡曲线之间达到Ck(k为任意自然数)连续的多项式势函数统一表达式的问题展开研究,以期用简单有效的方式解决这一问题。方法从过渡曲线的方程出发,借助莱布尼兹公式得出其k阶导矢表达式,根据预设的连续性目标,反推出可使过渡曲线在端点处达到Ck连续的势函数需满足的基本条件。由这些基本条件中所含条件的数量,以及对势函数、过渡曲线的其他期望所对应的条件个数的总量,确定多项式势函数的次数,将势函数表达成相同次数的Bernstein基函数的线性组合,组合系数待定。由势函数需满足的基本条件、其他预期条件,以及Bernstein基函数在端点处的函数值、导数值等信息,得出关于待定系数的方程组。解该方程组,得出满足所有预期目标,并含一个自由参数的多项式势函数的统一表达式。结果势函数中存在两个参数k和$ \lambda $,k用于控制过渡曲线与被过渡曲线在端点处的连续阶,在k取定以后,$ \lambda $可用于控制过渡曲线与被过渡曲线的贴近程度。势函数具有对称性、中点性、有界性,分析了当k固定时,势函数关于变量t和参数$ \lambda $的单调性,分析了使势函数图形只存在唯一拐点时,自由参数的取值范围。由该势函数构造的过渡曲线,取一般参数时在端点处可达Ck连续,取特殊参数时可达Ck+1连续。分析了过渡曲线的形状特征,当k取定时,$ \lambda $的值越大,过渡曲线越贴近被过渡曲线。结论实验数据验证了理论分析结果的正确性,同时直观显示了所给方法的有效性。  
      关键词:曲线设计;过渡曲线;形状调整;参数连续;势函数   
      11
      |
      5
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680785 false
      更新时间:2024-05-07
    • 郭宇, 江平, 王剑敏, 刘植
      2019, 24(1): 96-102. DOI: 10.11834/jig.180318
      Möbius变换下四次有理抛物-PH曲线的<inline-formula><tex-math id="M1">${{\rm{C}}^{\rm{2}}} $</tex-math></inline-formula> Hermite插值
      摘要:目的曲线插值问题在机器人设计、机械工业、航天工业等诸多现代工业领域都有广泛的应用,而已知端点数据的Hermite插值是计算机辅助几何设计中一种常用的曲线构造方法,本文讨论了一种偶数次有理等距曲线,即四次抛物-PH曲线的${{\rm{C}}^{\rm{2}}} $ Hermite插值问题。方法基于M bius变换引入参数,利用复分析的方法构造了四次有理抛物-PH曲线的${{\rm{C}}^{\rm{2}}} $ Hermite插值,给出了具体插值算法及相应的Bézier曲线表示和控制顶点的表达式。结果通过给出"合理"的端点插值数据,以数值实例表明了该算法的有效性,所得12条插值曲线中,结合最小绝对旋转数和弹性弯曲能量最小化两种准则给出了判定满足插值条件最优曲线的选择方法,并以具体实例说明了与其他插值方法的对比分析结果。结论本文构造了M bius变换下的四次有理抛物-PH曲线的${{\rm{C}}^{\rm{2}}} $ Hermite插值,在保证曲线次数较低的情况下,达到了连续性更高的插值条件,计算更为简单,插值效果明显,较之传统奇数次PH曲线具有更加自然的几何形状,对偶数次PH曲线的相关研究具有一定意义。  
      关键词:Möbius变换;有理等距曲线;${{\rm{C}}^{\rm{2}}} $Hermite插值;绝对旋转数;弹性弯曲能量   
      22
      |
      5
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680799 false
      更新时间:2024-05-07

      医学图像处理

    • 变参数active demons算法下的多通道弥散张量图像配准

      赵杰, 徐晓莹, 刘敬, 杜宇航
      2019, 24(1): 103-114. DOI: 10.11834/jig.180281
      变参数active demons算法下的多通道弥散张量图像配准
      摘要:目的弥散张量图像(DTI)配准不仅要保证配准前后图像解剖结构的一致性,还要保持张量方向的一致性。demons算法下的多通道DTI配准方法可充分利用张量的信息,改善配准质量,但大形变区域配准效果不理想,收敛速度慢。active demons算法能够加快收敛速度,但图像的拓扑结构容易改变。由此提出一种变参数active demons算法下的多通道DTI配准方法。方法综合active demons算法中平衡系数能加快收敛速度、均化系数能提高DTI配准精度的优点,手动选择一个均化系数,并在算法收敛过程中随着高斯核的减小动态调整平衡系数。在配准开始时采用较小的平衡系数获得较快的收敛速度,随着收敛的加深逐渐增大平衡系数获得较小的配准误差。结果active demons方法能改善DTI大形变区域的配准问题,但均化系数太小会改变图像拓扑结构。固定均化系数,引入单一的平衡系数能加快收敛速度,但会导致拓扑结构改变。变参数active demons方法有效提高了配准的收敛速度,明显改善大形变区域的配准效果,同时能保持图像拓扑结构不变。变参数active demons配准后的10组数据均获得最小均方差(MSE)和最大特征值特征向量对重叠率(OVL),配准精度最高。在0.05的配对样本$t$检验水平下,变参数active demons和active demons方法配准后的MSE、OVL的差异均有统计学意义;变参数active demons和demons方法配准后的MSE、OVL的差异均有统计学意义($p$ < 0.05)。结论变参数active demons算法下的多通道DTI配准方法明显提高了配准精度和速度,改善了demons方法不能有效配准大形变区域的问题,同时能够保持配准前后图像的拓扑结构,尤其适合个体间形变较大的DTI配准。  
      关键词:弥散张量成像;DTI配准;demons算法;active demons算法;张量重定向   
      12
      |
      5
      |
      1
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680921 false
      更新时间:2024-05-07
    • 丁思静, 孙中阳, 孙延奎, 王永革
      2019, 24(1): 115-123. DOI: 10.11834/jig.180084
      结合PCANet与线性判别分析的视网膜光学相干断层扫描图像分类
      摘要:目的主成分分析网络(PCANet)能提取图像的纹理特征,线性判别分析(LDA)提取的特征有类别区分性。本文结合这两种方法的优点,提出一种带线性判别分析的主成分分析网络(PCANet-LDA),用于视网膜光学相干断层扫描(OCT)图像中的老年性黄斑变性(AMD)、糖尿病性黄斑水肿(DME)及正常(NOR)这3类的全自动分类。方法PCANet-LDA算法是在PCANet的基础上添加了LDA监督层,该层加入了类标签对特征进行监督投影。首先,对OCT视网膜图像进行去噪、二值化及对齐裁剪等一系列预处理,获得感兴趣的视网膜区域;然后,将预处理图像送入一个两层的PCA卷积层,训练PCA滤波器组并提取图像的PCA特征;接着,将PCA特征送入一个非线性输出层,通过二值散列和块直方图等处理,得到图像的特征;之后,将带有类标签的图像特征送入一个LDA监督层,学习LDA矩阵并用其对图像特征进行投影,使特征具有类别区分性;最后,将投影的特征送入线性支持向量机(SVM)中对分类器进行训练和分类。结果实验分别在医院临床数据集和杜克数据集上进行,先对OCT图像预处理进行前后对比实验,然后对PCANet特征提取的有效性进行分析,最后对PCANet算法、ScSPM算法以及提出的PCANet-LDA3种分类算法的分类效果进行对比实验。在临床数据集上,PCANet-LDA算法的总体分类正确率为97.20%,高出PCANet算法3.77%,且略优于ScSPM算法;在杜克数据集上,PCANet-LDA算法的总体分类正确率为99.52%,高出PCANet算法1.64%,略优于ScSPM算法。结论PCANet-LDA算法的分类正确率明显高于PCANet,且优于目前用于2D视网膜OCT图像分类的先进的ScSPM算法。因此,提出的PCANet-LDA算法在视网膜OCT图像的分类上是有效且先进的,可作为视网膜OCT图像分类的基准算法。  
      关键词:光学相干断层扫描;年龄相关性黄斑变性;糖尿病性黄斑水肿;主成分分析网络;线性判别分析;图像分类;半监督学习   
      12
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680922 false
      更新时间:2024-05-07
    • 肺结节球表面网格向量化特征分类

      刘通, 徐久强, 朱宏博, 孟昭岩, 窦圣昶
      2019, 24(1): 124-134. DOI: 10.11834/jig.180317
      肺结节球表面网格向量化特征分类
      摘要:目的基于球谐函数与容斥映射算法向量化球面表面纹理与结节形状用以进行胸部CT图像肺结节良恶性判定。区别于基于深度学习解决肺结节良恶性筛查的方法,目前方法多集中于框架改进而忽略了数据预处理,文中所提方法旨在对球面纹理与结节形状进行向量表达,使其可以输入深度森林进行特征分类训练。方法首先采用辽宁中医药大学附属医院数据,通过3维重构获得3维肺结节图像。其次使用球谐函数与容斥映射算法在保留空间信息的同时将纹理以网格方式映射到标准球面上。再次使用网格-LBP与映射形变能量分别完成对球面纹理与结节形状信息的构建。最后提出一种基于网格的多粒度扫描方法对深度森林训练框架进行改进,并将向量化后的纹理和形状特征加入到改进的深度森林训练框架中进行实验验证。结果通过大量的实验结果验证,在准确率(ACC)、特异度(SPE)、敏感度(SEN)和受试者工作特征曲线下的面积(AUC)4个衡量指标下,本文方法具有优于现存先进方法的表现,其中ACC、SPE、SEN和AUC分别达到76.06%、69.46%、88.46%和0.84。结论基于球谐函数与容斥映射算法可成功地对肺结节表面和形状两个特征进行向量化并训练,不仅考虑了数据预处理,而且通过两个特征对肺结节良恶性检测的准确率要高于传统1个特征检测的结果,同时也为3维模型中特征的提取及向量化提供了一个有效的方法。  
      关键词:球谐函数;容斥映射算法;向量化表达;网格-LBP;形变能量   
      11
      |
      4
      |
      0
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680926 false
      更新时间:2024-05-07

      NCIG 2018会议专栏

    • 样本优化选择的高光谱图像分类

      方帅, 祝凤娟, 董张玉, 张晶
      2019, 24(1): 135-148. DOI: 10.11834/jig.180437
      样本优化选择的高光谱图像分类
      摘要:目的高光谱分类问题中,由于类内光谱特性存在差异性,导致常规的随机样本选择策略无法保证训练样本均匀覆盖样本空间。针对这一问题,提出基于类内再聚类的样本空间优化策略。同时为了进一步提高分类精度,针对低置信度分类结果,提出基于邻域高置信信息的修正策略。方法采用FCM(fuzzy C-means)聚类算法对每类样本进行类内再聚类,在所聚的每个子类内选择适当样本。利用两个简单分类器SVM(support vector machine)和SRC(sparse representation-based classifier),对分类结果进行一致性检测,确定高、低置信区域,对低置信区域,利用主成分图作为引导图对置信度图进行滤波,使得高置信信息向低置信区域传播,从而修正低置信区域分类结果。以上策略可以保证即便在较少的训练样本的情况下,也能够训练出较高的分类器,大幅度提高分类精度。结果使用3组实验数据,根据样本比例设置两组实验与经典以及最新分类算法进行对比。实验结果表明,本文算法均取得很大改进,尤其在样本比例较小的实验中效果显著。在小比例(一般样本选取比例的十分之一)训练样本实验中,对于India Pines数据集,OA(overall accuracy)值高达90.48%;在Salinas数据集上能达到99.68%;同样,PaviaU数据集的OA值为98.54%。3组数据集的OA值均比其他算法高出4%~6%。结论综上表明,本文算法通过样本空间优化策略选取有代表性、均衡性的样本,保证小比例样本下分类精度依然显著;基于邻域高置信信息的修正策略起到很好的优化效果。同时,本文算法适应多种数据集,具有很好的鲁棒性。  
      关键词:遥感;高光谱分类;光谱特性;样本空间优化;类内再聚类;置信区域;边缘保护滤波   
      27
      |
      43
      |
      5
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680927 false
      更新时间:2024-05-07
    • 多层感知分解的全参考图像质量评估

      李国庆, 赵洋, 刘青萌, 殷翔宇, 王业南
      2019, 24(1): 149-158. DOI: 10.11834/jig.180438
      多层感知分解的全参考图像质量评估
      摘要:目的图像质量评估是计算机视觉、图像处理等领域的基础研究课题之一,传统评估方法常基于图像低层视觉特征而忽略了高层语义信息,这也在一定程度上影响了客观指标和主观视觉质量的一致性。近年来,感知损失被广泛应用于图像风格化、图像复原等研究中,通过使用预训练的深度网络对图像进行多层语义分解,在相关问题上取得了较好的效果。受感知损失启发,提出一种多层感知分解的全参考图像质量评估方法。方法首先使用预训练的深度网络对图像进行多层语义分解,获取多层特征图,再计算失真图像与参考图像之间的相似度,以及它们的不同层级特征图之间的相似度,最终得出兼顾了高层语义信息的图像质量分数。结果针对传统方法PSNR(peak signal-to-noise ratio)、SSIM(structure similarity)、MS-SSIM(multi-scale structure similarity)及FSIM(feature similarity)进行实验,结果表明,本文方法能够有效提升传统图像质量评估方法的性能,在SRCC(Spearman rank order correlation coefficient)、KRCC(Kendall rank order correlation coefficient)、PLCC(Pearson linear correlation coefficient)和RMSE(root mean squared error)客观指标上均有相应提升。通过使用本文框架,PSNR、SSIM、MS-SSIM、FSIM方法在TID2013数据库上SRCC指标分别获得0.02、0.07、0.06和0.04的提升。结论本文提出的一种多层感知分解的全参考图像质量评估方法,结合传统方法与深度学习方法,兼顾了图像低层视觉特征和高层语义信息,从而有效地提升了传统方法的评估性能,使客观评估结果更加符合主观视觉感受,同时,本文提出的评估框架能够适用于多种传统方法的性能提升。  
      关键词:图像质量评估;卷积神经网络;感知损失;低层视觉特征;高层语义信息   
      11
      |
      4
      |
      3
      <HTML>
      <网络PDF><Meta-XML>
      <引用本文> <批量引用> 55680928 false
      更新时间:2024-05-07
    0