论文引用格式:Wang R F, Wang L, Li C, Huo C L and Chen J W. 2023. IIQ-CNN-based cross-domain change detection of SAR images. Journal of Image and Graphics, 28(07):2208-2220(引用格式:王蓉芳, 王良, 李畅, 霍春雷, 陈佳伟. 2023. 整型推理量化CNN的SAR图像跨域变化检测. 中国图象图形学报, 28(07):2208-2220)[0 引 言基于合成孔径雷达(synthetic aperture radar,SAR)图像的变化检测(change detection,CD)是通过对同一场景在不同时间获取的两幅或多幅SAR图像进行对比,分析图像间的差异,从而获得所需的变化信息。决策者可通过识别出的变化信息,根据具体应用做出进一步的决策指导。SAR具有高分辨率、全天候、全天时、不受大气和日照条件影响的成像优势,是变化检测数据的主要来源。SAR图像变化检测技术在灾情分析、国土资源管理、地物变化、农林业监测(佟国峰 等,2015)、军事打击效果评估等民用和军用领域有着广泛的应用场景。传统的变化检测方法主要通过影像预处理、生成差异图以及对差异图进行分析3个步骤获得最终的二值变化检测图(Bruzzon和Prieto,2000)。生成差异图最常用的方法是对数比值(log-ratio,LR)算子(Bovolo和Bruzzone,2005)和基于LR算子的改进方法(Gong等,2012)。但这种基于像素点的差异图构造方法容易受到相干斑噪声和配准误差的影响,而且对于经典的3步流程变化检测方法,检测结果的精度对预处理和差异图的依赖性很大。如果在预处理以及产生差异图的过程中造成信息损失,尤其是一些微弱变化的区域,一旦丢失会导致后续步骤都无法检测出该位置的变化信息。目前,深度学习(deep learning)已被证明是一种有效的特征学习手段,深层网络可以通过学习,在网络的输出层获得抽象、不变的特征,发现非局部的结构,使特征对噪声有很强的鲁棒性。而且,深度神经网络端对端的结构能有效克服检测结果对差异图的依赖。已有很多研究者将深度学习理论用于变化检测问题并验证了其有效性(Gong等,2016;Wang等,2019)。其中,卷积神经网络(convolutional neural network,CNN)(Lecun等,1998)对数据进行特征学习时,通过共享局部权值的特殊结构使网络可以并行地学习数据特征,特别是在学习高维数据特征时,权值共享降低了网络的复杂度,使CNN在图像处理方面具有显著优势,在目标检测识别(Krizhevsky等,2017;Simonyan和Zisserman,2015)和图像分割(Girshick等,2014;Long等,2015)等方面取得了令人瞩目的成果,在变化检测领域也有成功应用(Li等,2019;Chen等,2020)。随着大规模数据集的出现和硬件水平的发展,遥感影像空间分辨率有所提升,相同地物的空间纹理表现形式差异变大,地物特征更加复杂多样,传统的变化检测方法已很难满足需求(王艳恒 等,2020),这也促进了大型CNN模型的飞速发展。历届ImageNet大规模视觉识别挑战赛冠军提交的模型从AlexNet(Alex network)(Krizhevsky等,2017)到VGGNet(Visual Geometry Group network)(Simonyan和Zisserman,2015)、GoogLeNet(GoogLe network)(Szegedy等,2015)、ResNet(residual network)(He等,2016)和SENet(squeeze-and-excitation network)(Hu等,2018),网络的深度已经从8层激增到上百层。CNN网络越深,对计算资源的需求也越苛刻。例如,对于152层的ResNet,需要的输入图像尺寸最小为224 × 224像素,需要学习的网络模型权值参数达到6 000多万个,这在计算资源有限的常规服务器或终端进行部署都是不现实的。虽然深度网络在基于图形处理器(graphics processing unit,GPU)的设备上表现良好,但不适合移动终端或无人机等嵌入式设备。而且对于变化检测在防震减灾和灾后评估等方面的应用,需要及时对受灾区域、损毁设施进行评估,帮助搜救资源的合理配置,减小灾害损失和人员伤亡。实时、快速的检测需求与超复杂模型之间的矛盾极大限制了深度学习在变化检测领域的应用发展。因此迫切需要研究推理速度较快和计算资源较低的变化检测方法。针对网络模型越来越复杂导致计算资源高消耗的问题,目前有两类解决方案。第1类方案从神经网络模型的结构出发,通过设计新型操作算子,降低模型复杂度和对计算资源的需求。例如,谷歌在2017年提出的MobileNet(Howard等,2017),采用深度可分离卷积操作,将传统的卷积操作分为两步进行,实现了减少参数量和提升运算速度的目标。Yu等人(2017)提出空洞卷积操作,引入一个称为扩张率的新参数,在扩大卷积感受野的同时,保持卷积层参数单次的卷积运算量不变。对那些模型需要较大感受野,但计算资源受限无法提高卷积核大小的困境,提供一种新的解决方案。受此类方法启发,Wang等人(2020)提出一种轻量级变化检测深度网络,使用常规卷积、空洞卷积和非对称卷积的组合替换常规的卷积层操作,减少计算复杂度和空间复杂度。与传统的CNN相比,该方法卷积操作运行时间更短,模型复杂度更小,而且变化检测的性能也有一定程度的提升。樊玮等人(2020)提出多尺度深度特征融合的变化检测方法,使用VGG16作为网络基本模型,分别从参考图像和查询图像中提取不同网络层的深度特征,通过提取并融合图像的高级语义特征来降低复杂度、提升检测效果。第2类方案从网络参数的存储形式出发。在神经网络中,需要学习的参数如权重、偏置和每层的输出值一般都是32位浮点数,如何将32位浮点数量化为低比特的整型表示,以降低模型复杂度是第2类方案的主要思路。代表方法有三元权值网络(ternary weight networks,TWN)(Li等,2016)、二元神经网络(binary neural networks,BNN)(Hubara等,2016)和谷歌提出的整型算术推理量化方法(integer-arithmetic-only inference,IAOI)(Jacob等,2018)。虽然TWN和BNN实现了对网络权重的量化并取得了不错的效果,但存在两方面的弊端。首先,量化算法的有效性都是在VGG或AlexNet等冗余度很大的模型上验证的,并没有对一些高效模型如MobileNet进行量化;其次,将权重量化为二值(+1、-1)、三值(+1、-1、0)而没有实现任意位数的量化。权重损失信息过多会导致在一些紧凑型网络上性能下降,没有很好地平衡模型压缩和精度之间的关系。而IAOI实现了对网络任意位数的压缩,并且对MobileNet这种紧凑型网络进行了量化,较好地实现了模型压缩和精度之间的平衡,提供了一种更加合理的量化思路。根据本文前期的调研结果,第2类量化方法的思想目前还没有在变化检测任务中的应用。同时,由于噪声、失真、传感器特性、成像条件和复杂地形等因素的影响,不同变化检测数据集的数据分布差别较大。当在某个变化检测数据集上训练出一个深度网络检测模型,将其应用到新的数据集时,检测性能将会下降(Yosinski等,2014)。因此,现有的有监督变化检测方法大都是基于相同数据集的,即首先通过某种无监督方法得到该数据集的伪标签,然后利用这些伪标签来训练模型,进而对该数据集进行检测(Li等,2019)。然而,伪标签的精度无法保证,一旦引入错误的训练样本会传递给模型错误的引导信息,导致变化检测的性能很大程度上取决于生成的伪标签的质量,而且这种方法没有利用已有的大量标记数据。如何解决跨域变化检测中,已有的标记数据和需要检测的数据之间模型泛化性较弱的问题,也是一个亟需探索的方向。针对以上问题,本文引入整型算术推理量化技术,提出了基于整型推理量化卷积神经网络的SAR图像跨域变化检测方法(integer inference-based quantization CNN,IIQ-CNN)(本文方法的代码和所用数据集已公开,下载地址为https://github.com/NSLRP/IIQ-CNN.git)。该方法能够在不损失变化检测精度的同时对网络模型进行推理加速,而且设计的CNN网络结构能有效提高模型的泛化性,对跨域变化检测问题取得了较好的检测结果。本文的贡献点归纳如下:1)在变化检测任务中首次引入整型算术推理量化技术,对深度网络模型进行量化,减小变化检测模型的复杂度并加速推理运算,促进变化检测算法在嵌入式设备中的应用。2)设计了同时使用时相图和差异图的样本构建方法,既避免了检测结果对差异图的过分依赖,又能利用初步的差异信息,有效挖掘时相图和差异图之间的共享信息,提高了跨域变化检测模型的泛化能力。3)提出了完整的基于整型推理量化的跨域变化检测网络框架,研究不同场景之间的跨域变化检测问题,拓宽了变化检测的应用场景,并设计了丰富的实验对比验证了不同量化方案的性能。1 整型算术推理量化技术一般的网络量化方法为训练后量化,即在训练过程中,无论是前向推理还是反向传播阶段所有的运算操作均为浮点数,仅在训练结束后对最终的模型权重利用量化器进行量化,得到所需的量化后的模型(Banner等,2019)。这种量化方式对于复杂度高的模型非常有效,但是对于简单模型,会导致精度明显下降。本文用于变化检测深度模型的量化技术为整型算术推理量化方法(integer-arithmetic-only inference,IAOI)(Jacob等,2018),相比较训练后量化的方法,该方法将权重和每一层的输出量化为整型数值,仅在前向推理中使用整型量化,在反向传播中使用反量化将整型数值转换为浮点数,以降低模拟量化过程中带来的损失,减少量化操作对模型最终性能的不利影响。1.1 基本原理所谓整型量化指的是将网络模型在推理阶段的运算中采用的浮点数转化为整型数值后进行运算。用r表示推理阶段采用的32位浮点数(Float32),用q表示r经过量化后代表的整型数值。例如,对于8位量化(Uint8),则q为8位整数。本质上来说,IAOI量化的基本要求是仅使用整数运算就可以实现所有算术操作,等价于得到从浮点数r到整数q之间的仿射关系,即q=rS+Z (1)式中,常数S是任意正实数,表示量化的尺度系数,是一个浮点数,代表了缩放的尺度。常数Z与量化值q具有相同的类型,表示零点,作用为确保量化前浮点型的零值能用量化后的整型值精确表示,没有量化误差。按照量化后整型数值的不同类型,量化器可分为对称量化和非对称量化两种。以8位量化(n = 8,n为量化位数)为例,对称量化就是将原始的浮点数量化为有符号的8位整型(-27~27 -1,即[-128,127])。非对称量化就是将原始的浮点数量化为无符号的8位整型(0~28 -1,即[0,255])。本文使用非对称量化,量化前首先需要计算量化因子尺度系数S和零点Z,计算为S=rmax-rmin2n (2)Z=round-rminS (3)式中,round(⋅)表示就近取整操作,rmax和rmin分别表示当前量化中所有浮点数的最大值和最小值,具体取值方法见1.2节。Z为区间[0,255]中的某一整型值。非对称量化的公式为q=clamp0, Q-1,roundrs+Z (4)式中,Q的取值根据量化后的整型位数确定。对于8位量化,Q = 28 = 256。clamp(⋅)函数表示为clamp(a,b,x)=a        xax        a≤x≤bb        xb  (5)通过以上操作,将浮点数区间映射到量化区间[0,Q -1]。训练时的推理过程,即前向传播中使用量化后的整型数值进行运算,反向传播计算梯度时使用反量化后的浮点数进行运算,对整型数值执行非对称反量化操作的计算为r=S(q-Z) (6)1.2 主要步骤IAOI量化技术主要涉及卷积、批量归一化(batch-normalization,BN)和激活函数等操作,一个完整的量化模块流程如图1所示。具体运算步骤如下:10.11834/jig.211159.F001图1完整的量化模块流程图Fig.1The flowchart of quantization module1)使用32位浮点型的输入和权重进行常规的卷积操作,得到特征图,然后使用滑动平均(exponential moving average,EMA)操作对特征图进行统计,得到其均值μ和方差σ。2)将BN操作的可学习参数γ和β与卷积操作的参数进行合并,得到合并之后的权重w'和偏置b'。具体为w'=γσ+ε×w (7)b'=β-γ×μσ+ε (8)为了降低BN层的额外复杂度,将BN层与卷积层进行融合,γ和β为BN层的可学习参数, μ和σ分别为卷积操作后得到的特征图的均值和方差,ε是一个较小的常数,主要作用是为了避免分母为0,通过式(7)和式(8)可以得到卷积层与BN层合并之后的权重w'和偏置b',然后分别将合并后的权重w'以及输入都量化为8位整型数值,执行整型卷积运算。在图1的步骤2)中执行最后的加操作时,为了避免8位整型乘积运算的结果溢出,卷积后得到的结果用32位整型累加器存储,b'也使用32位整型进行存储。累加器的量化参数包括尺度系数Sbias=Sw×SA和零点Zbias=0,其中,Sw为图1中权值量化阶段的尺度系数,SA为图1中输入量化阶段的尺度系数。3)将32位整型累加器中的数值,乘以一个缩小比例2-n,并通过截断函数clamp(⋅)得到最终的8位整型数值。在模拟量化的训练过程中,反向传播时将输出反量化为32位的浮点数进行梯度更新。2 基于整型推理量化卷积神经网络的跨域变化检测方法本节分别从样本构建、量化网络设计和完整的跨域变化检测框架3个方面详细介绍提出的基于整型推理量化卷积神经网络的跨域变化检测方法(integer inference-based quantization CNN,IIQ-CNN)。2.1 样本构建变化检测的目的是检测同一地点在一段时间内所发生的变化情况,获得一幅可表征两个时相之间变化的二值变化图ICM (change map)。给定源域(训练数据)中配准后的同一地点具有相同尺寸的时相1图像IS1∈RmS×nS和时相2图像IS2∈RmS×nS,并且通过LR方法(Bovolo和Bruzzone,2005)计算得到差异图(difference image)ISDI∈RmS×nS。具体为ISDI=log(IS1+1)-log(IS2+1) (9)然后,对IS1、IS2和ISDI分别采用最大—最小归一化方法,将图像灰度值范围归一化到[0,1]。具体为I'=I-vminvmax-vmin (10)式中,vmin和vmax分别是当前图像的最小和最大值。最大—最小归一化方法是线性的,不会改变原图的灰度值分布,但能减小图像之间范围差别太大的不利影响。接下来,对IS1,IS2和ISDI 3幅图像逐像素选取邻域为h×h的图像块,对于边缘的像素点,补零进行填充。最后,逐像素将3幅图像对应位置的图像块进行堆叠,形成源域的所有样本XS∈RNS×h×h×3,NS = mS × nS。目标域(测试数据)的所有样本XT∈RNT×h×h×3,NT=mT×nT,以同样方式生成,如图2所示。这种同时采用时相图和差异图构建三通道样本的方式,既能利用差异信息,又避免了检测结果对差异图的过度依赖,并且能够通过CNN有效挖掘时相图和差异图之间的共享信息,提高了跨域变化检测模型的性能。10.11834/jig.211159.F002图2构建三通道样本Fig.2Construction of the three-channel samples众所周知,变化检测是一个典型的样本不平衡问题,通常情况下,变化类的样本数量远小于非变化类的样本数量。源域的所有样本如果全部用于训练,会带来训练样本的极度不平衡问题,导致模型检测精度下降,而且由于类间的相似性,使处于变化类和非变化类边界上的像素点更难以区分。所以本文采用一种基于形态学的样本选择方法(Wang等,2019),在此基础上设计了更加合理的样本选择策略解决训练样本的不平衡问题。首先,利用源域中已知的参考图(图3(a))通过Canny边缘检测算法提取边界(图3(b)),再对边界进行膨胀处理,将膨胀区域定义为边界集ΩB,其余两个部分分别为变化集ΩC和非变化集ΩU(图3(c)),整体流程如图3所示。然后,从ΩB、ΩC和ΩU中分别随机选择SNB、SNC和SNU个样本作为最终的训练样本XStrn∈RSN×h×h×3,具体为SNB=12ΩB (11)SN=ΩB (12)SNC=min 12ΩC, 14SN  (13)SNU=SN-SNB-SNC (14)式中,SN=SNB+SNC+SNU,⋅表示集合中样本的个数。10.11834/jig.211159.F003图3基于形态学的样本选择Fig.3Sample selection based on morphology ((a) reference image; (b) extracted boundary; (c) sample set division)2.2 量化卷积神经网络设计本文的整型推理量化CNN的基础网络参考VGG-16Net的网络结构设计,配置如表1所示。每个卷积层包含BN操作和非线性激活函数ReLU6(rectified linear unit 6)。ReLU6就是通常的ReLU函数但是限制最大输出值为6。选择ReLU6是因为如果对ReLU的激活范围不加限制,输出范围将是[0,+∞),量化后的无符号8位整型(Uint8)或无符号4位整型(Uint4)无法精确描述如此大范围的数值,会带来精度损失。提出的IIQ-CNN方法采用交叉熵损失函数,在表1所示的基础网络之上,利用整型算术推理量化方法对网络进行模拟量化。由于模拟量化训练在反向传播过程中,权重和网络的输出都保存为浮点数的形式,所以在训练结束后需要对权重参数进行一次整型量化操作,保存整型量化模型。10.11834/jig.211159.T001表1提出的IIQ-CNN方法的网络结构Table 1Architecture of the proposed IIQ-CNN层输入尺寸输出尺寸卷积核步长CNNConv111×11×311×11×643×31Conv211×11×6411×11×643×31Max_Pool111×11×645×5×642×22Conv35×5×1285×5×1283×31Conv45×5×1285×5×1283×31Max_Pool25×5×1282×2×1282×22Conv52×2×2562×2×2563×31Conv62×2×2562×2×2563×31Conv72×2×2562×2×2563×31Max_Pool32×2×2561×1×2562×22FCFlatten1×1×256256--Fc12564 096--Fc24 0964 096--Fc34 0962--注:“-”表示不涉及卷积核的操作。2.3 跨域变化检测框架在SAR图像变化检测中,大多数情况下标记数据是稀缺的,收集这样的数据既耗时又昂贵,需要多位专家利用专业知识、实地勘探或对比对应的光学图像获得。但是相比较无监督方法生成的伪标签,专家知识获得的标记精度更高。因此本文主要研究如何充分利用已有的标记数据进行跨域变化检测的问题。其中,源域表示已有标记的数据,目标域表示待检测的数据。同时,改进了基于形态学的样本选择方法,用来解决模型训练时的样本不平衡问题。在整型推理量化技术和设计的CNN深度网络的基础上,提出了基于整型推理量化CNN的跨域变化检测框架,整体流程如图4所示。10.11834/jig.211159.F004图4基于整型推理量化卷积神经网络的跨域变化检测方法流程Fig.4The flowchart of cross-domain change detection based on integer inference quantization CNN3 实验结果与分析3.1 实验数据为了验证本文方法的有效性,使用4组真实的SAR图像数据进行实验分析。图5给出了4组数据的时相1、时相2图像和参考图。其中,黄河数据A(YR-A)(Gong等,2016)和黄河数据B(YR-B)(Hou等,2014)是通过Radarsat-2卫星分别在2008年6月和2009年6月在黄河入海口地区获得,分辨率为8 m,大小分别为306 × 291像素和400 × 350像素。仙台数据(Sendai-A和Sendai-B)(Cui等,2016)是在日本仙台地震之前(2010年10月)和之后(2011年5月)拍摄的TerraSAR-X图像的一部分,分辨率为2.5 m,尺寸分别为549 × 560像素和613 × 641像素。4组数据的参考图均通过对比对应的光学图像和专家知识获得。所有实验均采用leave-one-out的方式进行,即依次将其中1组数据作为目标域图像进行检测,余下的3组数据作为源域图像训练模型。10.11834/jig.211159.F005图5黄河数据和仙台数据Fig.5YR-A, YR-B, Sendai-A, Sendai-B datasets((a) temporal one; (b) temporal two; (c) reference images)3.2 评价指标变化检测的性能评价包括视觉上的主观评价和定量评价。本文采用虚警(false positive,FP)、漏检(false negative,FN)和Kappa系数(Congalton,1991)作为定量评价指标。FP表示在参考图中属于非变化类,但在变化检测结果图中将像素点错分为变化类的个数;FN表示在参考图中属于变化类,但在变化检测结果图中将像素点错分为非变化类的个数;Kappa系数用于衡量实际的变化检测结果图与参考图的一致性程度,Kappa系数排除了偶然一致的情况,比简单的一致百分比更加鲁棒,能够比较客观地衡量检测结果与参考图一致的程度。Kappa系数接近1,表示分类性能越好。Kappa系数计算为Kappa=Po-Pe1-Pe (15)式中,Po表示实际的一致率,Pe表示理论的一致率,计算为Po=TN+TPN (16)Pe=(TP+FA)(FN+TP)+(FN+TN)(FP+TN)N2 (17)式中,N表示单幅SAR图像总的像素点数。TP表示参考图属于变化类,检测结果也属于变化类的样本点个数;TN表示参考图属于非变化类,检测结果也属于非变化类的样本点个数。3.3 实验设置3.3.1 实验1实验1用于对比本文方法IIQ-CNN和Li等人(2019)提出的CNN变化检测方法(CNN)的检测性能。CNN方法仅使用了时相1和时相2图像作为训练数据。实验中IIQ-CNN采用未量化的32位浮点型(Float32)。由于原CNN变化检测方法中,训练样本采用伪标签生成,为了公平起见,将其改成与本文一致的基于形态学样本选择的方法,即两种方法使用的随机训练样本的样本个数和样本点都一致。CNN中图像块为5 × 5与原文相同,本文方法中图像块为11 × 11,实验结果如表2所示,图6是视觉效果对比图。10.11834/jig.211159.T002表2实验1的数值评价指标对比结果Table 2Comparisons of evaluation criteria of experiment one源域目标域方法FPFNKappa/%YR-B,Sendai-A,Sendai-BYR-ACNN83655786.27IIQ-CNN48445990.50YR-A,Sendai-A,Sendai-BYR-BCNN8674 67276.03IIQ-CNN1 5382 61183.58Sendai-B,YR-A,YR-BSendai-ACNN24 3506 83770.63IIQ-CNN7 42413 39579.7Sendai-A,YR-A,YR-BSendai-BCNN9 8936 89676.59IIQ-CNN6 5547 32382.93注:加粗字体表示各组实验中各列的最优结果。10.11834/jig.211159.F006图6实验1的视觉效果对比图Fig.6Comparisons of visual experiment results of experiment one ((a) CNN; (b) IIQ-CNN; (c) reference images)从表2可以看出,在加入差异图后,对4组数据,FP、FN和Kappa系数3项评价指标都有明显改进,而且从图9给出的4组数据的视觉效果对比图中能看出,本文方法的检测结果噪声点更少,边界更清晰,与参考图更接近。验证了本文提出的三通道样本构建和网络结构的有效性。10.11834/jig.211159.F007图7实验2的视觉效果对比图Fig.7Comparisons of visual experiment results of experiment two ((a) unquantized; (b) Uint16; (c) Uint8; (d) Uint4)10.11834/jig.211159.F008图8不同模型复杂度下的推理时间对比Fig.8Comparisons of inference time under different model complexity((a) YR-A; (b) YR-B; (c) Sendai-A; (d) Sendai-B)10.11834/jig.211159.F009图9不同模型复杂度下的Kappa系数对比Fig.9Comparisons of Kappa coefficient under different model complexity((a) YR-A; (b) YR-B; (c) Sendai-A; (d) Sendai-B)3.3.2 实验2实验2在设计的三通道CNN网络模型中加入整型推理量化算法,得到提出的IIQ-CNN方法。为了更好地验证IIQ-CNN的量化性能,分别将其量化为16位(Uint16)、8位(Uint8)和4位(Uint4)符号整型。实验结果如表3所示,并加入推理时间对比。实验2的视觉效果对比图如图7所示。10.11834/jig.211159.T003表3实验2的数值评价指标对比结果Table 3Comparisons of evaluation criteria of experiment two源域目标域类型FPFNKappa/%时间/msYR-B, Sendai-A, Sendai-BYR-A未量化Float3248445990.50241量化Uint1665831790.44236量化Uint874825990.25232量化Uint470631790.01227YR-A, Sendai-A, Sendai-BYR-B未量化Float321 5382 61183.58350量化Uint162 3072 17882.9341量化Uint81 7822 61682.72333量化Uint42 9042 91780.32325Sendai-B, YR-A, YR-BSendai-A未量化Float327 42413 39579.701 870量化Uint166 77814 22079.361 813量化Uint89 24212 35879.261 795量化Uint422 7957 27473.751 757Sendai-A, YR-A, YR-BSendai-B未量化Float326 5547 32382.932 708量化Uint165 4149 85580.552 603量化Uint83 35911 52480.332 572量化Uint42 29213 32778.742 491注:加粗字体表示各组实验中各列的最优结果。从表3可以看出,对于4组数据,未量化时的效果最好,量化为Uint16和Uint8时略低于未量化,量化为Uint4时,效果降低较为明显,这是由于Uint4只能将权重映射到0~15之间的整型数值,取值区间过小导致网络的表达能力欠佳。从图7的视觉效果对比来看,未量化、Uint16和Uint8在视觉效果上几乎没有差别。从运行时间上来看,在4组数据集上推理时间均有不同程度的下降,说明量化方法在降低推理时间的同时,能够较好地保持浮点数模型的检测精度。3.3.3 实验3在实验2中,由于网络结构比较简单,量化前后时间差别不是很明显。为了更清楚地对比量化算法对网络的压缩性能,增加模型的复杂度,对原始的IIQ-CNN模型(7层卷积操作)增加卷积层,分别设置为10和13层卷积操作,每层卷积包括BN和ReLU6,其余网络结构不变。对应的输入图像块大小也调整为17 × 17和35 × 35。4组数据在不同模型复杂度下的时间对比柱状图如图8所示,不同模型复杂度下检测性能的Kappa系数对比柱状图如图9所示。从图8可以看出,量化比特数越小,模型的推理时间越短。而且随着网络的逐渐加深,在网络权值参数变多的情况下,整型量化算法对变化检测推理时间的加速效果更加明显,加速效果更好。如对于Sendai-B数据,当IIQ-CNN只有7层卷积,参数量为53.47 M时,Uint16的推理时间比Float32的推理时间减少了217 ms。而当IIQ-CNN增加到13层卷积,参数量增加为69.07 M时,Uint16的推理时间比Float32的推理时间减少了5 037 ms。其他3组数据也呈现出此趋势。这也符合越复杂的网络冗余度越高的基本认知,即越冗余的网络在使用量化算法时,效果越明显。从图9可以看出,在不同的模型复杂度下,对于4组数据,Uint16和Uint8的Kappa值与未量化时(F32)的Kappa值仅有非常微小的下降,进一步说明了所提量化方法在加速推理的同时能保持较高的检测精度。Uint4在YR-A与YR-B数据集上检测性能下降较大,这是由于当模型深度增加时,会导致模型出现退化问题,即检测精度随着模型深度的增加趋于饱和甚至下降。并且随着模型深度的增加,输入图像块的大小也相应增大,由于每个图像块的标签是根据其中心像素点的变化情况确定的,如果图像块过大,会导致图像块包含太多与中心像素类别无关的特征,尤其对于YR-A和YR-B数据集,变化区域较小而且呈条纹状,使得检测性能下降比较明显。4 结论本文首次将整型算术推理技术引入到变化检测任务,重点研究轻量化的跨域变化检测方法。在提出的IIQ-CNN中,使用源域双时相图和差异图构建训练样本,通过设计的整型推理量化卷积神经网络对目标域进行变化检测。该方法充分利用差异信息和时相图与差异图之间的共享信息,提高了变化检测的精度;同时,整型推理量化技术的引入能够减小模型规模,有效降低了推理时间,并且未造成明显的变化检测性能损失。而且,现有的绝大多数变化检测方法都是基于相同的数据域,也就是同图训练、同图测试。而跨域变化检测是本文的研究目的之一,即充分利用源域数据中,比伪标签精度更高的参考图所提供的标记信息来训练模型,进而对目标域数据进行检测。这不仅能克服相同数据域变化检测方法的性能过度依赖伪标签质量的不足,还有助于解决不同数据之间模型泛化性较弱的难题。通过4组包含不同地物变化信息的真实的SAR图像数据和从不同角度设计的实验,充分验证了所提方法的有效性。在下一步工作中,将尝试将整型推理量化技术与图网络相结合,在提高变化检测性能的同时,进一步获得更高的模型加速比,提高变化检测模型的实时性和鲁棒性,开发基于嵌入式设备的轻量化变化检测平台,促进变化检测方法在灾害评估和灾后重建等实际需求中的广泛应用。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读