Print

发布时间: 2016-07-25
摘要点击次数: 288
全文下载次数: 39
DOI: 10.11834/jig.20160711
2016 | Volumn 21 | Number 7




    遥感图像处理    




  <<上一篇 




  下一篇>> 





深度置信网络在极化SAR图像分类中的应用
expand article info 邓磊, 付姗姗, 张儒侠
首都师范大学资源环境与旅游学院, 北京 100048

摘要

目的 深度置信网络能够从数据中自动学习、提取特征,在特征学习方面具有突出优势。极化SAR图像分类中存在海量特征利用率低、特征选取主观性强的问题。为了解决这一问题,提出一种基于深度置信网络的极化SAR图像分类方法。 方法 首先进行海量分类特征提取,获得极化类、辐射类、空间类和子孔径类四类特征构成的特征集;然后在特征集基础上选取样本并构建特征矢量,用以输入到深度置信网络模型之中;最后利用深度置信网络的方法对海量分类特征进行逐层学习抽象,获得有效的分类特征进行分类。 结果 采用AIRSAR数据进行实验,分类结果精度达到91.06%。通过与经典Wishart监督分类、逻辑回归分类方法对比,表现了深度置信网络方法在特征学习方面的突出优势,验证了方法的适用性。 结论 针对极化SAR图像海量特征的选取与利用,提出了一种新的分类方法,为极化SAR图像分类提供了一种新思路,为深度置信网络获得更广泛地应用进行有益的探索和尝试。

关键词

极化雷达, 深度置信网络, 图像分类, 深度学习, 遥感, 特征学习

Application of deep belief network in polarimetric SAR image classification
expand article info Deng Lei, Fu Shanshan, Zhang Ruxia
College of Resource Environment and Tourism, Capital Normal University, Beijing 100048, China
Supported by: National Natural Science Foundation of China(40801172)

Abstract

Objective Several problems exist in polarimetric synthetic aperture radar (SAR) image classification, such as feature selection subjectivity and low utilization efficiency of massive features. Deep belief network (DBN) has a significant advantage in feature learning, which can be used in learning and extracting effective features from massive original features. Based on this observation, a polarimetric SAR image classification method based on DBN is proposed. Method The proposed method is capable of level-by-level learning and abstracting for the mass original polarimetric features. First, the original polarimetric feature sets are extracted from polarimetric SAR images. Second, 20000 samples are selected, and feature vectors are constructed. Each pixel contains 267 original polarimetric features and class labels. Thus, a pixel is a sample, namely, a feature vector. The feature vector is used as input in the DBN model. Then, the DBN model is built to extract abstract features, namely, effective features. These features are achieved through level-by-level learning. Finally, the logistic regression, a classifier at the top of the DBN model, is applied to classify the entire polarimetric SAR image. Result Considering AIRSAR data as an example, the overall classification accuracy can reach a high accuracy of 91.06%. The DBN method shows outstanding advantage in feature learning. Simulation experiments show that compared with the traditional Wishart supervised classification algorithm, the DBN algorithm performs much better in classification. Simultaneously, the necessity of the DBN model has been proven by comparing with the logistic regression classification. The logistic regression classification classifies the polarimetric image using the original polarimetric features without any deep learning and extraction. In brief, the effectiveness of the DBN model has been validated through analysis and comparison. Conclusion In this study, a novel polarimetric SAR image classification method is proposed. Mass polarimetric features of the polarimetric SAR image are utilized for the first time through the DBN. The advantages and applicability of the proposed method are analyzed. Overall, a novel method is proposed for polarimetric SAR image classification, which paves the way for further research and offer beneficial attempts for the utilization of DBN in polarimetric SAR image processing.

Key words

polarimetric SAR, deep belief network, image classification, deep learning, remote sensing, feature learning

0 引 言

极化合成孔径雷达(PolSAR)是一种高分辨率成像系统,具有全天时全天候、穿透云雨的能力,并且包含丰富的地物目标信息,是遥感领域发展的主要方向之一[1-2]。极化描述的是电磁波的电场矢量端点作为时间函数形成的空间轨迹,能够反映电磁波的矢量特性。因此极化SAR能够通过复散射矩阵描述目标的散射机理,提供更为丰富的信息,在图像分类和识别中具有很多优势。研究表明,利用极化SAR数据进行土地覆盖分类能获得更高的精度[3-5]。随着极化SAR系统的发展,ASAR/ENVISAT、 PALSAR/ALOS和RADARSAT-2等极化数据越来越丰富,极化SAR图像分类也成为了一项重要研究课题。

目前,极化SAR图像分类的主要方法为根据目标地物的散射特性提取特征,并选择合适的分类器进行图像分类[6-7]。从极化SAR数据中可获取大量特征,采用多种特征组合进行图像识别与分类已得到广泛应用,如辐射信息、极化分解信息、子孔径分解信息等。虽然有些方法取得了令人鼓舞的进展,但特征选取问题一直是困扰学者们的一大难题[8]。传统的选取方式主要依靠人工选取、依赖于专业知识并很难有效利用海量的特征数据,耗时费力[9]

深度置信网络(DBN)为有效的目标特征选取提供了可能性。它是几种主要深度学习(DL)模型之一,含有多层的多感知器机器学习结构[10-11]。它通过组合原始特征形成更为抽象的高层特征表达,从而学习到更加有效的特征,是一种能够从数据中自动学习、提取特征的方法。在特征学习方面表现出的优势使得DBN在学术界引起了广泛的关注,并成功应用于仿生学、语音识别、互联网以及图像识别等领域[12-14]。但是在遥感领域的应用仍处于初步发展阶段[15-17],尤其在图像分类方面的应用十分薄弱。吕启等人[18]首次将深度置信网络应用于极化SAR图像分类中,但只是将模型与极化SAR数据的机械组合。到目前为止,尚未发现采用深度置信网络对极化SAR分类特征进行学习利用,然后进行分类的相关工作。

从极化SAR数据中可以提取众多分类特征,但海量分类特征在分类过程中具有很大的冗余,并且随着分类特征数量的增加,分类精度并不会提高,甚至有可能降低。另一方面,如果仅主观选取部分分类特征,由于特征利用率低,分类精度也难以达到较高的水平。因此特征的选择与利用一直是一个难题。针对极化SAR特征数量大、选取与利用困难的问题,提出了一种基于深度置信网络的极化SAR图像分类方法。利用深度置信网络模型对数据的海量分类特征进行学习,充分挖掘数据之间的深层关系,获得利于分类的有效特征进行图像分类。通过与传统的Wishart监督分类、逻辑回归分类方法作对比,证明了该方法的有效性。

1 DBN图像分类模型

极化SAR图像包含丰富的极化信息,从中可获得丰富的分类特征参数。研究表明,分类精度强烈依赖于分类特征的选取。DBN作为一种深度学习模型,在特征选择与特征学习方面有着显著的优势。DBN能够进行分类特征学习,充分挖掘极化SAR数据中丰富的信息,从而提升分类效果。对DBN图像分类模型进行构建,如图 1所示。

图 1 DBN分类模型
Fig. 1 DBN classification model

1.1 分类特征提取

分类特征是进行极化SAR图像分类的基础。分类特征提取的目的是获得丰富的、能够描述极化SAR信息的特征集,作为DBN模型的输入。对极化SAR数据进行分类特征提取,共获得特征参数267个,主要包括:极化类信息64个、辐射类信息17个、空间类信息157个和子孔径类信息29个。

1.1.1 极化类信息

极化SAR数据包含丰富的地物信息,极化分解是一种有效的描述地物极化信息的方法。选取不同的极化分解方法可以得到不同的分解特征参数[19]。本文选取的极化分解方法有Cloude分解、Huynen分解、Freeman2分解、Yamaguchi4分解等(详细分解方法及结果见表 1)。除此之外提取了描述极化散射信息的参数,例如散射差异性信息等。通过极化分解和极化散射参数的提取,共获得极化类信息特征64个。

表 1 极化类信息
Table 1 Polarization Information

下载CSV
    名称    极化类特征
Barnes分解Barnes1(T11/T22/T33), Barnes2(T11/T22/T33)
Huynen分解Huynen(T11/T22/T33)
Holm分解Holm1(T11/T22/T33), Holm2(T11/T22/T33)
Cloude分解Cloude(T11/T22/T33)
Freeman分解Freeman2(Vol/Grd), Freeman(Vol/Odd/Dbl)
VanZyl3分解VanZyl(Vol/Odd/Dbl)
Yamaguchi分解Yam3(Vol/Odd/Dbl), Yam4(Vol/Odd/Dbl/Hl)
Neumann2分解Neum2(Mod/Pha)
Krogager分解Krog(S/D/H)
Touzi分解Touzi(α/α1/α2/α3/tau/tau1/tau2/tau3)
H/A/Alpha分解H、A、α/α1/α2/α3、PedestalHeight、DERD, ShannonEntropy, SERD, PolarizationAsymmetry, PolarizationFraction, RadarVegetationIndex
散射信息Predominance Depolarization index, Conformity Coefficient

1.1.2 辐射类信息

散射系数矩阵、极化散射功率矩阵等参数可完全描述目标散射回波的幅度、相位等目标散特性。从极化SAR数据中提取的辐射类信息就是描述极化数据基本的原始辐射信息(如相位等)以及彼此间关系(如相关系数)的特征。共提取辐射类特征17个,如表 2所示。

表 2 辐射类信息
Table 2 Radiation Information

下载CSV
   名称   辐射类特征
相干矩阵T11/T22/T33
振幅相关系数Coef_HH-VV
相位差PD_HH-VV
比率R_db(CP/XP/HH-VV)
T3相关系数Coef_R12(Mod/Ph), Coef_R23(Mod/Ph), Coef_R13(Mod/Ph), Coef_CCC(Mod/Ph)
总功率SPAN

1.1.3 空间类信息

空间信息是地物目标在空间域或变换域的分布信息以及统计信息,能够对地物结构、纹理特征进行表达,是图像分类中的重要参数。分别从极化SAR数据的SPAN、T11、T22、T33提取空间类特征,包括:基于灰度共生矩阵(GLCM)的纹理信息、基于统计的空间信息和基于边缘的空间信息(详见表 3)。灰度共生矩阵纹理信息主要是求取0°、45°、90°、135°这4个方向的对比度、均匀性等参数;基于统计的空间信息主要是提取平均差、方差等统计特征参数。共提取空间类信息特征157个。

表 3 空间类信息
Table 3 Space information

下载CSV
   名称   空间类特征
基于GLCM的纹理特征mean(0/45/90/135), dissim(0/45/90/135), homo(0/45/90/135), H(0/45/90/135), contrast(0/45/90/135), unifor(0/45/90/135), Texture((VI/VA/VL/U)
基于统计的特征mean, median, mean_deviation, variance, midian_deviation, euclidian_distance, skywness, kurtosis, energy, coefficien_variation
边缘特征Canny, POA5

1.1.4 子孔径类信息

子孔径分解是利用目标极化特性随视角不同而有所差异的原理,将极化SAR数据分解为多个低分辨率但视角不同的子图像。此处采用方位向分解的方式获得两幅子孔径图像,即维持距离向分辨率不变的同时,沿方位向进行分解。提取的特征包括子孔径差异特征和子孔径相干特征。子孔径差异特征主要将从两幅子孔径图像获得的H/A/α分解参数、Freeman3分解参数、Yamaguchi4分解参数进行差值,从而获得差异特征。子孔径相干特征主要指复相干信息、一致性信息和相位差异。共获得子孔径类特征29个如下:

1) 子孔径差异特征:diff_H,diff_A,diff_alpha,diff_Freeman(Vol/Odd/Dbl),diff_Yamguchi4(Vol/Odd/Dbl/Hlx)。

2) 子孔径相干特征:Interfere_Int (HH/HV/VV),Interfere_pha(HH/HV/VV),Interfere_am(HH/HV/VV),Coherence_Int (HH/HV/VV),Coherence_pha(HH/HV/VV),Coherence_am(HH/HV/VV),Phase diversity。

1.2 DBN学习

深度置信网络由多个堆叠的限制性玻尔兹曼机(RBM)单元与一个反向传播(BP)网络构成。在具体训练过程中分为预训练和微调两步,如图 2所示。预训练过程采用非监督贪婪方法自低层到顶层逐层训练每个RBM,低一层的RBM输出作为高一层RBM的输入,并在此过程中更新权重。预训练结束后得到的权重作为DBN网络的初始权重,然后采用监督学习的方式进行网络的微调,其原理为BP网络,即通过最小化顶层输出与预期输出的误差来调节整个网络。

图 2 DBN训练
Fig. 2 DBN Train

RBM可以看为一个二部图,由可视层(v)和隐藏层(h)组成,同一层单元之间没有连接,v层与h层之间通过权重w全连接(如图 3所示)。假设隐藏层与可视层神经元为二值(0或1),RBM可用联合概率分布来表示,其联合组态能量函数为

$\begin{array}{c} E\left( {v,h|\theta } \right) = - \sum\limits_{i = 1}^I {{b_i}{v_i}} - \sum\limits_{j = 1}^I {{a_j}{h_j}} - \\ \sum\limits_{i = 1}^I {\sum\limits_{j = 1}^J {{w_{ij}}{v_i}{h_j}} } \end{array}$ (1)

式中,θ={wij,aj,bi}是RBM参数,wij表示可视层与隐藏层之间的连接权重,ajbi分别为隐藏层和可视层单元的偏置项。由于可视层和隐藏层都满足Boltzmann分布,当输入可视层v时,可以由激活函数P(h|v)得到隐藏层h,然后根据P(h|v)可以将隐藏层h重建可视层单元v′,与此同时调节参数θ。反复执行上述步骤,直至由隐藏层h重构的可视层v′与原始输入的可视层v相同,此时获得的隐藏层就是可视层单元的另一种表达,即作为可视层输入数据的有效特征。当给定可视层或隐藏层神经元状态时,隐藏层与可视层单元的激活概率分别为

$P\left( {{h_j} = 1|v} \right) = \frac{1}{{1 + \exp \left( { - \sum\limits_i {{w_{ij}}{v_i} - {a_j}} } \right)}}$ (2)

$P\left( {{v_i} = 1|v} \right) = \frac{1}{{1 + \exp \left( { - \sum\limits_j {{w_{ij}}{h_j} - {b_i}} } \right)}}$ (3)

图 3 限制性玻尔兹曼机(RBM)
Fig. 3 Restricted Boltzmann machine (RBM)

RBM模型的参数优化过程可以看作对模型能量最小化过程,即使重构误差(重构的可视层v′与原始的可视层v之间的误差)最小。在其非监督训练过程中通常采用对比散度(CD)方式来更新权重参数[20],即

$\begin{array}{c} \frac{{\partial {\rm{In}}p\left( {v,\varphi } \right)}}{{\partial W}} = \Delta w = \\ \in \left( {{E_{{\rm{data}}}}\left( {{v_i}{h_j}} \right) - {E_{{\rm{recon}}}}\left( {{v_i}{h_j}} \right)} \right) \end{array}$ (4)

$\begin{array}{c} \frac{{\partial {\rm{In}}p\left( {v,\varphi } \right)}}{{\partial a}}\\ \Delta a = \in \left( {{E_{{\rm{data}}}}\left( {{h_j}} \right) - {E_{{\rm{recon}}}}\left( {{h_j}} \right)} \right) \end{array}$ (5)

$\begin{array}{*{20}{c}} {\frac{{\partial {\rm{In}}p\left( {v,\varphi } \right)}}{{\partial b}} = }\\ {\Delta b = \in \left( {{E_{{\rm{data}}}}\left( {{v_i}} \right) - {E_{{\rm{recon}}}}\left( {{v_i}} \right)} \right)} \end{array}$ (6)

式中,∈为学习率,Edata(·)是将可见状态值取为训练样本值时得到的依赖数据的期望值,为整个网络单元的联合概率分布期望值;Erecon(·)是可见单元为随机二值状态时的期望值。

2 基于DBN的极化SAR图像分类

从极化SAR数据中提取丰富的分类特征,然后利用DBN学习有利于图像分类的有效分类特征。首先对极化SAR数据进行分类特征提取,获得包含极化类信息、辐射类信息、空间类信息和子孔径类信息4类特征集,为深度置信网络提供有效的输入;然后利用DBN进行逐层学习,将分类特征进行抽象与组合,获取有效分类特征,用于最终的分类;最后运用逻辑回归的方法进行分类。流程如图 4所示。

图 4 基于DBN极化SAR分类流程图
Fig. 4 Polarimetric SAR classification flow chart based on DBN

具体算法实现步骤为:

1) 分类特征提取。对经过滤波、地理编码等预处理的极化SAR数据进行分类特征提取,采用5×5的移动窗口,提取极化类、辐射类、空间类和子孔径类特征共267个,形成分类特征集。

2) 特征矢量构建。在分类特征集的基础上,人工选取样本、定义类别标签。每个像元即为一个样本,由267个分类特征和类别标签构成,称之为特征矢量。通过特征矢量构建可以获得众多带标签的样本,每个样本为267×1的1维矢量。特征矢量的构建为DBN提供输入。

3)DBN提取有效分类特征.对上述样本特征矢量进行归一化处理,作为DBN可视层节点的输入。DBN结构为267-80-80-80-6。第1层为可视层,共267个节点,对应输入特征矢量的267个特征;第2层、第3层、第4层均为隐藏层,各有80个节点;第5层为输出层,共6个节点,对应6种地物类别。DBN可以对输入的特征矢量逐层进行抽象学习,从而获得有利于分类的有效分类特征。

4) 逻辑回归分类.DBN顶层为逻辑回归函数,对学习到的有效分类特征进行决策判断,作为最终的输出,用来得到最终的地物类别。

3 实验与分析

3.1 实验数据

实验数据为1994年NASA/JPL AIRSAR系统C波段极化SAR图像,地点为美国旧金山地区,图像大小为281×309像素。雷达飞行方向自西向东,方位向分辨率为9.3 m,距离向分辨率为6.6 m,如图 5所示。通过目视解译看出,研究区包含多种地物,如海洋、湖泊、建筑、道路、林地等。将海洋、湖泊等合并为水体类别,公园中茂密植被和城区中的草地等划分为草地,由于雷达图像散射机制不同,建筑划分为与雷达方位向平行的正建筑和与方位向有一定夹角的斜建筑。将实验区地物划分为水体(WT)、林地(FO)、草地(GS)、正建筑(OB)、斜建筑(NB)和道路(RO)6类。

图 5 旧金山地区AIRSAR C波段Pauli图像
Fig. 5 San Francisco AIRSAR c-band Pauli images

为了保证模型的实用性与分类结果评价的准确性,采用人工选取的方式均匀选取20 000个像素点,作为样本,然后平均分为训练样本和测试样本两部分(表 4)。训练样本用于训练深度置信网络,测试样本用于分类精度验证。

表 4 样本数据统计表
Table 4 Sample data

下载CSV
地物类别训练样本/像元数测试样本/像元数
水体1 2221 256
林地4 1094 264
草地972986
正建筑1 021953
斜建筑819796
道路1 8571 745

3.2 参数设置

软件仿真环境为Win7下安装的Matlab2012b,电脑机器配置为Intel(R)Xeon CPU E5-2650,2 GHz,64.0 GB RAM。通过参考前人经验[21-22]与实际测试,在Matlab中对模型参数设置如下:DBN网络层数为5,结构为267-80-80-80-6,学习率设置为0.1,动量学习率设置为0.05,迭代次数设为1 000。为了提高网络的训练速度,采用批处理的方法进行训练。批训练大小为100,即每次随机选取100个样本输入到网络中进行训练。

3.3 实验结果与分析

将本文提出的基于深度置信网络的分类方法与传统的Wishart监督分类[23]方法进行比较,结果如图 6所示。通过观察可发现,Wishart分类方法对水体分类效果较好,但是总体分类表现欠佳,林地和建筑有严重的混分现象。本文方法能够清晰辨识6类地物,较好表现了地物类别细节,尤其是建筑的分类效果有了极大的改善,总体分类效果明显优于Wishart分类。为了详细论证方法的有效性,对分类结果进行定量评价。定量评价主要包含4个指标因子:混淆矩阵、Kappa系数、总体精度(OA)、用户精度(UA)和生产者精度(PA)[24]

图 6 旧金山地区分类结果图
Fig. 6 Classificationresult on San Francisco ((a)Wishart classification; (b)proposed DBN classification)

3.3.1 DBN学习对分类精度的影响

DBN学习可以抽象出有效的分类特征。为了评估DBN模型对分类结果的影响,将直接采用分类特征的逻辑回归分类(LR)与DBN学习后的有效分类特征的逻辑回归分类(DBN-LR)进行对比,分类结果的混淆矩阵分别如表 5表 6所示。分类总体精度由86.87%上升至91.06%,提高约为5%。Kappa系数由0.825上升至0.881,上升约0.6。同时,各个类别的用户精度和生产者精度均有所提升,其中道路用户精度由81%上升至91%,提高为10%;草地由68%上升至77%,提升为9%;斜建筑由83%上升至88%,提升5%;正建筑由91%上升至97%,提升6%;水体用户精度虽然没有上升但其生产者精度提升了5%。以上结果表明,

表 5 LR方法分类精度
Table 5 Classification accuracy of logistic regression

下载CSV
类别FOWTGSNBOBROUA/%
FO98016011145481
WT13 99063009796
GS331246680115868
NB10000862394083
OB40065728691
RO461371125731 48081
PA/%849474799481
OA/%86.87Kappa:0.825

表 6 DBN-LR方法分类精度
Table 6 Classification Accuracy of DBN-LR

下载CSV
类别FOWTGSNBOBROUA/%
FO1 05523211615084
WT14 10094006996
GS66117583014877
NB5000838244188
OB20017772597
RO1730872711 58391
PA/%899978849783
OA/%91.06Kappa 0.881

DBN方法可对粗糙的分类特征进行学习抽象,获得更有效的分类特征,进而提高了各地物的分类精度。

3.3.2 分类特征类型对分类结果的影响

3.2.1节表明DBN学习能够获得更为有效的分类特征。本节将进一步探讨当输入到DBN模型中的分类特征改变时,对分类结果的影响。

保持数据预处理方式与DBN网络模型不变,改变分类特征组合方式,对分类特征类型的影响进行定量评估。图 7为采用不同分类特征组合的用户精度直方图。其中Pol为只考虑极化类信息作为分类特征,Pol&Rad为极化类信息与辐射类信息共同作为分类特征,Pol&Rad&TF为极化类信息、辐射类信息和子孔径类信息共同作为分类特征,all为本文提出的4类特征全部应用的分类精度。对比发现,随着分类特征类型的增加,各个类别的用户精度都有所提升。其中草地由62.72%升至78.00%,提高约为15%,正建筑由87.97%上升至97.00%,上升约9%,道路由76.00%上升至83.00%,上升7%,斜建筑由79.62%上升到84%,上升约5%。这表明分类特征的丰富性有助于提高分类精度。

图 7 不同分类特征类型组合之用户精度
Fig. 7 Useraccuracy of different features combinations

图 8显示了不同分类特征组合的分类结果细节图。通过观察发现,当分类特征类型很少时,如图 8(a),草地与林地混分现象严重,特征类型增加很大程度上改善了此类现象,提高了草地的分类效果,如图 8(d)。同样,当使用的分类特征类型较少时,如图 8(e),道路很难被识别,随着特征类型的增加,如图 8(f)(g),道路分类情况得到提高,但脉络不连贯,本文方法(图 8(h))能够完整连贯的对道路进行分类。图 8(i)(j)部分建筑分为林地且道路不明显,本文方法(图 8(l))建筑与道路边界清晰,分类效果较好。上述结果表明分类特征类型增加有利于提高图像分类效果,与图 7得出结果一致。

图 8 不同分类特征类型组合类细节图
Fig. 8 Classification details of different features combinations ((a)Pol-GS; (b)Pol&Rad-GS; (c)Pol&Rad&TF-GS; (d)all-GS; (e)Pol-RO; (f)Pol&Rad-RO; (g)Pol&Rad&TF-RO; (h)all-RO; (i)Pol-NB; (j)Pol&Rad-NB; (k)Pol&Rad&TF-NB; (l)all-NB)

通过分析发现分类特征类型的增加有助于提高分类精度。其原因是分类特征类型的增加使其对极化SAR数据的描述更为丰富、准确,DBN可利用的原始信息增加。虽然可能包含冗余信息,但深度置信网络具有处理大规模海量数据的能力与良好的数据挖掘能力,因此DBN模型对极化SAR数据的分类精度上升,利用能力上升。

4 结 论

极化SAR数据可以提取的分类特征众多,利用DBN对分类特征进行学习,避免了人为选取分类特征时存在的特征利用率低、分类精度不高的状况。主要贡献在于首次将DBN应用于极化SAR的分类特征抽象、学习工作。通过DBN学习,不仅能够充分利用丰富的分类特征,同时避免了人为特征选择过程中存在的问题。通过与传统的Wishart监督分类方法以及不经过特征学习的逻辑回归方法进行对比,验证了方法的有效性,实现了极化SAR数据的高精度分类。验证了深度置信网络在极化SAR分类中的可行性与有效性,对深度置信网络理论在极化SAR图像处理中的应用有一定的借鉴作用。由于极化SAR数据具有众多波段,本文研究采用C波段数据,因此将深度置信网络应用于不同波段极化SAR数据中进行分类是接下来的主要研究工作。

参考文献

  • [1] Wang W G, Lu F, Sun Z W, et al. A novel unsupervised classifier ofpolarimetric SAR Images[J]. Procedia Engineering, 2011 ,15 : 1595 –1599. [DOI:10.1016/j.proeng.2011.08.297]
  • [2] Lee J S, Pottier E. Polarimetric Radar Imaging: From Basics to Applications[M]. Boca Raton: CRC Press, 2009 .
  • [3] Freitas C D C, Soler L D S, Sant'Anna S J S, et al. Land use and land cover mapping in the Brazilian Amazon using polarimetric airborne P-band SAR data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008 ,46 (10) : 2956 –2970. [DOI:10.1109/TGRS.2008.2000630]
  • [4] Formont P, Pascal F, Vasile J P, et al. Statistical classification for heterogeneous polarimetric SAR images[J]. IEEE Journal of Selected Topics in Signal Processing, 2011 ,5 (3) : 567 –576. [DOI:10.1109/JSTSP.2010.2101579]
  • [5] Ince T. Unsupervised classification of polarimetric SAR image with dynamic clustering: an image processing approach[J]. Advances in Engineering Software, 2010 ,41 (4) : 636 –646. [DOI:10.1016/j.advengsoft.2009.12.004]
  • [6] Lee J S, Hoppel K W, Mango S A, et al. Intensity and phase statistics of multilook polarimetric and interferometric SAR imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 1994 ,32 (5) : 1017 –1028. [DOI:10.1109/36.312890]
  • [7] Xu F, Jin Y Q. Deorientation theory of polarimetric scattering targets and application to terrain surface classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005 ,43 (10) : 2351 –2364. [DOI:10.1109/TGRS.2005.855064]
  • [8] VanZyl J J. Unsupervised classification of scattering behavior using radar polarimetry data[J]. IEEE Transactions on Geoscience and Remote Sensing, 1989 ,27 (1) : 36 –45. [DOI:10.1109/36.20273]
  • [9] Mao S S, Chen B, Wang S, et al. Polarimetric SAR image classification via naive Bayes combination[J]. Journal of Xidian University, 2015 ,42 (2) : 45 –51. [ 毛莎莎, 陈博, 王爽, 等. 贝叶斯集成框架下的极化SAR图像分类[J]. 西安电子科技大学学报:自然科学版, 2015 ,42 (2) : 45 –51.] [DOI:10.3969/j.issn.1001-2400.2015.02.008]
  • [10] Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2006 ,18 (7) : 1527 –1554. [DOI:10.1162/neco.2006.18.7.1511]
  • [11] Bengio Y, Delalleau O. On the expressive power of deep architectures[C]//Proceedings of the 22nd International Conference. Berlin Heidelberg: Springer, 2011: 18-36.[DOI: 10.1007/978-3-642-24412-4_3]
  • [12] Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[J]. Advances in Neural Information Processing Systems, 2012 ,25 (2) : 1106 –1114.
  • [13] Jaitly N, Nguyen P, Senior A, et al. Application of pretrained deep neural networks to large vocabulary speech recognition[C]//Proceedings of Interspeech. Portland, USA: Interspeech Communication Association, 2012.
  • [14] Yu K, Jia L, Chen Y Q, et al. Deep learning: yesterday, today, and tomorrow[J]. Journal of Computer Research and Development, 2013 ,50 (9) : 1799 –1804. [ 余凯, 贾磊, 陈雨强, 等. 深度学习的昨天、今天和明天[J]. 计算机研究与发展, 2013 ,50 (9) : 1799 –1804.]
  • [15] Lyu Q, Dou Y, Niu X, et al.Classification of land cover based on deep belief networks using polarimetric RADARSAT-2 data[C]//IEEE International Geoscience and Remote Sensing Symposium. Quebec City, QC, Canada: IEEE, 2014: 4679-4682.[DOI: 10.1109/IGARSS.2014.6947537]
  • [16] Han J, Zhang D, Cheng G, et al. Object detection in optical remote sensing images based on weakly supervised learning and high-level feature Learning[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015 ,53 (6) : 3325 –3337. [DOI:10.1109/TGRS.2014.2374218]
  • [17] Dong C, Loy CC, He K M, et al. Learning a deep convolutional network for image super-resolution[C]//Proceedings of the 13th European Conference. Switzerland: Springer International Publishing, 2014: 184-199.[DOI: 10.1007/978-3-319-10593-2_13]
  • [18] Lyu Q, Dou Y, Niu X, et al. Remote sensing image classification based on DBN model[J]. Journal of Computer Research and Development, 2014 ,51 (9) : 1911 –1918. [ 吕启, 窦勇, 牛新, 等. 基于DBN模型的遥感图像分类[J]. 计算机研究与发展, 2014 ,51 (9) : 1911 –1918.] [DOI:10.7544/issn1000-1239.2014.20140199]
  • [19] Deng L, Yan Y N, Wang C Z. Improved POLSAR image classification by the use of Multi-Featurecombination[J]. Remote Sensing, 2015 ,7 (4) : 4157 –4177. [DOI:10.3390/rs70404157]
  • [20] Hinton G E. Training products of experts by minimizing contrastive divergence[J]. Neural Computation, 2002 ,14 (8) : 1771 –1800. [DOI:10.1162/089976602760128018]
  • [21] Hinton G E. A practical guide to training restricted Boltzmann machines[M]//Montavon G, Orr G B, Müller K R. Neural Networks: Tricks of the Trade. 2nd ed. Berlin Heidelberg, Germany: Springer, 2012: 599-619.[DOI: 10.1007/978-3-642-35289-8_32]
  • [22] Bengio Y. Practical recommendations for gradient-based training of deep architectures[M]//Montavon G, Orr G B, Müller K R. Neural Networks: Tricks of the Trade. 2nd ed. Berlin Heidelberg, Germany: Springer, 2012: 437-478.[DOI: 10.1007/978-3-642-35289-8_26
  • [23] Lee J S, Grunes M R, Kwok R. Classification of multi-look polarimetric SAR imagery based on complex Wishart distribution[J]. International Journal of Remote Sensing, 1994 ,15 (11) : 2299 –2311. [DOI:10.1080/01431169408954244]
  • [24] Story M, Congalton R G. Accuracy assessment: a user's perspective[J]. Photogrammetric Engineering & Remote Sensing, 1986 ,52 (3) : 397 –399.