Print

发布时间: 2019-11-16
摘要点击次数:
全文下载次数:
DOI: 10.11834/jig.190078
2019 | Volume 24 | Number 11




    遥感图像处理    




  <<上一篇 




  下一篇>> 





融合深度学习和凸优化迭代求解策略的逆合成孔径雷达成像方法
expand article info 李泽, 汪玲, 胡长雨
南京航空航天大学电子信息工程学院雷达成像与微波光子技术教育部重点实验室, 南京 210016

摘要

目的 针对基于压缩感知(CS)的逆合成孔径雷达(ISAR)成像方法的成像质量和应用一直受到目标场景稀疏性好坏和迭代重建耗时长限制的问题,提出一种基于交替方向乘子法网络(ADMMN)的ISAR成像方法。方法 根据交替方向乘子法(ADMM)求解稀疏假设下CS ISAR成像模型时采取的分裂变量的策略,将凸优化迭代求解过程映射到一个多级的深度神经网络,构建出ADMMN。ADMMN通过训练学习欠采样的ISAR测量数据与高质量目标图像之间的映射关系,借此实现ISAR欠采样数据成像。结果 实验采用仿真卫星数据和实测飞机数据,两种数据的采样率分别为25%和10%。实验结果表明,相较于典型的CS ISAR正交匹配追踪(OMP)成像方法和贪婪卡尔曼滤波(GKF)成像方法,ADMMN成像方法能够更准确地重建目标区域散射点,在虚警(FA)、漏检(MD)和相对均方根误差(RRMSE)等成像质量评估指标上均有改善。在卫星数据成像实验中,相比于OMP和GKF,ADMMN在RRMSE指标上分别降低了49.8%和26.5%。在飞机数据成像实验中,相比于OMP和GKF,ADMMN在RRMSE指标上分别降低了68.7%和74.9%。此外,在验证ADMMN先验信息依赖性的实验中,分别采用卫星训练数据和飞机训练数据训练好的两种ADMMN,都能够对10%的飞机目标测量数据成像。结论 融合深度学习和凸优化迭代求解策略的ADMMN ISAR成像方法能够使用非常少的数据获得高质量的成像结果,且成像效率高。

关键词

成像; 压缩感知; 逆合成孔径雷达; 凸优化; 深度神经网络; 深度交替方向乘子法网络

Inverse synthetic aperture radar imaging fusion of deep learning and convex optimizing iterative solution strategy
expand article info Li Ze, Wang Ling, Hu Changyu
Key Laboratory of Radar Imaging and Microwave Photonics of the Ministry of Education, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China
Supported by: National Natural Science Foundation of China (61871217)

Abstract

Objective Traditional inverse synthetic aperture radar (ISAR) imaging uses the range-Doppler (RD) method. Compressive sensing (CS)-based ISAR imaging method that appeared in the last decade can obtain imaging results with high image contrast (IC) and minimal sidelobe interference using few undersampled data. However, the imaging quality and application of the CS ISAR imaging method are limited by the performance of the sparse representation of the target scene and the time-consuming iteration reconstruction. An alternating direction method of multipliers network (ADMMN)-based ISAR imaging method is proposed in this study to improve the image reconstruction quality and efficiency of CS ISAR imaging. Method ADMMN is a model-driven deep neural network (MDDNN) constructed by mapping the iterative steps of the alternating direction method of multipliers (ADMM) algorithm into the architecture of MDDNN. This network architecture can be explicitly expressed in terms of polynomials, which facilitate the generation of an accurate imaging network. The convex optimizing iterative solution process is mapped to a multi-level deep neural network (DNN) according to the strategy of splitting variables adopted by the ADMM algorithm to solve a CS ISAR imaging model under sparse assumption and construct the ADMMN. The network consists of four hidden layers, namely, reconstruction layer, transformation dictionary layer, nonlinear transformation layer, and multiplier update layer. The reconstruction layer is used for ISAR image reconstruction, the transformation dictionary layer is used to extract the sparse representation of the ISAR image, the nonlinear transformation layer is used to obtain the nonlinear characteristics of the ISAR image, and the multiplier update layer is used to update the Lagrange multiplier. ADMMN is trained to learn the mapping relationship between undersampled ISAR measurements and high-quality target images to realize ISAR undersampled data imaging. The target image is the well-focused ISAR image obtained by performing the RD algorithm on ISAR echo data matrix, and the measured data are obtained by 2D random down-sampling in range and cross-range dimensions after pulse compression and motion compensation on ISAR echo data. We use two types of metrics to provide a quantitative evaluation of the imaging performance of the proposed imaging method. One type of metrics is the "true-value"-based metrics, and the other is the conventional metrics for evaluating image quality, in which a high-quality image reconstructed is used via a conventional RD method on full data as the "true-value" image. The metrics used in "true-value"-based evaluation are as follows: false alarm (FA), missed detection (MD), and relative root mean square error (RRMSE). FA denotes the number of scatterers that are reconstructed in the image but are not present in the reference image. MD denotes the number of scatterers that are not reconstructed in the newly generated image but are reconstructed in the reference image. RRMSE measures the reconstruction error of the amplitude of the scatterers. The conventional metrics for evaluating the image quality are target-to-clutter ratio, entropy of the image, and IC. Result Simulation satellite data and measured aircraft data are adopted in the experiment. The sampling rates of the two data are 25% and 10%, respectively. Experimental results show that compared with the traditional CS ISAR reconstruction algorithms of orthogonal matching pursuit (OMP) and greedy Kalman filtering (GKF), the ADMMN imaging method can more accurately reconstruct scattering points in the target area, with clearer target contour and fewer false scattering points in the background. The ADMMN imaging method is also better than the OMP and GKF imaging methods in terms of imaging quality evaluation metrics. In simulation satellite data-imaging experiments, compared with OMP and GKF, ADMMN decreases FA by 8.9% and 5%, MD by 61.7% and 59.4%, and RRMSE by 49.8% and 26.5%, respectively. In measured aircraft data-imaging experiments, compared with OMP and GKF, ADMMN decreases FA by 81.1% and 88.9%, MD by 34.3% and 31.6%, and RRMSE by 68.7% and 74.9%, respectively. This study further uses simulation satellite data to train ADMMN and applies the trained ADMMN to the measured aircraft data imaging to verify whether ADMMN strongly depends on prior information, that is, whether training and imaging data are required to be the same type of target data. Satellite and aircraft data are sampled at a rate of 10%. Experimental results show that the ADMMN trained by satellite training data and the ADMMN trained by aircraft training data can image 10% of the aircraft target measurement data; in other words, the wing and fuselage parts of the aircraft can be reconstructed efficiently. Conclusion In this study, a new ADMMN is constructed, and an ISAR imaging method based on ADMMN is proposed. ADMMN utilizes the ability of the ADMM algorithm to solve sparse imaging problems and DNN's powerful learning ability. After learning, ADMMN can construct the best mapping between undersampled measurement data and high-quality images. Experimental results show that the proposed ISAR imaging method based on ADMMN can obtain good imaging results when using 10% of random undersampled data, and the network training does not depend strongly on the prior information of the same type of target. Compared with the traditional CS reconstruction algorithms of OMP and GKF, the ADMMN imaging method has a more complete target contour and more accurate scatter location reconstruction. In addition, the proposed imaging method has high computational efficiency and can meet the requirements of real-time processing, though it requires a certain number of training samples for pretraining. The next steps to analyze the influence of training data on the imaging network thoroughly and enhance the stability of the method are to simulate the electromagnetic scattering of the main ISAR targets, construct abundant simulation training samples for ADMMN training, and verify the performance of ADMMN with the measured data to optimize the ADMMN.

Key words

imaging; compressive sensing (CS); inverse synthetic aperture radar (ISAR); convex optimization; deep neural network (DNN); deep alternating direction method of multipliers network (ADMMN)

0 引言

逆合成孔径雷达(ISAR)[1]能够获得运动目标(飞机、舰船等)的高分辨率图像,为后续的目标识别提供可靠的基础。传统的ISAR成像采用距离—多普勒(RD)类方法[2],RD类方法利用脉冲压缩技术获得距离高分辨,利用相干处理时间(CPI)内的多普勒调制回波信号获得方位向高分辨。与RD类方法相比,基于压缩感知(CS)[3]的ISAR成像方法能够利用非常少的测量数据成像[4],降低雷达系统复杂度,成像结果具有图像对比度高和旁瓣干扰少的优势,有利于后续的图像分析和目标识别。但是,CS ISAR成像方法的成像质量和应用仍然受到稀疏性和耗时的迭代重建的限制[5]

近年来,深度神经网络(DNNs)在计算机视觉领域取得了瞩目的表现。受DNNs的强大学习能力的启发,许多DNNs应用于学习从欠采样测量数据域到原始信号域的直接映射。例如,级联去噪自动编码器(SDA)[6]、CS图像非迭代重建的reconnet网络[7]以及基于DNNs的CS信号恢复的deeplnverse网络[8]。端到端的DNNs利用深度抽象特征表示获得高质量的信号重建结果,但DNNs的网络拓扑与其相应的网络性能之间的理论解释不明确,大多数现有的DNNs都作为黑匣子接受训练,这增加了DNN构建和训练的复杂度,进而限制了现有DNN在其他领域中的应用,例如雷达成像。

模型驱动的DNNs (MDDNNs)[9]为一类特殊的DNNs,由经典凸优化算法映射而来,即网络拓扑中的每一层对应于凸优化算法迭代中的一步。由于凸优化算法中参数数量远小于DNNs中的权值数量,因而MDDNNs中需要学习的参数较少,利用少量样本即可学习出最优的网络参数。此外,由于MDDNNs的拓扑结构能够用明确的多项式显示表达,保持了凸优化算法的准确性,所以端到端MDDNNs能够高效地实现高质量的图像重建。深度交替方向乘子法网络(ADMMN)作为典型的MDDNN,由交替方向乘子法(ADMM)[10]算法映射而来。网络中的每一层对应于ADMM算法迭代中的一步。基于ADMMN的图像重建方法利用网络的多级映射结构,可获取待重建图像丰富的非线性特征表示,进而能获得更好的图像重建性能和更高的计算效率。

本文利用ADMMN的优势提高ISAR成像的质量,构建一个具有3级结构且适用于2维随机降采样模式的ADMMN用于ISAR成像,这与CS核磁共振成像(MRI)的深度学习方法[11]中提出的具有5级结构且限定拟径向欠采样模式的架构不同。本文使用随机梯度下降(SGD)[12]代替CS MRI的深度学习方法[11]中使用的L-BFGS[13]端对端地学习网络中存在的参数,例如非线性变换字典、乘子更新步长等。在ISAR成像阶段,训练完成的ADMMN的输入是2维随机欠采样的ISAR数据,ADMMN输出是图像域中的成像结果。与典型的CS ISAR成像方法相比,所提出的基于ADMMN的ISAR成像方法在提高成像质量的同时兼具高成像效率。

1 基于ADMM的ISAR图像重建

目标的散射率与ISAR回波数据的关系[14]可以表示为

$\boldsymbol{G}=\boldsymbol{H} \boldsymbol{\sigma}+\boldsymbol{s}$ (1)

式中,$\boldsymbol{G} \in {\bf C}^{n}$表示的是向量化的ISAR回波数据。假设雷达回波的距离向或快时间采样数为$N_{r}$,方位向或慢时间采样数为$N_{a}$,则$n=N_{r} \times N_{a}$$\boldsymbol{\sigma} \in {\bf C}^{n}$表示的是向量化的待成像场景散射率函数,$\boldsymbol{H} \in{\bf C}^{n \times n}$表示的是观测矩阵,$\boldsymbol{s} \in {\bf C}^{n}$表示ISAR回波中的噪声。

在CS框架下,以低于奈奎斯特采样率获得的较少数据进行成像,式(1)中的成像模型改写[14]

$\boldsymbol{G}_{s}=\mathit{\boldsymbol{ \boldsymbol{\varPhi} }} \boldsymbol{\sigma}+\boldsymbol{n}_{s}$ (2)

式中,$\boldsymbol{G}_{s} \in {\bf C}^{m}$表示向量化的2维随机降采样得到的测量数据,$\mathit{\boldsymbol{ \boldsymbol{\varPhi} }} = \mathit{\boldsymbol{ \boldsymbol{\varPsi} F}} \in {{{\bf C}}^{m \times n}}$$m<n$,表示测量矩阵,其中$\mathit{\boldsymbol{ \boldsymbol{\varPsi} }} \in {{{\bf C}}^{m \times n}}$表示感知矩阵,在本文中感知矩阵$\mathit{\boldsymbol{ \boldsymbol{\varPsi} }}$为非完备矩阵,其对角线上大多数元素被随机置为0,$\boldsymbol{F} \in {\bf C}^{n \times n}$为傅里叶变换矩阵,$\boldsymbol{n}_{s}$为测量数据中的噪声。

测量矩阵$\mathit{\boldsymbol{ \boldsymbol{\varPhi} }}$满足RIP[14]条件,且待成像目标场景满足空域稀疏假设,成像可以描述[15]

$\hat{\boldsymbol{\sigma}}=\underset{\sigma}{\arg \min } \frac{1}{2}\left\|\boldsymbol{G}_{s}-\mathit{\boldsymbol{ \boldsymbol{\varPhi}}} \boldsymbol{\sigma}\right\|_{2}^{2}+\lambda\|\boldsymbol{\sigma}\|_{q}$ (3)

式中,$\|\cdot\|_{q}$表示取$q$范数操作,$q∈[0, 1], λ$为正则化参数。

为了提高成像质量,引入未知目标场景在多个变换域的稀疏表示,并加权求和,作为新的正则化项引入到式(3)中,可得

$\begin{array}{c}\{\hat{\boldsymbol{\sigma}}, \hat{\boldsymbol{w}}\}=\min\limits_{\sigma, \omega} \frac{1}{2}\left\|\boldsymbol{G}_{s}-\mathit{\boldsymbol{ \boldsymbol{\varPhi}}} \boldsymbol{\sigma}\right\|_{2}^{2}+\sum\limits_{l=1}^{L} \lambda_{l}\left\|\boldsymbol{\omega}_{l}\right\|_{q} \\ \text { s.t. } \boldsymbol{\omega}_{l}=\boldsymbol{D}_{l} \boldsymbol{\sigma} \end{array}$ (4)

式中,$l∈\{1, 2, …, L\}$$\boldsymbol{\omega}_{l}=\boldsymbol{D}_{l} \boldsymbol{\sigma}$是ISAR图像通过$\boldsymbol{D}_{l}$字典寻找到的稀疏表示,$\boldsymbol{D}=\left\{\boldsymbol{D}_{l}\right\}$表示稀疏变换字典的集合,其中每一个字典都是预定义的,如离散余弦变换字典。$\mathit{\boldsymbol{w}} = \left\{ {{\mathit{\boldsymbol{\omega }}_l}} \right\}$表示多个稀疏变换域中的稀疏表示的集合。$\lambda_{l}$${{\mathit{\boldsymbol{\omega }}_l}}$相应的正则化参数。

利用ADMM算法可以高效地求解式(4)中变量$\mathit{\boldsymbol{\hat \sigma }}$$\hat{\boldsymbol{w}}$。首先给出式(4)的增广拉格朗日(Lagrange)函数,即

$ \begin{array}{c} L_{\rho}(\hat{\boldsymbol{\sigma}}, \hat{\boldsymbol{w}}, \boldsymbol{A})=\frac{1}{2}\left\|\boldsymbol{G}_{s}-\mathit{\boldsymbol{ \boldsymbol{\varPhi}}} \boldsymbol{\sigma}\right\|_{2}^{2}+\sum\limits_{l=1}^{L} \lambda_{l}\left\|\boldsymbol{\omega}_{l}\right\|_{q}+\\ \sum\limits_{l=1}^{L} \boldsymbol{\alpha}_{l}^{\mathrm{T}}\left(\boldsymbol{D}_{l} \boldsymbol{\sigma}-\boldsymbol{\omega}_{l}\right)+\sum\limits_{l=1}^{L} \frac{\rho_{l}}{2}\left\|\boldsymbol{D}_{l} \boldsymbol{\sigma}-\boldsymbol{\omega}_{l}\right\|_{2}^{2} \end{array} $ (5)

式中,$\boldsymbol{A}=\left\{\alpha_{l}\right\}$是拉格朗日乘子的集合,$\boldsymbol{\rho}=\left\{\rho_{l}\right\}$为惩罚参数的集合。

ADMM通过求解以下3个子问题实现式(5)的求解

$ \left\{ \begin{array}{l} {\sigma ^{(n + 1)}} = \mathop {\arg \min }\limits_\mathit{\boldsymbol{\sigma }} \frac{1}{2}\left\| {{\mathit{\boldsymbol{G}}_s} - \mathit{\boldsymbol{ \boldsymbol{\varPhi} \sigma }}} \right\|_2^2 + \\ \;\;\;\;\;\;\;\;\;\;\;\;\sum\limits_{l = 1}^L {\left[ {\mathit{\boldsymbol{\alpha }}_l^{(n){\rm{T}}}\left( {{\mathit{\boldsymbol{D}}_l}{\sigma ^{(n + 1)}} - \mathit{\boldsymbol{\omega }}_l^{(n)}} \right) + } \right.} \\ \;\;\;\;\;\;\;\;\;\;\;\;\left. {\frac{{{\rho _l}}}{2}\left\| {{\mathit{\boldsymbol{D}}_l}{\mathit{\boldsymbol{\sigma }}^{(n + 1)}} - \mathit{\boldsymbol{\omega }}_l^{(n)}} \right\|_2^2} \right]\\ {\mathit{\boldsymbol{w}}^{(n + 1)}} = \mathop {\arg \min }\limits_\mathit{\boldsymbol{\omega }} \sum\limits_{l = 1}^L {{\lambda _l}} {\left\| \omega \right\|_q} + \\ \;\;\;\;\;\;\;\;\;\;\;\;\sum\limits_{l = 1}^L {\left[ {\mathit{\boldsymbol{\alpha }}_l^{(n){\rm{T}}}\left( {{\mathit{\boldsymbol{D}}_l}{\mathit{\boldsymbol{\sigma }}^{(n + 1)}} - \mathit{\boldsymbol{\omega }}_l^{(n)}} \right) + } \right.} \\ \;\;\;\;\;\;\;\;\;\;\;\;\left. {\frac{{{\rho _l}}}{2}\left\| {{\mathit{\boldsymbol{D}}_l}{\mathit{\boldsymbol{\sigma }}^{(n + 1)}} - \mathit{\boldsymbol{\omega }}_l^{(n)}} \right\|_2^2} \right]\\ {\mathit{\boldsymbol{A}}^{(n + 1)}} = \mathop {\arg \max }\limits_\mathit{\boldsymbol{\alpha }} \sum\limits_{l = 1}^L {{{\bf \pmb{\mathsf{ α}} }}_l^{(n){\rm{T}}}} \left( {{\mathit{\boldsymbol{D}}_l}{\mathit{\boldsymbol{\sigma }}^{(n + 1)}} - \mathit{\boldsymbol{\omega }}_l^{(n)}} \right) \end{array} \right. $ (6)

式中,$n=1, 2, …, N$表示迭代次数。

从式(6)可以看到,求解第1个子问题可以实现ISAR图像的重构,求解第2子问题可以获得ISAR图像在多个变换域的稀疏表示,求解第3个子问题可以实现更新拉格朗日乘子。为了方便导出各子问题的解,定义尺度化操作因子$\boldsymbol{\beta}_{l}=\boldsymbol{\alpha}_{l} / \rho_{l}$,并将$\mathit{\boldsymbol{ \boldsymbol{\varPhi} }} = \mathit{\boldsymbol{ \boldsymbol{\varPsi} F}}$代入式(6)。迭代过程中,式(6)中各子问题分别对相应的待求解的变量求偏导,进而得到各子问题的解析解,具体的解的形式为

$ \left\{ {\begin{array}{*{20}{l}} {{\mathit{\boldsymbol{\sigma }}^{(n)}} = {\mathit{\boldsymbol{F}}^{\rm{T}}}{{\left[ {{\mathit{\boldsymbol{ \boldsymbol{\varPsi} }}^{\rm{T}}}\mathit{\boldsymbol{ \boldsymbol{\varPsi} }} + \sum\limits_{t = 1}^L {{\mathit{\boldsymbol{\rho }}_l}} \mathit{\boldsymbol{FD}}_l^{\rm{T}}{\mathit{\boldsymbol{D}}_l}{\mathit{\boldsymbol{F}}^{\rm{T}}}} \right]}^{ - 1}} \times }\\ {\quad \left[ {{\mathit{\boldsymbol{ \boldsymbol{\varPsi} }}^{\rm{T}}}{\mathit{\boldsymbol{G}}_s} + \sum\limits_{t = 1}^L {{\mathit{\boldsymbol{\rho }}_l}} \mathit{\boldsymbol{FD}}_l^{\rm{T}}\left( {\mathit{\boldsymbol{\omega }}_l^{(n - 1)} - \mathit{\boldsymbol{\beta }}_l^{(n - 1)}} \right)} \right]}\\ {\mathit{\boldsymbol{\omega }}_l^{(n)} = \left( {{\mathit{\boldsymbol{D}}_l}{\mathit{\boldsymbol{\sigma }}^{(n)}} + \mathit{\boldsymbol{\beta }}_l^{(n - 1)}} \right) - {\lambda _l}/{\rho _l}}\\ {\mathit{\boldsymbol{\beta }}_l^{(n)} = \mathit{\boldsymbol{\beta }}_l^{(n - 1)} + {\mathit{\boldsymbol{D}}_l}{\mathit{\boldsymbol{\sigma }}^{(n)}} - \mathit{\boldsymbol{\omega }}_l^{(n)}} \end{array}} \right. $ (7)

ADMM算法迭代收敛时,获得最优的$\hat{\boldsymbol{\sigma}}$,即最终重建的目标图像。

2 基于ADMMN的ISAR成像

2.1 ADMMN架构

由于ISAR数据量有限,为了以最少的训练数据获得高质量图像重建性能的ADMMN,本文构建包含3级结构的ADMMN网络,如图 1所示,每级包含4个隐层,分别是重构层$\left(\boldsymbol{\sigma}^{(n)}\right)$、变换字典层$\left(\boldsymbol{c}^{(n)}\right)$、非线性变换层$\left(\boldsymbol{\omega}^{(n)}\right)$和乘子更新层$\left(\boldsymbol{\beta}^{(n)}\right)$

图 1 ADMMN网络架构图
Fig. 1 Framework of ADMMN

重构层根据式(7)中$\boldsymbol{\sigma}^{(n)}$的解的形式构建,用于ISAR图像重构,该层的重构运算解析式为

$ \begin{array}{c} {\mathit{\boldsymbol{\sigma }}^{(n)}} = {\mathit{\boldsymbol{F}}^{\rm{T}}}{\left[ {{\mathit{\boldsymbol{ \boldsymbol{\varPsi} }}^{\rm{T}}}\mathit{\boldsymbol{ \boldsymbol{\varPsi} }} + \sum\limits_{l = 1}^L {\rho _l^{(n)}} \mathit{\boldsymbol{FH}}_l^{(n){\rm{T}}}\mathit{\boldsymbol{H}}_l^{(n)}{\mathit{\boldsymbol{F}}^{\rm{T}}}} \right]^{ - 1}} \times \\ \left[ {{\mathit{\boldsymbol{ \boldsymbol{\varPsi} }}^{\rm{T}}}{\mathit{\boldsymbol{G}}_{\rm{s}}} + \sum\limits_{l = 1}^L {\rho _l^{(n)}} \mathit{\boldsymbol{FH}}_l^{(n){\rm{T}}}\left( {\mathit{\boldsymbol{\omega }}_l^{(n - 1)} - \mathit{\boldsymbol{\beta }}_l^{(n - 1)}} \right)} \right] \end{array} $ (8)

式中,右上角标($n$)表示第$n$级结构,$\boldsymbol{H}_{l}^{(n)}$表示第$n$级结构中的第$l$个可学习的变换矩阵,$\rho_{l}^{(n)}$为相应的惩罚系数。第1级的初始重构层$\boldsymbol{\sigma}^{(1)}$需要执行参数初始化操作,$\boldsymbol{\omega}_{l}^{(0)}$$\boldsymbol{\beta}_{l}^{(0)}$设置为0,以欠采样的ISAR数据为输入,输出重建的ISAR初始图像$\boldsymbol{\sigma}^{(1)}$

变换字典层对应式(4)中的$\boldsymbol{D}_{l} \boldsymbol{\sigma}$,用于提取重构层获得的ISAR图像的稀疏表示,该层的具体计算为

$\boldsymbol{c}_{l}^{(n)}=\boldsymbol{D}_{l}^{(n)} \boldsymbol{\sigma}^{(n)}$ (9)

式中,$\boldsymbol{D}_{l}^{(n)}$表示第$n$级中变换字典层$\boldsymbol{c}^{(n)}$中的第$l$个稀疏变换字典。$\boldsymbol{c}_{l}^{(n)}$为重构的ISAR图像通过$\boldsymbol{D}_{l}$寻找到的稀疏表示。

非线性变换层根据式(7)中$\boldsymbol{\omega}_{l}^{(n)}$的解的形式构建,用于获取ISAR图像的非线性特征。在该层中,利用可学习的非线性映射函数,对第$n$级中的变换字典层$\boldsymbol{c}^{(n)}$输出的稀疏表示进行逐像素的非线性映射,得到ISAR图像的非线性特征表示,给定输入$\boldsymbol{c}_{l}^{(n)}$$\boldsymbol{\beta}_{l}^{(n)}$,输出为

$\boldsymbol{\omega}_{l}^{(n)}=S\left(\boldsymbol{c}_{l}^{(n)}+\boldsymbol{\beta}_{l}^{(n-1)} ;\left\{p_{i}, q_{l, i}^{(n)}\right\}_{i=1}^{N_{c}}\right)$ (10)

式中,函数$S(\cdot)$是由控制点$\left\{p_{i}, q_{l, i}^{(n)}\right\}_{i=1}^{N_{c}}$确定的阈值函数,$\left\{p_{i}\right\}_{i=1}^{N_{c}}$为预设定的均匀分布在[-1, 1]之间的位置索引,$\left\{q_{l, i}^{(n)}\right\}_{i=1}^{N_{c}}$为第$n$级结构中待学习的非线性映射函数[16]的收缩阈值。

在第1级的非线性变换层$\boldsymbol{\omega}^{(1)}$中,$\boldsymbol{\beta}_{l}^{(0)}$设置为零。利用可学习的非线性映射函数,对第1级中的变换字典层$\boldsymbol{c}^{(1)}$输出的稀疏表示进行逐像素的非线性映射,得到ISAR图像的非线性特征表示。

乘子更新层根据式(7)中$\boldsymbol{\beta}_{l}^{(n)}$的解析解构建,用于实现拉格朗日乘子的更新,给定输入$\boldsymbol{\beta}_{l}^{(n-1)}$$\boldsymbol{c}_{l}^{(n)}$$\boldsymbol{\omega}_{l}^{(n)}$,输出为

$\boldsymbol{\beta}_{l}^{(n)}=\boldsymbol{\beta}_{l}^{(n-1)}+\boldsymbol{\eta}_{l}^{(n)}\left(\boldsymbol{D}_{l} \sigma^{(n)}-\boldsymbol{\omega}_{l}^{(n)}\right)$ (11)

式中,$\eta_{l}^{(n)}$为第$n$级结构中第$l$个待学习的更新步长。

在第1级的乘子更新层$\boldsymbol{\beta}^{(1)}$中,$\boldsymbol{\beta}_{l}^{(0)}$设置为0。该层计算第1级中变换字典层$\boldsymbol{c}^{(1)}$输出的稀疏表示和非线性变换层$\boldsymbol{\omega}^{(1)}$输出的非线性特征表示二者之间的残差,并将结果作为更新拉格朗日乘子的参数,用于更新拉格朗日乘子。

2.2 ADMMN训练数据构建

为了获得最优的ADMMN,构造仿真ISAR卫星目标数据和实测ISAR飞机目标数据的训练样本集,用于更新ADMMN参数(非线性变换字典$\boldsymbol{c}_{l}^{(n)}$, 更新步长$\eta_{l}^{(n)}$等)。两种训练样本集分别用于ADMMN的训练,并分别利用训练好的ADMMN实现卫星和飞机目标的成像。

构造ISAR数据训练样本集时,对ISAR回波数据在距离向上设定多个距离门,方位向上设置不同的回波脉冲起始位置与脉冲采样间隔,采集回波脉冲,从而得到多个ISAR回波数据矩阵。

每一个训练样本都包括一组欠采样的ISAR回波测量数据和一幅目标图像。目标图像是ISAR回波数据矩阵经过RD算法得到的聚焦好的ISAR图像。测量数据是对ISAR回波数据进行脉冲压缩和运动补偿后,在距离向和方位向2维随机降采样获得。

2.3 ADMMN训练策略

在构建ADMMN后,给出相应的训练策略和损失函数。本文采用批量梯度下降的训练策略,并以归一化均方误差函数作为损失函数,通过反向传播和SGD方法更新网络参数。

本文的损失函数的具体形式为

$L(\{\boldsymbol{W}\})=\frac{1}{T} \sum\limits_{i=1}^{T} \frac{\left\|f\left(\boldsymbol{G}_{s, i}, \{\boldsymbol{W}\}\right)-\boldsymbol{\sigma}_{i}\right\|_{2}}{\left\|\boldsymbol{\sigma}_{i}\right\|_{2}}$ (12)

式中,$T$表示训练样本的总数,$i$为第$i$个训练样本的索引。$f\left(\boldsymbol{G}_{s, i}, \{\boldsymbol{W}\}\right)$是网络输出的重构结果,其中$\boldsymbol{G}_{s, i}$表示第$i$个训练样本中的训练数据,$\{\boldsymbol{W}\}$表示的是网络参数集合,$f(·)$表示ADMMN网络描述的函数,$\boldsymbol{\sigma}_{i}$表示第$i$个样本的目标图像。$L(\{\boldsymbol{W}\})$表示的是归一化的均方误差。

3 实验验证

3.1 成像质量评估指标

图像评价函数包括基于真实值的图像评价函数和传统的图像评价函数[17],其中基于真实值的评价方法是将利用重构方法获得的ISAR图像与理想情况下ISAR图像对比,判断该重构算法成像效果的优劣。理想情况下的ISAR图像即为真实值,但是由于在ISAR成像系统中,目标为非合作目标,不可能得到ISAR真实图像,本文将采用完整数据通过RD方法生成的高质量ISAR目标图像作为参考图,定义为真实值。采用重构算法得到的重建图像作为被考察量,通过比较这两个图像对算法的性能进行评价。

基于真实值的评价指标具体包括虚警(FA)、漏检(MD)和相对均方根误差(RRMSE)。FA用于评估错误重建的散射点数,MD用于评估未被重建出来的正确散射点,RRMSE用于评估散射点振幅的重构误差。由于没有真实值图像,实验中采用全数据获得的聚焦好、质量高的RD图像作为真实值图像,实际衡量的是所有方法相对RD成像结果的质量评价。传统的成像质量评估指标包括目标杂波比(TCR)、图像熵(ENT)和图像对比度(IC)。

3.2 成像结果分析

3.2.1 仿真卫星数据成像结果

卫星ISAR数据通过仿真软件(STK)仿真得到,发射信号带宽和波长分别为1GHz和0.03m。卫星数据的降采样率为25%。ADMMN成像网络由20个样本训练收敛。成像使用的数据与训练样本不在一个数据集中,与训练样本的图像投影平面也不同。

图 2(a)是运动补偿后的卫星数据2维随机降采样的结果,图 2(b)是对图 2(a)所示的降采样数据采用RD方法成像的结果。横轴为方位向(或横向距离向),单位为多普勒单元数, 纵坐标为距离向,单位为距离单元数。本文后续成像结果中,如无特殊说明,横轴、纵轴定义和单位都与图 2相同。

图 2 仿真卫星2维降采样数据和相应的RD成像结果
Fig. 2 Simulated satellite 2D downsampling data and corresponding RD imaging result ((a)2D downsampling data; (b)RD imaging result)

图 3给出了仿真卫星数据的成像结果。图 3(a)为卫星全数据采用RD方法成像结果,图 3(b)为25%的卫星目标测量数据采用ADMMN方法的成像结果。为了验证本文成像方法的有效性,将ADMMN的成像结果与正交匹配追踪(OMP)成像方法[18]以及贪婪卡尔曼滤波(GKF)成像方法[14]的成像结果进行比较,两种对比方法的成像结果如图 3(c)(d)所示。

图 3 卫星数据采用不同方法成像结果
Fig. 3 Images obtained by performing the different methods on simulated satellite data ((a)full-data RD imaging result; (b)ADMMN imaging result of 25% data; (c)OMP imaging result of 25% data; (d)GKF imaging result of 25% data)

对比图 3(b)(c)(d)可以看出,ADMMN方法成像结果更好。ADMMN成像结果中目标整体以及局部(小图所示的天线部分)都被更好地重建。ADMMN成像结果具有目标轮廓更清晰、背景虚假散射点更少等优势。对比图 3(a)(b)可以看出,ADMMN使用25%数据得到成像结果,与全数据通过RD方法成像的结果非常接近。对图 3所示的成像结果采用上述的评价指标进行定量评价,结果如表 1所示。

表 1 25%卫星仿真数据采用不同方法成像结果的定量评价分析
Table 1 Quantitative evaluation of imaging result obtained by adopting different methods on 25% satellite data

下载CSV
方法 FA MD RRMSE TCR/dB ENT IC 时间/s
ADMMN 133 194 0.187 4 66.338 3 6.603 5 9.344 4 0.441 5
GKF 140 478 0.255 0 65.338 2 6.374 0 10.384 3 1.648 5×10-4
OMP 146 507 0.373 6 63.295 6 6.420 9 9.809 9 56.132 3
注:加粗字体表示最优结果。

表 1可以看出,ADMMN成像的FA和MD值最小,说明以全数据采用RD方法获得的高质量图像为参考时,ADMMN成像结果中错误重建的目标区域散射点数和未被重建的目标区域散射点数都最少,目标区域重建得更加准确和完整,背景区域散射点数更少,这与图 3(b)(c)(d)的对比结果一致。继续比较RRMSE指标发现,ADMMN的图像RRMSE最小,说明ADMMN成像方法能够更好地保持目标区域散射点幅度。从TCR指标可以看出,ADMMN成像方法能够更准确地重建目标区域散射点。

表 1的ENT和IC指标可知,与GKF和OMP成像方法结果相比,ADMMN成像结果具有最大的ENT和最小的IC,说明ADMMN重建图像熵最大,图像对比最小。但结合MD指标可知,OMP和GKF结果中,未被重建的散射点数更多,图像非常稀疏,因此与ADMMN结果相比,对应的图像熵更小,图像对比度更高,但由图 3可见,图像质量并非最优。由此可见,单个的评价指标只能展示成像结果的某一特性,只有利用多种评判标准从不同角度对成像结果进行评判,才能更为全面客观地反映相应成像结果的质量,进而能够对成像结果对应的成像方法性能进行正确判断。

各方法的计算时间如表 1最后一列所示。网络一旦训练好,ADMMN成像的时间可达0.4 s量级,效率明显高于其他方法。需要注意的是,这里的成像时间不包括ADMMN训练所需的时间。

为了进一步验证ADMMN性能,采用不同信噪比(SNR)的卫星数据进行ADMMN成像实验,使用的ADMMN与图 3(b)成像结果所用成像网络一致。图 4图 5分别给出了25%卫星数据在不同SNR下采用OMP方法和ADMMN方法进行成像的结果。

图 4 25%仿真卫星数据在不同SNR下采用OMP成像结果
Fig. 4 OMP imaging results of 25% simulated satellite data under different SNRs ((a) SNR = 10 dB; (b) SNR = 0 dB)
图 5 25%仿真卫星数据在不同SNR下采用ADMMN成像结果
Fig. 5 ADMMN imaging results of 25% simulated satellite data under different SNRs ((a) SNR = 10 dB; (b) SNR = 0 dB)

对比图 4图 5可以看出,ADMMN成像具有更好的抗噪性,成像质量优于OMP的成像结果。在SNR = 10 dB和0 dB时,ADMMN成像结果中卫星主体部位都能够识别。但是可以看到,随着SNR降低,成像结果中的背景干扰增强。

3.2.2 实测飞机数据成像结果

飞机ISAR数据是通过地基ISAR所采集的,ISAR工作波段为C波段,发射信号带宽为400 MHz,飞机数据的降采样率为10%,ADMMN成像网络同样由20组飞机数据样本训练所得,成像所使用的数据与训练样本不在一个数据集中,与训练样本的图像投影平面也不同。图 6(a)给出了实测飞机回波数据运动补偿后,在距离向和方位向2维随机降采样(采样率10%)获得的数据域图,对图 6(a)所示的数据采用RD方法成像,结果如图 6(b)所示。

图 6 实测飞机2维降采样数据和相应的RD成像结果
Fig. 6 Measured aircraft 2D downsampling data and corresponding RD imaging result ((a)2D downsampling data; (b)RD imaging result)

图 7是实测飞机目标数据成像结果,图 7(a)为飞机目标全数据采用传统RD方法成像的结果,图 7(b)(c)(d)分别是10%飞机目标测量数据采用ADMMN方法、OMP方法以及GKF方法成像结果。

图 7 实测飞机数据采用不同方法成像结果
Fig. 7 Images obtained by performing different methods on measured aircraft data ((a)full-data RD imaging result; (b)ADMMN imaging result of 10% data; (c)OMP imaging result of 10% data; (d)GKF imaging result of 10% data)

对比图 7(a)(b)可知,ADMMN成像方法利用10%测量数据获得的成像结果与全数据RD方法得到的成像结果相近。对比图 7(b)(c)(d)可以看出,ADMMN方法的成像结果最好,目标轮廓更完整,目标局部区域(机头、机身、机翼等)清晰可辨。而OMP和GKF则无法完成图像重建。

图 7采用上述的评价指标进行定量评价,结果如表 2所示。从表 2可以看出,ADMMN成像的FA值和MD值最小,意味着以RD图像为参考时,ADMMN成像结果中错误重建的散射点数和未被重建的散射点数量最少,这与图 7 (b)(c)(d)之间的对比一致。继续比较RRMSE指标发现,ADMMN的图像RRMSE最小,说明散射点幅度重建误差最小。此外,ADMMN成像结果具有最大的TCR和IC,最小的ENT,如表 2所示。从表 2最后一列可以看出,训练好的ADMMN具有最高的成像效率,其成像的时间可达0.3 s量级。

表 2 10%飞机目标数据采用不同方法成像结果的定量评价分析
Table 2 Quantitative evaluation of imaging result obtained by adopting different methods on 10% aircraft data

下载CSV
方法 FA MD RRMSE TCR/dB ENT IC 时间/s
ADMMN 14 117 0.178 4 66.7203 4.258 1 10.489 6 0.312 7
GKF 127 171 0.711 4 42.8357 4.732 2 7.981 1 63.418 6
OMP 74 178 0.569 3 48.0170 4.477 8 8.942 6 4.578 1
注:加粗字体表示最优结果。

由以上分析可见,基于ADMMN的成像方法与GKF和OMP方法相比,可获得更好的成像质量,而且成像效率高。当仅用10%随机降采样的原始数据成像时,仍然可以获得较好的成像效果。

3.2.3 ADMMN先验信息依赖性验证

为了验证本文方法是否强依赖于先验信息,即是否要求训练数据与待成像数据为同一类型目标数据,本文利用仿真卫星数据训练ADMMN,并将训练好的ADMMN用于实测飞机数据成像。训练ADMMN的仿真卫星训练集为3.2.1节中构造的包含20组仿真卫星数据样本的训练集。需要注意的是,为了与3.2.2节中10%飞机目标数据成像结果进行对比,将仿真卫星训练数据集中训练样本的降采样率设置为10%。

图 8给出了卫星和飞机训练数据训练得到的ADMMN对10%的飞机目标数据成像的结果,图 8(a)为全数据RD成像结果,图 8(b)为3.2.1节中卫星数据训练的ADMMN对10%的飞机数据成像的结果,此时卫星训练数据的降采样率为10%。图 8(c)为3.2.2节中飞机数据训练的ADMMN对10%飞机数据成像的结果。

图 8 飞机数据采用RD和两种不同的ADMMN成像的结果
Fig. 8 Images obtained by adopting RD and two different ADMMN on measured aircraft data((a)full-data RD imaging result; (b) trained by 10% simulated satellite data; (c) trained by 10% measured aircraft data)

图 8(b)(c)可以看出,卫星训练数据和飞机训练数据训练好的ADMMN,都能够对10%的飞机目标测量数据成像,特别是飞机的机翼和机身部分都能够较好地重建。但如图 8(c)所示,同类目标数据训练的网络的重建的图像整体质量更优。卫星数据训练的ADMMN不能较好地重建机头,且在机头下方存在明显的虚假散射点干扰。上述分析表明本文方法并不强依赖于相同类型目标的先验信息。

4 结论

本文构建了一种新的ADMMN,并且提出了一种基于ADMMN的ISAR成像方法。ADMMN利用ADMM算法求解稀疏成像问题的能力和DNN强大的学习能力,经过学习的ADMMN可以构建欠采样测量数据与高质量图像之间的最佳映射。实验结果表明,所提出基于ADMMN的ISAR成像方法在采用10%随机欠采样数据成像时仍然可以获得较好的成像结果,并且网络训练不强依赖于相同类型目标的先验信息。与OMP和GKF传统的CS重建算法相比,ADMMN成像方法目标轮廓更完整,散射点位置重建更准确。此外,所提出的成像方法具有很高的计算效率,可满足实时处理的要求,但是需要一定数量的训练样本进行前期训练。为了更透彻地分析训练数据对成像网络的影响,增强方法的稳定性,下一步拟对主流ISAR目标进行电磁散射仿真,构造丰富的仿真训练样本用于ADMMN训练,并结合实测数据对ADMMN的性能进行验证,进一步优化ADMMN。

参考文献

  • [1] Lin P P, Lu G C, Huan H. A C-band inverse synthetic aperture radar system[C]//Proceedings of International Radar Conference. Beijing, China: IEEE, 1996: 250-253.[DOI: 10.1109/ICR.1996.573819]
  • [2] Lu G Y, Bao Z. A new method for ISAR range-instantaneous-Doppler imaging[C]//Proceedings of the 4th International Conference on Signal Processing. Beijing, China: IEEE, 1998: 1481-1484.[DOI: 10.1109/ICOSP.1998.770903]
  • [3] Shao W Z, Wei Z H. Advances and perspectives on compressed sensing theory[J]. Journal of Image and Graphics, 2012, 17(1): 1–12. [邵文泽, 韦志辉. 压缩感知基本理论:回顾与展望[J]. 中国图象图形学报, 2012, 17(1): 1–12. ] [DOI:10.11834/jig.20120101]
  • [4] Baraniuk R, Steeghs P. Compressive radar imaging[C]//Proceedings of 2007 IEEE Radar Conference. Boston, MA, USA: IEEE, 2007: 128-133.[DOI: 10.1109/RADAR.2007.374203]
  • [5] Hu C Y, Wang L, Sun L L, et al. Inverse synthetic aperture radar imaging using group based dictionary learning[C]//Proceedings of 2018 China International SAR Symposium. Shanghai, China: IEEE, 2018: 1-5.[DOI: 10.1109/SARS.2018.8551957]
  • [6] Mousavi A, Patel A B, Baraniuk R G. A deep learning approach to structured signal recovery[C]//Proceedings of the 53rd Annual Allerton Conference on Communication, Control and Computing. Monticello, IL, USA: IEEE, 2015: 1336-1343.[DOI: 10.1109/ALLERTON.2015.7447163]
  • [7] Kulkarni K, Lohit S, Turaga P, et al. Reconnet: non-iterative reconstruction of images from compressively sensed measurements[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA: IEEE, 2016: 449-458.[DOI: 10.1109/CVPR.2016.55]
  • [8] Mousavi A, Baraniuk R G. Learning to invert: signal recovery via deep convolutional networks[C]//Proceedings of 2017 IEEE International Conference on Acoustics, Speech and Signal Processing. New Orleans, LA, USA: IEEE, 2017: 2272-2276.[DOI: 10.1109/ICASSP.2017.7952561]
  • [9] Xu Z B, Sun J. Model-driven deep-learning[J]. National Science Review, 2018, 5(1): 22–24. [DOI:10.1093/nsr/nwx099]
  • [10] Guven H E, Çetin M. An alternating direction method of multipliers for sparse SAR imaging[C]//Proceedings of the 22nd Signal Processing and Communications Applications Conference. Trabzon, Turkey: IEEE, 2014: 666-669.[DOI: 10.1109/SIU.2014.6830317]
  • [11] Yang Y, Sun J, Li H B, et al. ADMM-Net: a deep learning approach for compressive sensing MRI[EB/OL].[2019-02-28]. https://arxiv.org/pdf/1705.06869.pdf.
  • [12] Yuan K, Ying B C, Vlaski S, et al. Stochastic gradient descent with finite samples sizes[C]//Proceedings of the 26th IEEE International Workshop on Machine Learning for Signal Processing, Vietri sul Mare, Italy: IEEE, 2016: 1-7.[DOI: 10.1109/MLSP.2016.7738878]
  • [13] Morales J L, Nocedal J. Remark on "algorithm 778:L-BFGS-B:Fortran subroutines for large-scale bound constrained optimization"[J]. ACM Transactions on Mathematical Software, 2011, 38(1): 1–2. [DOI:10.1145/2049662.2049669]
  • [14] Wang L, Loffeld O, Ma K L, et al. Sparse ISAR imaging using a greedy Kalman filtering approach[J]. Signal Processing, 2017, 138: 1–10. [DOI:10.1016/j.sigpro.2017.03.002]
  • [15] Wang L, Loffeld O. ISAR imaging using a null space l1 minimizing Kalman filter approach[C]//Proceedings of the 4th International Workshop on Compressed Sensing Theory and its Applications to Radar, Sonar and Remote Sensing. Aachen, Germany: IEEE, 2016: 232-237.[DOI: 10.1109/CoSeRa.2016.7745735]
  • [16] Morcego B, Fuertes J M, Cembrano G. Neural modules: networks with constrained architectures for nonlinear function identification[C]//Proceedings of International Workshop on Neural Networks for Identification, Control, Robotics and Signal/Image Processing. Venice, Italy: IEEE, 1996: 290-298.[DOI: 10.1109/NICRSP.1996.542771]
  • [17] Bacci A, Giusti E, Cataldo D, et al. ISAR resolution enhancement via compressive sensing: a comparison with state of the art SR techniques[C]//Proceedings of the 4th International Workshop on Compressed Sensing Theory and its Applications to Radar, Sonar and Remote Sensing. Aachen, Germany: IEEE, 2016: 227-232.[DOI: 10.1109/CoSeRa.2016.7745734]
  • [18] Venkataramani R, Bresler Y. Further results on spectrum blind sampling of 2D signals[C]//Proceedings of 1998 International Conference on Image Processing. Chicago, IL, USA: IEEE, 1998: 752-757.[DOI: 10.1109/ICIP.1998.723641]