发布时间: 2019-07-16
摘要点击次数:
全文下载次数:
DOI: 10.11834/jig.180534
2019 | Volume 24 | Number 7

图像处理和编码

两阶段多层感知的随机脉冲噪声比例预测

于海雯, 易昕炜, 徐少平, 张贵珍, 刘婷云

南昌大学信息工程学院, 南昌 330031

收稿日期: 2018-09-19; 修回日期: 2018-12-28

基金项目: 国家自然科学基金项目（61662044，61163023，51765042，81501560）；江西省自然科学基金项目（20171BAB202017）

第一作者简介: 于海雯, 1972年生, 女, 讲师, 主要研究方向为图形图像处理技术和机器视觉。E-mail:yuhaiwen@ncu.edu.cn;
易昕炜, 男, 本科生, 主要研究方向为图像处理。E-mail:6105117013@email.ncu.edu.cn;
张贵珍, 女, 硕士研究生, 主要研究方向为图像处理和机器视觉。E-mail:406130917331@email.ncu.edu.cn;
刘婷云, 女, 硕士研究生, 主要研究方向为图像处理和机器视觉。E-mail:416114517210@email.ncu.edu.cn.

中图法分类号: TP391

文献标识码: A

文章编号: 1006-8961(2019)07-1043-13

摘要

目的基于卷积神经网络（CNN）在图块级上实现的随机脉冲噪声（RVIN）降噪算法在执行效率方面较经典的逐像素点开关型降噪算法有显著优势，但降噪效果如何取决于能否对降噪图像受噪声干扰程度（噪声比例值）进行准确估计。为此，提出一种基于多层感知网络的两阶段噪声比例预测算法，达到自适应调用CNN预训练降噪模型获得最佳去噪效果的目的。方法首先，对大量无噪声图像添加不同噪声比例的RVIN噪声构成噪声图像集合；其次，基于视觉码本（visual codebook）采用软分配（soft-assignment）编码法提取并筛选若干能反映噪声图像受随机脉冲噪声干扰程度的特征值构成特征矢量；再次，将从噪声图像上提取的特征矢量及对应的噪声比例分别作为多层感知网络的输入和输出训练噪声比例预测模型，实现从特征矢量到噪声比例值的映射（预测）；最后，采用粗精相结合的两阶段实现策略进一步提高RVIN噪声比例的预测准确性。结果针对不同RVIN噪声比例的失真图像，从预测准确性、实际降噪效果和执行效率3个方面验证提出算法的性能和实用性。实验数据表明，本文算法在大多数噪声比例下的预测误差小于2%，降噪效果（PSNR指标）较其他主流降噪算法高24 dB，处理一幅大小为512×512像素的图像仅需3 s左右。结论本文提出的RVIN噪声比例预测算法在各个噪声比例下具有鲁棒的预测准确性，在降噪效果和执行效率两个方面较经典的开关型RVIN降噪算法有显著提升，更具实用价值。

关键词

降噪; 随机脉冲噪声; 噪声比例预测; 噪声比例感知特征; 多层感知网络; 计算效率

Two-stage multi-layer perceptron estimation for random-valued impulse noise ratio

Yu Haiwen, Yi Xinwei, Xu Shaoping, Zhang Guizhen, Liu Tingyun

School of Information Engineering, Nanchang University, Nanchang 330031, China

Supported by: National Natural Science Foundation of China (61662044, 61163023, 51765042, 81501560)

Abstract

Objective The existing switching random-valued impulse noise (RVIN) removal algorithms mainly detect the noisy pixels of an image to be denoised by comparing the local image statistic with predefined thresholds. Then, denoising methods are combined to restore the detected noisy pixels in a pixel-wise manner, resulting in low execution efficiency. With regard to computational complexity, the convolutional neural network (CNN)-based denoising algorithms that were implemented at patch-level for RVIN exhibits a significant advantage over classical switching denoising algorithms that detect and remove RVIN pixel by pixel. However, the restoration performance of the CNN-based denoising algorithms remains limited to the accurate estimation of the distortion level of the given noisy image. In essence, the CNN-based denoising algorithm is still a non-blind method, wherein the optimal denoising effect can be only obtained by training a specific denoising model at a fixed noise level, thereby limiting practical application. For simplicity, the noise ratio can be treated as a measure of the distortion level of a noisy image by dividing the number of detected noisy pixels by the total number of image pixels. The CNN-based denoising methods can blindly and efficiently remove the RVIN with high quality by adaptively using the corresponding pre-trained denoisers in accordance with the estimated noise ratio. A two-stage noise ratio estimation algorithm based on multi-layer perceptron (MLP) was proposed in this paper to estimate the noise ratio precisely. Method Substantial clean images were first corrupted with RVIN at different ratios to form a set of noisy images. Then, the features that can reflect the distortion level of a noisy image were extracted and screened to form feature vector for each noisy image on the basis of the visual codebook and soft-assignment coding technology. Subsequently, the feature vectors and their corresponding noise ratios extracted from noisy images were used as the input and output of the multi-layer perceptron model, respectively, to train the noise ratio estimation model that maps a given feature vector to its corresponding noise ratio. Generally, numerous hidden layers are required in MLP architecture to obtain the ideal approximation function. However, the development of an MLP-based regression model with multi-hidden layers is difficult in convergence and training speed. Therefore, a coarse-to-fine two-stage strategy was used to improve the estimation accuracy further. Specifically, a relatively coarse noise ratio estimation model was trained across the entire range of noise ratio. Then, the noise ratio range was divided into several sub-ranges, indicating that the mapping range of the estimation model is diminished. Similarly, several fine noise ratio estimation models were trained in different noise ratio sub-ranges. Each subinterval overlaps with its adjacent subinterval to avoid the estimation inaccuracy at the subinterval extremities. In the prediction phase, a preliminary estimation is first obtained using the coarse estimation model. On this basis, the corresponding fine estimation model is used to predict the noise ratio further accurately. Result Comparison experiments were conducted to test the validity of the proposed method from three aspects, namely, estimation accuracy, denoising effect, and execution efficiency. The proposed method was initially compared with several classical noise detectors of RVIN denoising methods, such as PSMF, ROLD-EPR, ASVM, and ROR-NLM, to demonstrate the estimation accuracy. The number of detected noisy pixels was converted into noise ratio because the output result of the noise detectors of those compared switching denoising methods is the number of noisy pixels. Results show that the estimation error of the proposed method is less than 2% across different noise ratios, thereby showing stronger robustness than others. The feed-forward denoising convolutional neural network (DnCNN) algorithm designed for removing Gaussian noise was improved to manage RVIN removal for verifying the availability of the proposed method. In denoising effect comparison, the peak signal-to-noise ratio (PSNR), structural similarity (SSIM), and feature similarity (FSIM) were adopted as image quality assessment indexes. For the distorted images with different RVIN noise ratios, the PSNR values obtained by the improved DnCNN algorithm utilizing the proposed method increase by 2 dB more than that of others across the noise ratio range from 10% to 60%. Moreover, the FSIM values rank second for different noise ratios, whereas the SSIM values approximate the optimal results. With regard to qualitative visual evaluation, the improved DnCNN algorithm utilizing the proposed estimation model can generate a clear restored image with enhanced edge preservation. The improved DnCNN algorithm outperforms the switching RVIN removal methods in terms of execution efficiency, which takes only 3.8 s to restore an image of size 512×512 pixels. Conclusion Extensive experiments show that the estimation accuracy of the proposed MLP-based noise ratio estimation algorithm is robust across a wide range of noise ratios. With the proposed noise estimation model, the CNN-based RVIN removal algorithms can achieve optimal blind denoising by exploiting the closest matching model. Moreover, the improved DnCNN denoising algorithm with the noise ratio estimation module significantly outperforms the traditional switching RVIN denoising algorithm in terms of denoising effect and execution efficiency, thereby rendering it highly practical.

Key words

image denoising; random-valued impulse noise (RVIN); noise ratio estimation; noise ratio-aware feature; multi-layer perceptron network; computational efficiency

0 引言

图像在受到随机脉冲噪声(RVIN)干扰后，部分像素点的亮度值可在其允许的范围内随机发生改变，变化后像素点亮度值在很多时候与其相邻像素点的亮度值相差不大，因此对图像中的RVIN噪声点进行检测并去除的难度较大^[1]。为此，研究者针对RVIN噪声的随机性和不确定性提出了许多降噪算法^[2-4]。到目前为止，已提出的随机脉冲噪声降噪算法大都属于逐像素点的开关型算法，即首先利用噪声检测器采用逐点方式判断当前窗口内中心像素点是否被破坏，然后根据检测的结果决定是否启动相应的降噪算法来完成噪声点的复原。

早期的开关型RVIN降噪算法^[5-7]主要依据计算中值滤波器(或其衍生滤波器)的输出值和中心像素点亮度值之间的绝对差值与预设阈值的比较结果来判断中心像素点是否为噪声点，然后针对检测出的噪声点调用相应的降噪算法对其复原。这种实现策略在低比例噪声条件下能较为理想地完成降噪任务，但是随着噪声比例的增大，噪声检测正确率快速下降，影响了后续的图像复原效果。为了提高噪声点的检测准确率，研究者根据自然图像局部相似的规律提出了基于图像局部统计值(LIS)的RVIN检测算法。Garnett等人^[8]引入绝对差值排序(ROAD)统计值进行RVIN噪声点的检测。ROAD统计值是指前$m$个当前局部窗口内中心像素点与邻域像素点的亮度值之间的绝对差值(已排序)的累积和，将其与预设阈值进行比较来检测判断该中心像素点是否被RVIN噪声污染。ROAD检测器的检测正确率较高，但当噪声比例较高时，检测正确率开始下降。Dong等人^[6]为了放大噪声和非噪声像素点之间的差异，对ROAD统计值进行对数变换，提出了基于对数差值排序(ROLD)统计值的噪声检测器，在一定程度上提高了噪声检测的正确率。在此基础上，利用边缘保持正则化(EPR)方法实现RVIN噪声的去除。虽然ROAD和ROLD检测器可以检测出图像中的大部分随机脉冲噪声点，但是仅依赖单次的统计值与阈值的判定很难获得较高的预测准确率，尤其是对图像边缘噪声点的检测效果非常不理想，这种情况在高比例噪声条件下尤为明显。传统的RVIN降噪算法大多采用从粗到精依次设置递减阈值的迭代检测策略来提高噪声检测正确率，迭代过程的每一步都需要利用某种降噪算法完成对已检出的RVIN像素点的降噪，故基于这种策略实现的噪声检测过程并不是一步完成的，执行效率比较低。为提高检测效率，近期Turkmen^[9]提出了一种基于人工神经网络(ANN)的随机脉冲降噪算法。该算法采用ROAD和ROLD两个统计值作为网络的输入来训练RVIN噪声检测器，一旦噪声检测模型训练完毕，就可以一次性检测出图像中所有的像素点，且无需与某种降噪算法绑定迭代执行，可以高效率地执行检测噪声任务。但该算法采用的仍然是逐点检测策略，受预测模型的制约，虽然ANN噪声检测器的执行效率较传统的统计值—阈值方法有所提高，但检测正确率不是很高，达不到传统的基于LIS统计值检测方法的水平。总之，现有开关型RVIN降噪算法的性能严重依赖噪声检测器对图像中噪声像素点的检测正确率和效率，而目前的检测算法在这两个方面尚难获得一个很好的折中平衡点。

近年来，卷积神经网络(CNN)因局部感知(local connections)及权值共享(shared weights)特性在计算机视觉与图像处理领域^[10-11]获得了比传统方法更加令人满意的结果。同时，基于图像处理单元(GPU)的通用并行计算技术可以极大地提高这类算法的执行效率，研究者已经提出很多利用CNN解决图像降噪问题的算法^[12-13]。Zhang等人^[12]提出前馈降噪卷积神经网络(DnCNN)去除高斯噪声，比传统高斯降噪算法(BM3D(block-matching and 3D filtering)^[14]、MLP(multi-layer perceptron)^[15]、WNNM(weighted nuclear norm minimization)^[16]、TNRD(trainable nonlinear reaction diffusion)^[17])具有更好的降噪效果和执行效率。其实，DnCNN算法中利用CNN去除高斯噪声的技术路线经过合理改进可以用于去除RVIN噪声，只要将训练数据集合中的DnCNN模型的输入数据替换成受RVIN噪声干扰的图像即可。但DnCNN的算法框架本质上属于基于训练的降噪框架，这种类型的降噪算法获得最佳降噪效果的前提是待降噪图像与调用的降噪模型在训练时使用的图像受到噪声干扰的程度相似，只有这样才能发挥最大降噪效果。实践中，噪声比例(noise ratio)是衡量噪声图像受RVIN噪声干扰程度简单且有效的指标。因此，若要采用训练策略实现性能最佳(包括降噪质量和执行时间)的RVIN噪声的去除，构建噪声比例检测器对图像噪声比例进行检测是必不可少的工作。

自然图像一旦受到RVIN噪声干扰，图像内在统计特征会发生有规律的变化^[18]，度量这些规律性的变化可实现噪声比例的预测。因此，本文首先试图提取能够反映图像受RVIN噪声干扰程度的噪声比例感知特征(NRAF)，然后基于多层感知(MLP)网络实现从NRAF特征到噪声比例值的映射(预测)，为了获得更高的预测正确率，采用粗精相结合的两阶段策略实现噪声比例的预测。最后在不同噪声比例区间内预训练多个CNN降噪模型(对DnCNN算法做适当的改进使其可用于RVIN噪声的去除)。基于此，对于一幅待降噪图像，根据噪声比例检测器的预测结果(图像中RVIN噪声比例)自适应地调用预先训练的相应DnCNN降噪模型即可完成RVIN降噪任务。所提出的噪声比例预测算法及改进DnCNN降噪模型(构成新型RVIN降噪算法)一旦训练完成即可直接使用，整个过程无需人工再设置任何参数，属于盲降噪算法。大量实验表明，所提出的新型RVIN降噪算法在降噪效果和执行效率两个方面较经典开关型RVIN降噪算法有大幅度提高，具有更好的实用价值。

1 多层感知网络

近年来，人工神经网络因具备强大的学习能力可以完成输入与输出间复杂的非线性映射，在图像分类^[19]、目标检测^[20]以及人脸识别^[21]等领域得到广泛的应用。其中，前馈神经网络(FNN)是最简单且使用最广泛的神经网络模型之一，其基本组成单元是感知器模型^[22]。多层感知器(MLP)通常由输入层、一个或多个隐藏层以及输出层组成，每一层由简单的神经元或节点构成，每个节点连接到相邻层中的各个节点，每一层神经元的输出作为下一层神经元的输入。其中，节点由权值和输出信号连接，输出信号是许多简单非线性传输函数或激活函数的加权和，权值在网络的训练过程中可不断调整。图 1展示了输入向量与输出之间的非线性映射关系，图中每个圆圈代表一个神经元节点，有“+1”标识的圆圈代表偏置节点。理论上来讲，只要选择一组合适的连接权值和非线性传输函数，多层感知器即可逼近输入和输出向量之间的任意光滑可测函数。

图 1 具有2个隐藏层的多层感知器

Fig. 1 Multi-layer perceptron with two hidden layers

多层感知器的训练是确定权重的过程，以便精确地确定输入向量与输出向量之间的关系。MLP网络的最终训练目标是找到网络中连接权重和偏置的最佳组合, 使得训练和测试样本的误差最小。具体而言，假设多层感知神经网络有$n$层，输入层记为$l_\rm{1}$，输出层记为$l_n$，隐藏层记为$l_\rm{2}$, $l_\rm{3}$, …, ${l_{n - 1}}$，则MLP网络第$k$层的输出为

$U_i^k = \sum\limits_{j = 1}^n {\left( {W_{i, j}^{k - 1}F_j^{k - 1} + b_j^{k - 1}} \right)} $

(1)

式中，$W^{k-1}_{i, j}$表示第$k-1$层中的第$j$个结点和第$k$层中的第$i$个结点之间的权重。$F^{k-1}_j$表示第$k-1$层第$j$个结点的特征值，$b^{k-1}_j$表示对应的偏置值，$U^k_i$表示第$k$层第$i$个神经元的输入总和。第$k$层的第i个神经元的输出$X^k_i$与输入总和$U^k_i$之间的关系为

$X_i^k = f\left( {U_i^k} \right) $

(2)

式中，$f\left( \cdot \right)$函数表示每个神经元的激活函数，常见的激活函数sigmoid的形式一般为

$f\left( z \right) = \frac{1}{{1 + \exp \left( { - z} \right)}} $

(3)

权重通过训练调整后，给定一个输入，网络模型就能够给出相对应的输出，该输出能够最大程度地逼近所期望的结果。

2 随机噪声比例预测

2.1 基本思想

现有的主流RVIN降噪算法大多采用工作在像素点级上的开关型降噪策略，这种降噪方式导致降噪算法的性能严重受制于噪声检测器，而现有的噪声检测器在检测正确率和执行效率两个方面均有待提高，但短时期内难以大幅度提高。近期提出的基于CNN的RVIN降噪算法具有较高的执行效率，但却是通过训练的方式实现的，必须在与待降噪图像受噪声干扰程度近似的图像集合上进行训练，CNN降噪模型才能获得最佳的降噪效果。对于随机脉冲噪声而言，噪声比例是一种简单而有效的反映图像受RVIN噪声干扰程度的指标。为了直观地验证CNN降噪模型的降噪效果的确受制于RVIN噪声比例的估计准确度，在3个噪声比例区间(分别为30%~40%、35%~45%、40%~50%)的噪声图像集合上训练出3个专门的CNN降噪模型，依次命名为model1、model2、model3，这3个模型分别对35%、40%和45%的RVIN噪声具有最佳的降噪效果。然后用这3个模型分别对施加了40%的随机脉冲噪声的Lena图像(大小为512×512像素)进行降噪，降噪后的视觉效果如图 2所示。从图 2可知，利用model2模型降噪获得的PSNR = 32.38 dB(图 2(d)), 比利用相邻模型model1的PSNR = 30.60 dB(图 2(c))和model3的PSNR = 30.84 dB(图 2(e))高1.5 dB左右，说明仅在调用与图像噪声比例值最为匹配的CNN降噪模型时才能获得最佳的降噪效果。

图 2 不同噪声图像集合上训练的CNN降噪模型对RVIN噪声比例为40%的Lena图像降噪的效果对比图

Fig. 2 Denoised images obtained by different CNN-based denoising model ((a) original image; (b) 40% RVIN noisy image; (c) model1; (d) model2; (e) model3)

为此，提出了一种工作在图块级上的基于MLP网络的两阶段RVIN噪声比例预测算法，该算法适用于基于CNN训练的降噪算法。通过所提出算法检测待降噪图像的噪声比例，并以此为依据调用相应预训练的CNN降噪模型，即可获得一种降噪效果和执行效率俱佳的RVIN降噪算法。具体地，为了构建噪声比例预测算法，首先将大量有代表性的原始无失真图像分解为图块并通过聚类算法获得视觉码本(VC)^[23]，码本中的记录反映了无失真图像具有代表性的单词。然后对大量有代表性的原始无失真图像施加各个级别的RVIN噪声，构成噪声图像集合。对于每一幅噪声图像，随机从图像中抽取大量图块(本文使用10 000个)，并基于构建的视觉码本，利用软分配(soft-assignment)编码法计算这些噪声图块与码本中各个单词的相似度(距离)，作为反映图像受RVIN干扰的程度。将各个距离值组合起来可构成反映图像受噪声干扰程度的特征矢量，为了降低特征矢量中那些对噪声比例不敏感的特征值对模型训练的影响，并减少算法的执行时间，从提取的特征矢量中筛选出与噪声比例相关性较高的若干维特征，构成NRAF特征矢量，作为MLP网络的输入以训练噪声比例预测模型，实现NRAF特征矢量到噪声比例值的映射。为了进一步提高噪声比例的预测正确率，将整个噪声比例范围划分为更小的子范围(降低MLP网络映射模型的构建难度)，利用上述相同的训练方法训练精细预测模型，从而获得一种粗精相结合的噪声比例预测模型。

2.2 特征值提取

图像在受到不同比例的RVIN噪声干扰后，统计特征会发生规律性的变化。本文主要通过构建视觉码本^[23]的方法提取图像中蕴含的NRAF特征。首先将大量原始无失真图像拆分成若干个大小为$B×B$像素的图块，其次对图块进行$K$-means聚类分析，构建视觉码本，视觉码本可表示为矩阵$\mathit{\boldsymbol{D}}_{d×K}=(\mathit{\boldsymbol{D}}_1, \mathit{\boldsymbol{D}}_2, …, \mathit{\boldsymbol{D}}_K)$，其中，$d=B×B$是通过$K$-means聚类方法学习的簇的质心(centroids of clusters)。然后对学习的码本进行归一化处理，使得每一个基都有单位长度(unit length)，归一化处理后的码本可表示为$\mathit{\boldsymbol{\widetilde D}}_{d×K}=(\mathit{\boldsymbol{\widetilde D}}_1, \mathit{\boldsymbol{\widetilde D}}_2, …, \mathit{\boldsymbol{\widetilde D}}_K)$。对于给定的一幅受某一噪声比例干扰的噪声图像$\mathit{\boldsymbol{I}}$，随机从中抽取$N$个大小为$B×B$像素的图块进行归一化处理，然后通过零分量分析(ZCA)进行白化处理(whitening)，得到图块局部特征矢量$\mathit{\boldsymbol{X}}=(\mathit{\boldsymbol{x}}_1, \mathit{\boldsymbol{x}}_2, …, \mathit{\boldsymbol{x}}_k, …, \mathit{\boldsymbol{x}}_N)$，其中$\mathit{\boldsymbol{x}}_k \in {\bf{R}}^d$。利用归一化处理后的码本$\mathit{\boldsymbol{\widetilde D}}$对这些图块进行软分配编码。具体编码方法是将图块$\mathit{\boldsymbol{x}}_k$与$\mathit{\boldsymbol{\widetilde D}}$中的视觉码字(visualcodewords)进行点积计算，得到两者之间的距离${s_{i, j}} = {\mathit{\boldsymbol{x}}_i} \cdot {\mathit{\boldsymbol{\widetilde D}}_j}$，用其表示局部特征矢量$\mathit{\boldsymbol{X}}$中的$\mathit{\boldsymbol{x}}_i$与视觉码字$\mathit{\boldsymbol{\widetilde D}}_j$的相似性度量。这样整个图像的编码系数可表示为

$\begin{array}{*{20}{l}} {{c_i} = \left( {\max \left( {{s_{i, 1}}, 0} \right), \cdots , \max \left( {{s_{i, d}}, 0} \right)} \right.}\\ {\max \left( { - {s_{i, 1}}, 0} \right), \cdots , \max \left( { - {s_{i, d}}, 0} \right){)^{\rm{T}}}} \end{array} $

(4)

本文使用的软分配函数是文献[24]中软阈值(soft threshold)函数的特例，将阈值设置为0。具体实现时，为了让获得的特征值具有一般性，随机从图像中抽取10 000个图块，则基于式(4)可以从每幅图像上提取得到20 000维特征矢量，这是一个高维的特征矢量。

2.3 特征值筛选

通过上述特征值提取方法虽然可以得到20 000维特征值，但是其中绝大多数特征值并不能稳定地反映图像受RVIN噪声干扰后发生的规律性变化。此外，特征的维数过多不仅会加大后续预测模型的计算量，而且会在某种程度上降低噪声比例预测模型的精度。因此，本文并不直接使用所有的20 000维特征组成NRAF特征，而是通过计算这些特征值与噪声水平值之间的相关性，从20 000维特征中筛选出与噪声比例相关性较高的若干维特征作为NRAF特征值使用(MLP预测模型的输入)。为了筛选这些特征，从BSD500图像库^[25]中选取50幅无失真图像作为测试图像集合，对测试集合中的每一幅图像分别施加噪声比例为5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%共12个级别的RVIN噪声，构成600幅噪声图像，每幅噪声图像的噪声比例值组合后可构成大小为600×1的矩阵

$\mathit{\boldsymbol{A}} = {\left( {{\alpha _1}, {\alpha _2}, \cdots , {\alpha _i}, \cdots , {\alpha _{600}}} \right)^{\rm{T}}} $

(5)

式中，

${\alpha _i} = \left\{ {\begin{array}{*{20}{l}} {0.05 \times i}&{i \le 12}\\ {{\alpha _{(i - 12)}}}&{i > 12} \end{array}} \right. $

(6)

然后提取每幅噪声图像的20 000维特征构成大小为$20 000 \times 1$的特征矢量$\mathit{\boldsymbol{\beta }}_j$，600幅噪声图像的特征矢量堆叠组合转置后构成大小为600×20 000的矩阵$\mathit{\boldsymbol{B}} = {\left( {{\mathit{\boldsymbol{\beta }}_1},{\mathit{\boldsymbol{\beta }}_2}, \cdots ,{\mathit{\boldsymbol{\beta }}_j}, \cdots ,{\mathit{\boldsymbol{\beta }}_{600}}} \right)^{\rm{T}}}$。最后计算矩阵$\mathit{\boldsymbol{A}}$和矩阵$\mathit{\boldsymbol{B}}$中各个列矢量$\mathit{\boldsymbol{\beta }}_j$之间的皮尔森线性相关系数(PLCC)值，获得一个具有20 000个值的相关系数矩阵$\mathit{\boldsymbol{P}}=(p_1, p_2, …, p_i, …, p_{20 000})^\rm{T}$。矩阵$\mathit{\boldsymbol{P}}$反映了各维特征值与噪声水平值之间的相关性，这样通过设置阈值可以筛选出对RVIN噪声最为敏感的特征。如表 1所示，仅有13维特征值满足相关系数值大于0.95，表明它们与噪声水平值具有极强的相关性，故最终只选用这些特征值构成NRAF特征矢量$\mathit{\boldsymbol{F}}=(f_1, f_2, …, f_{13})$。特征值的筛选过程不仅降低了相关性不高的特征对模型训练的干扰，同时也减少了参与运算的数据量，加快了数据处理速度，提高了执行效率。

表 1 不同的预设阈值对特征值的筛选情况
Table 1 Features screening results using different thresholds

下载CSV

相关系数值	满足条件的特征值维数
≥0.60	5 558
≥0.65	4 339
≥0.70	3 379
≥0.75	2 543
≥0.80	1 748
≥0.85	985
≥0.90	403
≥0.95	13

2.4 两阶段预测

使用CNN降噪模型去除图像中的RVIN噪声时，需要知道待降噪图像的噪声比例才能调用最合适的降噪模型完成理想的降噪任务。为了解决这一问题，将从噪声图像训练集合中的每一幅噪声图像上提取的NRAF特征矢量和相应的噪声比例值构成训练输入输出对(TP)，然后基于TP数据采用MLP网络训练噪声比例预测模型，完成NRAF特征矢量到噪声比例值的映射。一般地，当噪声比例范围较大时，为获得理想的逼近函数，需要在构建MLP预测模型时设置更多的隐含层，但会随之增加模型的拟合难度及训练时间。而预测目标值的范围较小时，网络模型更容易收敛，预测准确性也更高。因此，本文采用粗精结合的两阶段预测策略实现噪声比例值的估计。首先在整个噪声比例范围内训练一个相对粗粒度的MLP预测模型，然后将噪声比例范围划分为多个子区间(即将预测模型映射范围缩小)，并采用相同的方法针对各个子区间训练精细MLP预测模型。具体地，在噪声比例范围$[0, 60%]$内训练一个粗糙的预测模型以确定噪声比例的大致范围，然后将范围$[0, 60%]$划分为11个子区间，为了解决处于子区间边缘的噪声比例预测不准的问题，每个子区间都与其相邻子区间重叠了一部分，即0~10%，5%~15%，10%~20%，15%~25%，20%~30%，25%~35%，30%~40%，35%~45%，40%~50%，45%~55%，50%~60%。在每个子范围内对同一无失真图像集合中的每幅图像添加间隔为2%的RVIN噪声预先训练出相应的专用CNN降噪模型。在预测时，先用粗糙预测模型对图像噪声比例进行初步预测，然后根据初步预测的结果选择相应分段上更为精细的预测模型进行二次预测，以获得更为精确的噪声比例预测值。具体选择时，从第2个噪声比例区间开始，如果第1阶段的预测值大于等于某个区间范围的中值，则调用该区间相应的预测模型估计图像噪声比例，否则调用前一相邻区间的预测模型对噪声比例进行估计。

表 2列举了在10幅常用经典测试图像(图 3)上计算的粗糙模型和精细模型在不同噪声比例下的均方根误差。从表 2可以看出，大多数情况下，精细模型得到的均方根误差均比粗糙模型获得的数值更小。即精细模型预测的误差比粗糙模型的要小，预测值更接近真实的噪声比例，充分说明了两阶段预测方法的有效性和必要性。

图 3 在各种文献中常用的测试图像

Fig. 3 Commonly used images in the literatures

((a)Boat; (b) Lena; (c) House; (d) Cameraman; (e) Couple; (f) Barbara; (g) Peppers; (h) Hill; (i) Man; (j) Monarch)

表 2 精细模型和粗糙模型预测结果与真实噪声比例的均方根误差
Table 2 RMSE between the ground truth noise ratios and the estimated ones

下载CSV

噪声比例/%	粗糙模型	精细模型
10	2.27	2.56
15	2.09	1.85
20	2.37	1.37
25	4.2	1.93
30	4.11	1.31
35	3.47	2.51
40	4.48	1.57
45	3.28	2.78
50	2.77	1.83
55	1.74	2.10

2.5 噪声比例检测器的算法流程

综上所述，本文基于多层感知网络的噪声比例检测预测算法的步骤如下：在训练阶段，首先在具有代表性的无失真图像集上施加噪声比例为0~60%、间隔为5%的随机脉冲噪声构成粗糙(精细)训练图像集，从训练集合图像中提取每一幅噪声图像的NRAF特征矢量和相应的噪声比例值构成训练数据，并依据上文介绍的方法训练粗粒度的预测模型。训练精细预测模型的整个过程与粗糙预测模型的训练过程类似，不同之处在于训练的模型更加细化，也是将0~60%细分成11个子区间，在每个区间内对训练图像施加噪声比例间隔2%的RVIN噪声。在预测阶段，首先基于视觉码本和软分配编码法提取噪声图像中的13维NRAF特征，然后利用粗糙降噪模型对其噪声比例值进行预测，最后根据粗糙预测模型的预测结果调用精细预测模型再次预测待降噪图像的噪声比例。

以上算法流程的具体步骤如下：

算法1 两阶段RVIN噪声比例预测算法

输入：无失真图像集合、噪声图像$\mathit{\boldsymbol{I}}$。

输出：噪声比例$\delta $。

训练阶段：

1) 将大量无失真图像拆分成图块构建视觉码本。

2) 在大量无失真图像上施加0~60%、间隔5%的RVIN噪声构建噪声图像集合。

3) 基于视觉码本和软分配编码法提取噪声图像集合中每一幅噪声图像的NRAF特征矢量(仅利用筛选后的13维数据)，并结合相应的噪声比例值构建训练数据集合。

4) 基于训练数据集合利用MLP网络训练粗粒度预测模型。

5) 将0~60%细分成11个子区间，添加间隔为2%的噪声构建噪声图像集合。

6) 采用与粗粒度预测相同的方法，在各个细分噪声比例段内训练精细预测模型。

预测阶段：

7) 提取给定噪声图像$\mathit{\boldsymbol{I}}$的NRAF特征矢量$\mathit{\boldsymbol{F}}=(f_1, f_2, …, f_{13})$(筛选后的13维数据)。

8) 利用粗糙预测模型进行预测，确定噪声比例的大致范围。

9) 根据粗糙预测模型的预测结果调用精细模型，再次预测待降噪图像的噪声比例。

3 实验与分析

3.1 测试环境

为了评估本文提出的噪声比例检测器的预测能力，与4个经典的RVIN降噪算法(PSMF(progressive switching median filter)^[26]、ROLD-EPR(rank-ordered logarithmic difference eage-perserving reqularization)^[6]、ASWM(adaptive suitching median filter)^[7]和ROR-NLM(robust outlyingness ratio-nonlocal means)^[27])使用的噪声检测器在常用的测试图像(如图 3所示)上进行实验对比。同时，为了验证提出的噪声比例检测器在新型非开关型RVIN降噪算法中的作用，对DnCNN算法^[12](可以是任何基于训练的RVIN降噪算法，这里仅以DnCNN算法为例)进行了必要的改进，使其可用于去除随机脉冲噪声，然后与提出的噪声检测器相结合构成新型的非开关型随机脉冲降噪算法(ACNN)，与上述4个对比算法在不同噪声比例下比较实际降噪效果。实验的硬件平台为：Inter(R) Core(TM) i7-3517U CPU @ 2.40 GHz RAM 8 GB，软件环境为：Windows 10操作系统，MATLAB R2016b编程环境，所有实验均在相同软硬件环境下完成。

3.2 预测准确性

为了测试提出的噪声比例预测算法的预测准确性，在10幅常用图像(如图 3所示)上进行对比实验。分别使用噪声比例预测模型对施加了不同噪声比例的图像进行预测，并与现有的经典噪声检测算法(PSMF^[26]、ROLD-EPR^[6]、ASWM^[7]、ROR-NLM^[27])进行对比。由于这4个对比算法都是采用逐点的方式进行噪声检测，得到的是噪声点的个数。为了便于比较，将检测出的噪声点个数除以整幅图像的总像素点个数，得出噪声比例。表 3是Peppers图像在施加噪声比例为10%~55%、间隔5%的RVIN噪声干扰下不同算法的实验数据对比，其他图像的实验结果类似。从表 3可以看出，本文算法在大多数情况下排在前2名，表现出了良好的预测准确性。

表 3 各算法在添加了不同级别RVIN噪声的Peppers图像上的预测结果
Table 3 Estimation results of different methods on Peppers image across different noise ratios

下载CSV

/%
算法	噪声比例
算法	10%	15%	20%	25%	30%	35%	40%	45%	50%	55%
ASWM^[7]	6.49	11.96	17.45	23.10	28.56	34.26	39.92	45.41	51.62	57.39
PSMF^[26]	6.60	8.47	10.03	11.82	13.52	15.27	16.68	18.14	19.51	21.21
ROLD-EPR^[6]	7.58	12.25	16.55	20.46	25.11	29.76	33.23	38.63	43.33	47.69
ROR-NLM^[27]	12.72	17.06	21.19	25.54	29.49	33.92	37.55	42.16	45.56	49.84
本文	10.57	12.90	20.72	24.88	25.28	33.88	40.03	48.33	49.67	54.36
注：加粗字体表示最优结果，加下划线表示次优结果。

为了进一步测试提出的RVIN噪声比例预测算法的稳定性，在图 3所示的10幅图像上添加各个级别(10%~55%、间隔5%)的RVIN噪声，计算各噪声检测器在噪声图像上的预测噪声比例与真实噪声比例的均方根误差来度量噪声比例检测正确率，将其与上述经典RVIN降噪算法中的噪声检测方法进行对比，结果如表 4所示。从表 4可以看出，本文算法在各个噪声比例下均能排在前2名，且大部分情况下都表现出了最佳预测能力。

表 4 各算法在10幅图像上的预测结果的均方根误差值
Table 4 RMSE between estimated results and ground truths on ten commonly used images

下载CSV

算法	噪声比例
算法	10%	15%	20%	25%	30%	35%	40%	45%	50%	55%
ASWM^[7]	5.85	5.37	4.78	4.18	3.58	2.93	2.23	2.23	1.21	1.56
PSMF^[26]	1.18	2.78	4.06	5.63	7.18	8.95	10.61	12.57	14.38	16.41
ROLD-EPR^[6]	2.58	3.54	4.24	4.86	5.36	5.92	6.28	6.43	6.77	6.67
ROR-NLM^[27]	4.65	3.84	3.05	2.40	1.98	2.09	2.58	3.43	4.38	5.29
本文	2.55	1.85	1.37	1.93	1.31	2.51	1.57	2.78	1.83	2.10
注：加粗字体表示最优结果，加下划线表示次优结果。

3.3 实际降噪效果

为了评估提出的噪声比例检测器的实际使用效果，与4个经典算法ASWM、PSMF、ROLD-EPR、ROR-NLM在常用图像集上进行比较，选用PSNR(峰值信噪比)、SSIM(结构相似度)、FSIM(特征相似性)作为评价指标，比较结果如表 5—表 7所示。由表 5—表 7可知，本文算法在各个噪声比例下的PSNR值均表现最优；FSIM值在各个噪声比例下均排在前2名，绝大部分表现最优；SSIM值在各个噪声比例下的结果与最优值相差不大。实验数据充分说明应用了提出的噪声比例检测器后的CNN降噪算法的降噪效果是最佳的。

表 5 不同噪声比例下各降噪算法在PSNR评价指标上的比较
Table 5 Average PSNR performance of different demoising methods across different noise ratios

下载CSV

/dB
对比算法	噪声比例
对比算法	5%	10%	15%	20%	25%	30%	35%	40%	45%	50%	55%	60%
ASWM^[7]	31.17	30.61	30.03	29.47	28.87	28.34	27.74	27.05	26.26	25.24	23.97	22.51
PSMF^[26]	32.48	30.79	29.40	28.12	26.93	25.71	24.45	23.27	22.08	20.82	19.64	18.52
ROLD-EPR^[6]	33.90	31.92	30.62	29.73	28.98	28.30	27.72	27.13	26.65	26.13	25.58	24.95
ROR-NLM^[27]	29.06	28.73	28.41	28.00	27.54	27.03	26.48	25.85	25.00	24.08	22.92	21.67
本文	35.00	34.42	33.44	32.49	31.78	29.92	29.94	28.89	28.28	27.14	26.30	25.45
注：加粗字体表示最优结果，加下划线表示次优结果。

表 6 不同噪声比例下各降噪算法在FSIM评价指标上的比较
Table 6 Average FSIM performance of different denoising methods across different noise ratios

下载CSV

对比算法	噪声比例
对比算法	5%	10%	15%	20%	25%	30%	35%	40%	45%	50%	55%	60%
ASWM^[7]	0.976 5	0.973 6	0.969 9	0.965 7	0.960 7	0.955 1	0.948 1	0.938 4	0.925 8	0.906 0	0.876 6	0.838 1
PSMF^[26]	0.984 0	0.975 0	0.964 9	0.952 1	0.936 6	0.917 4	0.892 2	0.864 0	0.829 7	0.789 7	0.747 7	0.706 6
ROLD-EPR^[6]	0.987 8	0.980 9	0.973 6	0.967 5	0.961 2	0.954 3	0.947 1	0.939 6	0.931 1	0.921 4	0.908 3	0.891 8
ROR-NLM^[27]	0.967 4	0.964 4	0.960 7	0.955 7	0.949 5	0.942 0	0.931 5	0.917 4	0.897 3	0.869 8	0.835 5	0.797 5
本文	0.984 8	0.978 9	0.976 2	0.970 1	0.965 6	0.954 4	0.954 2	0.942 5	0.932 9	0.920 6	0.911 8	0.890 8
注：加粗字体表示最优结果，加下划线表示次优结果。

表 7 不同噪声比例下各降噪算法在SSIM评价指标上的比较
Table 7 Average SSIM performance of different denoising methods across different noise ratios

下载CSV

对比算法	噪声比例
对比算法	5%	10%	15%	20%	25%	30%	35%	40%	45%	50%	55%	60%
ASWM^[7]	0.941 9	0.933 6	0.924 6	0.914 3	0.902 5	0.889 8	0.874 2	0.854 5	0.828 5	0.788 7	0.734 7	0.666 9
PSMF^[26]	0.942 4	0.902 3	0.861 2	0.818 1	0.768 2	0.712 5	0.649 5	0.587 1	0.520 9	0.453 7	0.389 3	0.330 8
ROLD-EPR^[6]	0.957 9	0.938 7	0.918 2	0.904 5	0.893 7	0.876 3	0.859 6	0.843 5	0.827 2	0.808 9	0.781 3	0.759 0
ROR-NLM^[27]	0.928 0	0.920 7	0.911 8	0.901 0	0.887 3	0.870 0	0.846 6	0.814 6	0.770 5	0.713 7	0.647 5	0.578 1
本文	0.942 8	0.922 5	0.908 1	0.901 7	0.890 1	0.839 2	0.864 8	0.833 3	0.818 9	0.781 8	0.751 6	0.724 0
注：加粗字体表示最优结果，加下划线表示次优结果。

为了更加直观地比较本文算法的实际应用效果，图 4给出了各算法对受40%随机脉冲噪声干扰的Lena图像降噪后的效果图，并将其局部(帽檐部分)放大进行对比。从图 4可以看出，在相同噪声比例下，使用PSMF算法恢复的图像存在较多的噪声点，ROLD-EPR和ASWM算法恢复的图像存在一些比较明显的没有滤除的噪声点，ROR-NLM算法处理后的图像轮廓较为模糊，本文算法恢复的图像从Lena图像帽檐部分可以发现图像轮廓保留较好，且没有明显的噪声点，说明在检测比例噪声器的引导下，新的RVIN降噪算法调用了最匹配的DnCNN降噪模型，实现了最佳的降噪效果。

图 4 各算法对Lena图像降噪的效果对比

Fig. 4 Visual comparison of denoising results with different methods

((a) original image; (b) noisy image; (c) ROLD-EPR; (d) ASWM; (e)PSMF; (f) ROR-NLM; (g) ours)

3.4 执行效率

噪声检测器的执行效率也是评价其性能好坏的重要指标之一，关系到整个降噪算法的性能。为了验证提出的噪声检测器的执行效率，将提出的检测算法结合预先训练的CNN降噪模型对受RVIN脉冲噪声干扰的Lena图像进行复原，并与4种经典随机脉冲噪声降噪算法ASWM、ROLD-EPR、PSMF和ROR-NLM进行比较。计算各个参与对比的降噪算法在同一幅图像重复执行10次的平均执行时间，结果如表 8所示。

表 8 各噪声检测器结合相应降噪算法的平均执行时间
Table 8 Average execution time of each noise detector combined with corresponding denoising algorithm

下载CSV

/s
算法	时间
ROLD-EPR^[6]	12.13
ASWM^[7]	172.02
PSMF^[26]	0.51
ROR-NLM^[27]	84.91
本文	3.83

由表 8可知，PSMF算法的执行时间最少，但是从表 3和表 4的实验数据可知其检测正确率最差。而ASWM、ROLD-EPR和ROR-NLM算法中的噪声检测器由于需要与降噪模块配合使用才能获得最终的检测结果，执行时间都非常长。只有本文噪声检测器是基于MLP网络预测模型实现的，与改进DnCNN模型结合使用后能够在降噪效果和执行效率两方面均获得最佳的综合性能。

4 结论

本文提出了一种基于MLP网络粗精相结合的两阶段RVIN随机噪声比例检测器。与现有的大多数噪声检测器需要与某降噪算法串行迭代执行方式不同，提出的噪声比例检测器基于具有强大映射能力的MLP网络进行训练，一旦预测模型训练完成，进行噪声比例预测的执行时间非常短，且采用粗精相结合的两阶段预测策略能够有效地保证检测准确性。大量实验数据表明：相较于参与比较的各类经典随机脉冲降噪算法而言，DnCNN降噪算法在结合提出的噪声比例检测器后，能调用与待降噪图像最为匹配的降噪模型完成降噪，从而实现了盲降噪，并且改进后的RVIN降噪算法在执行效率和降噪后的图像质量两个方面均获得了最佳性能。未来将在进一步改进噪声比例预测方法方面继续展开研究，提高预测精度，为调用DnCNN降噪模型提供更为精准的依据，进一步提高RVIN降噪算法的降噪效果。

参考文献

[1] Taherkhani F, Jamzad M. Restoring highly corrupted images by impulse noise using radial basis functions interpolation[J]. IET Image Processing, 2018, 12(1): 20–30. [DOI:10.1049/iet-ipr.2016.0521]

[2] Yang H, Chen L T, Qiu H. Denoising algorithm for random-valued impulse noise based on weighted spatial local outlier measure[J]. Journal of Computer Applications, 2016, 36(10): 2826–2831. [杨昊, 陈雷霆, 邱航. 基于加权空间离群点度量的随机脉冲噪声降噪算法[J]. 计算机应用, 2016, 36(10): 2826–2831. ] [DOI:10.11772/j.issn.1001-9081.2016.10.2826]

[3] Singh N, Thilagavathy T, Lakshmipriya R T, et al. Some studies on detection and filtering algorithms for the removal of random valued impulse noise[J]. IET Image Processing, 2017, 11(11): 953–963. [DOI:10.1049/iet-ipr.2017.0346]

[4] Xu Q, Li Y H, Guo Y J, et al. Random-valued impulse noise removal using adaptive ranked-ordered impulse detector[J]. Journal of Electronic Imaging, 2018, 27(1): #013001. [DOI:10.1117/1.jei.27.1.013001]

[5] Chen T, Wu H R. Adaptive impulse detection using center-weighted median filters[J]. IEEE Signal Processing Letters, 2001, 8(1): 1–3. [DOI:10.1109/97.889633]

[6] Dong Y Q, Xu S F. A new directional weighted median filter for removal of random-valued impulse noise[J]. IEEE Signal Processing Letters, 2007, 14(3): 193–196. [DOI:10.1109/LSP.2006.884014]

[7] Akkoul S, Lédée R, Leconge R, et al. A new adaptive switching median filter[J]. IEEE Signal Processing Letters, 2010, 17(6): 587–590. [DOI:10.1109/LSP.2010.2048646]

[8] Garnett R, Huegerich T, Chui C, et al. A universal noise removal algorithm with an impulse detector[J]. IEEE Transactions on Image Processing, 2005, 14(11): 1747–1754. [DOI:10.1109/tip.2005.857261]

[9] Turkmen I. The ANN based detector to remove random-valued impulse noise in images[J]. Journal of Visual Communication and Image Representation, 2016, 34: 28–36. [DOI:10.1016/j.jvcir.2015.10.011]

[10] Song Y F, Li J, Wang X G, et al. Single image dehazing using ranking convolutional neural network[J]. IEEE Transactions on Multimedia, 2018, 20(6): 1548–1560. [DOI:10.1109/TMM.2017.2771472]

[11] Shi Y G, Hao H Y, Liu Z W. Cascaded convolutional neural network based hippocampus subfields segmentation[J]. Journal of Image and Graphics, 2018, 23(1): 74–83. [时永刚, 郝华胤, 刘志文. 串行处理卷积神经网络的海马子区分割[J]. 中国图象图形学报, 2018, 23(1): 74–83. ] [DOI:10.11834/jig.170334]

[12] Zhang K, Zuo W M, Chen Y J, et al. Beyond a Gaussian denoiser:residual learning of deep CNN for image denoising[J]. IEEE Transactions on Image Processing, 2016, 26(7): 3142–3155. [DOI:10.1109/TIP.2017.2662206]

[13] Divakar N, Babu R V. Image denoising via CNNs: an adversarial approach[C]//Proceedings of 2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops. Honolulu, HI, USA: IEEE, 2017: 1076-1083.[DOI: 10.1109/CVPRW.2017.145]

[14] Dabov K, Foi A, Katkovnik V, et al. Image denoising by sparse 3D transform-domain collaborative filtering[J]. IEEE Transactions on Image Processing, 2007, 16(8): 2080–2095. [DOI:10.1109/TIP.2007.901238]

[15] Burger H C, Schuler C J, Harmeling S. Image denoising: can plain neural networks compete with BM3D?[C]//Proceedings of 2012 IEEE Conference on Computer Vision and Pattern Recognition. Providence, RI, USA: IEEE, 2012: 2392-2399.[DOI: 10.1109/CVPR.2012.6247952]

[16] Gu S H, Zhang L, Zuo W M, et al, Weighted nuclear norm minimization with application to image denoising[C]//Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA: IEEE, 2014: 2862-2869.[DOI: 10.1109/CVPR.2014.366]

[17] Chen Y J, Pock T. Trainable nonlinear reaction diffusion:a flexible framework for fast and effective image restoration[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1256–1272. [DOI:10.13140/RG.2.1.2460.1446]

[18] Appina B, Khan S, Channappayya S S. No-reference stereoscopic image quality assessment using natural scene statistics[J]. Signal Processing:Image Communication, 2016, 43: 1–14. [DOI:10.1016/j.image.2016.02.001]

[19] Weng Y C, Tian Y, Lu D M, et al. Fine-grained bird classification based on deep region networks[J]. Journal of Image and Graphics, 2017, 22(11): 1521–1531. [翁雨辰, 田野, 路敦民, 等. 深度区域网络方法的细粒度图像分类[J]. 中国图象图形学报, 2017, 22(11): 1521–1531. ] [DOI:10.11834/jig.170262]

[20] Zhu H G, Chen X G, Dai W Q, et al. Orientation robust object detection in aerial images using deep convolutional neural network[C]//Proceedings of 2015 IEEE International Conference on Image Processing. Quebec City, QC, Canada: IEEE, 2015: 3735-3739.[DOI: 10.1109/ICIP.2015.7351502]

[21] Hu Z P, He W, Wang M, et al. Multi-level deep network fused for face recognition[J]. Pattern Recognition and Artificial Intelligence, 2017, 30(5): 448–455. [胡正平, 何薇, 王蒙, 等. 多层次深度网络融合人脸识别算法[J]. 模式识别与人工智能, 2017, 30(5): 448–455. ] [DOI:10.16451/j.cnki.issn1003-6059.201705007]

[22] Soleimany S, Hamghalam M. A novel random-valued impulse noise detector based on MLP neural network classifier[C]//Proceedings of 2017 Artificial Intelligence and Robotics. Qazvin, Iran: IEEE, 2017: 165-169.[DOI: 10.1109/RIOS.2017.7956461]

[23] Hong Y, Zhu W P. Learning visual codebooks for image classification using spectral clustering[J]. Soft Computing, 2018, 22(18): 6077–6086. [DOI:10.1007/s00500-017-2937-4]

[24] Coates A, Ng A Y. The importance of encoding versus training with sparse coding and vector quantization[C]//Proceedings of the 28th International Conference on International Conference on Machine Learning. Bellevue, Washington, USA: ACM, 2011: 921-928.

[25] Abdullah S M, Tischer P, Wijewickrema S, et al. Hierarchical mutual nearest neighbour image segmentation[C]//Proceedings of 2016 International Conference on Digital Image Computing: Techniques and Applications. Gold Coast, QLD, Australia: IEEE, 2016: 1-8.[DOI: 10.1109/DICTA.2016.7797047]

[26] Wang Z, Zhang D. Progressive switching median filter for the removal of impulse noise from highly corrupted images[J]. IEEE Transactions on Circuits and Systems Ⅱ:Analog and Digital Signal Processing, 1999, 46(1): 78–80. [DOI:10.1109/82.749102]

[27] Xiong B, Yin Z P. A universal denoising framework with a new impulse detector and nonlocal means[J]. IEEE Transactions on Image Processing, 2012, 21(4): 1663–1675. [DOI:10.1109/TIP.2011.2172804]