Print

发布时间: 2017-12-16
摘要点击次数:
全文下载次数:
DOI: 10.11834/jig.170346
2017 | Volume 22 | Number 12




    遥感图像处理    




  <<上一篇 




  下一篇>> 





多特征融合的高分辨率遥感影像建筑物分级提取
expand article info 林雨准, 张保明, 王丹菂, 陈小卫, 徐俊峰
信息工程大学, 郑州 450001

摘要

目的 针对高分辨率遥感影像普遍存在的同谱异物和同物异谱问题,提出一种综合利用光谱、形状、空间上下文和纹理特征的建筑物分级提取方法。方法 该方法基于单幅高分辨率遥感影像,首先利用多尺度多方向梯度算子构造的建筑物指数和形状特征提取部分分割完整的矩形建筑物目标;然后由多方向线性结构元素和形态学膨胀运算确定投票矩阵,从而获取光照方向,并利用光照方向和阴影特征对已提取建筑物进行筛选,剔除非建筑物对象,完成建筑物初提取;最后借助初提取建筑物对象的纹理特征向量建立概率模型,取得像素级建筑物提取结果,将该结果与影像分割相结合实现建筑物提取。结果 选取两幅高分辨率遥感影像进行实验,在建筑物初提取实验中,将本文方法与邻域总变分法和Sobel算子进行对比,实验结果表明,本文方法适用性强,为后提取提供的建筑物样本可靠性更高。在建筑物提取实验中,采用查准率、查全率和$ {{\rm{F}}_1} $分数3个指标进行定量分析,与形态学建筑物指数结合形态学阴影指数算法、邻域总变分结合混合高斯模型和贝叶斯判决算法相比,各项精度指标均得到显著提升,其中查准率提高了2.90个百分点,查全率提高了12.49个百分点,$ {{\rm{F}}_1} $分数则提升了8.84。结论 本文提出的建筑物分级提取方法具备一定抗干扰能力,且提取准确性高,适用性强。

关键词

高分辨率遥感影像; 建筑物提取; 多特征融合; 建筑物指数; 高斯模型

Hierarchical building extraction from high resolution remote sensing imagery based on multi-feature fusion
expand article info Lin Yuzhun, Zhang Baoming, Wang Dandi, Chen Xiaowei, Xu Junfeng
Information Engineering University, Zhengzhou 450001, China
Supported by: National Science Foundation of China (41601507); Open Research Foundation of State Key Laboratory of Geo-information Engineering (SKLGIE2015-M-3-3)

Abstract

Objective Buildings are important infrastructures in geodatabase. Extracting buildings effectively and accurately is significant in urban planning, population distribution, land analysis, and environmental surveys. However, buildings cannot be extracted using a unified model because of the common phenomenon of "same object with different spectra and same spectrum with different objects" and given that the spectrum, shape, and texture of a building are not exactly the same. Considering that most buildings are in rectangular shapes and that the spectral information of a building is generally more uniform than that of other objects, some buildings can be extracted with shape and gradient information. On this basis, the open space and waters are removed using the shadow as a context feature. The texture of the imagery within buildings usually presents a good consistency within a certain area. Thus, other buildings can be extracted by the probability model, which is established by textural features from the initial extraction of buildings as the training samples. On the basis of the analysis above, a hierarchical building extraction method based on spectral, spatial, contextual, and textural features is proposed. Method The proposed method includes three main parts, namely, image preprocessing, initial extraction of buildings, and final extraction of buildings, and is applied to single high-resolution remote sensing imagery. High-frequency noise is removed and edge information is effectively retained by imagery preprocessing based on bilateral filter. Vegetation and shadow are extracted using super green and morphological shadow indexes. The building index is constructed using multi-scale and multi-orientation gradient operators, and some rectangle buildings are extracted using the building index and shape features. The extracted buildings are expanded with the multi-direction linear structural elements. The voting matrix is calculated by the number of pixels included in the intersection of the expansion result and the shadow to determine the light direction. The extracted buildings are eliminated on the basis of the shadow feature and the light direction. Thus, the initial extraction of the building is completed. Finally, pixel-level building extraction result is obtained by the probability model, which is established by utilizing the textural feature vector of the initial extraction result. The final extraction result is achieved by judging the number of pixels and the proportion of the objects generated by imagery segmentation. Result Two high-resolution remote sensing imageries from Okinawa and Chicago are used in verifying the validity of the proposed method. Results before and after using the shadow feature are compared, and the proposed initial extraction method is compared with neighborhood total variation method and Sobel operator. Experimental results show that the proposed method can recognize buildings in different directions and provide highly reliable building samples for post-processing. Shadow as a context feature can effectively avoid the confusion of open space, road, and other objects. In the building extraction experiment, the proposed method is compared with morphological building index + morphological shadow index algorithm and neighborhood total variation + mixed Gaussian model + Bayesian decision algorithm. The experiments are carried out using precision rate, recall rate, and $ {{\rm{F}}_1} $-score, and the final accuracies of our experiments are significantly improved. Precision rate increases by 2.90 percentage points, recall rate increases by 12.49 percentage points, and $ {{\rm{F}}_1} $-score increases by 8.84. Conclusion This study presents a method that combines spectral, shape, contextual, and textural features for building extraction. The proposed method adopts the hierarchical extraction strategy. First, building samples are extracted on the basis of the characteristics of spectral information and their shape (i.e., rectangular). Then, the probability model is established using the textural feature of samples to complete the building extraction. The proposed method is based on the characteristics of high-resolution remote sensing imagery. The method exhibits significant advantages in the area where buildings are dense and imagery is complex and can extract the building targets with various shapes and spectral characteristics. The proposed method can also extract the building objects with strong anti-jamming capability, high accuracy, and great applicability. However, effectively determining the optimal scale in post-extraction and treating the obstructed buildings remain to be further studied. Given that textural feature is mainly dependent on post-extraction, the recognition of buildings with different textural features from samples is poor and should therefore be enhanced in future works.

Key words

high resolution remote sensing imagery; building extraction; multi-feature fusion; building index; Gaussian model

0 引言

建筑物作为基础地理数据库中最重要的人工目标类型之一,相关信息的准确获取在城市规划、人口布局、土地分析和环境调查等方面具有重要意义。此外,高分辨率遥感影像使得快速获取大区域/范围内的建筑物信息成为了可能,避免了人工提取时存在的费时费力、自动化程度低和采集质量不一致等问题。

目前,学者们提出了很多高分辨率遥感影像建筑物提取的方法,主要可以分为以下4类:1)基于几何边界的方法[1-2],该方法强调目标几何形态的重要性,通过恢复建筑物的几何形态,并对其进行准确描述,完成建筑物提取,但该方法提取复杂形状建筑物精度较低;2)基于区域分割的方法[3-4],引入面向对象思想,通过影像分割,使同质像素组成大小不同的影像对象,而后利用光谱和形状等特征实现建筑物提取,但提取结果过于依赖影像分割;3)基于先验模型知识的方法[5-6],通过曲线演化技术和建筑物典型的先验形状获取提取结果,但普适的先验模型仍有待建立,且该方法计算复杂度较大;4)基于语义模型分类的方法,通过影像中有意义的基元对象及其相互关系实现对影像语义信息的理解,该方法主要包括基于概率潜在语义分析模型[7]和基于随机场[8-9]的方法,但目标之间,目标与背景之间的空间关系建模仍有不足[10]

在高分辨率遥感影像中,建筑物的光谱、形状和纹理等特征并不完全一致,无法建立统一模型对其进行提取,但考虑到大部分建筑物趋于矩形,且一般情况下建筑物的光谱信息较为均匀[11]。因此,借助形状和梯度信息可以提取部分建筑物。此外,在一定范围内,建筑物像素的纹理特征通常具有较好的一致性,故将初提取建筑物作为训练样本,利用样本的纹理特征建立概率模型,即可进一步提取未识别建筑物。针对上述分析,本文试图对建筑物在高分辨率遥感影像上表现出的光谱、形状、上下文和纹理特征加以充分的利用,提出一种多特征融合的建筑物分级提取方法。

1 建筑物初提取

单个建筑物的屋顶光谱信息在高分辨率遥感影像中通常表现较为均匀[11],且建筑物形状大多比较规则。因此,一方面利用梯度和形状特征可以提取部分建筑物;另一方面,将阴影作为辅助信息,对已提取结果进行筛选,避免空地、道路等地物的干扰,保证此阶段提取的建筑物尽可能准确。

1.1 影像预处理

在高分辨率遥感影像中,植被光谱特征同样比较均匀,且部分植被与建筑物形状相近。因此,将植被从影像中去除,可以有效降低建筑物提取难度。考虑到植被与其他地物的光谱差异较大,本文借助超绿指数[12]将其进行分离。此外,考虑到阴影亮度信息相对较暗,本文采取文献[3]中的形态学阴影指数对阴影特征(上下文特征)进行自动提取。

在建筑物初提取中涉及影像梯度信息,但噪声往往对梯度影响较大。因此,本文首先采用双边滤波[13]对灰度化后的原始影像进行处理,在去除噪声的同时,保留地物的边缘信息。其中双边滤波的数学模型表达式为

$ \begin{array}{l} \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{I_b}\left( {x, y} \right) = \\ \frac{{\sum\limits_{n = - N}^N {\sum\limits_{m = - N}^N {W\left( {x, y, n, m} \right){I_g}\left( {x - n, y - m} \right)} } }}{{\sum\limits_{n = - N}^N {\sum\limits_{m = - N}^N {W\left( {x, y, n, m} \right)} } }} \end{array} $ (1)

式中, $N$ 与滤波窗口大小相关,具体窗口大小可表示为(2 $N$ +1)×(2 $N$ +1),窗口中心像素坐标为( $x$ , $y$ ), $m$ , $n$ 表示距离中心像素的横纵距离。$ {I_g}\left( {x, y} \right) $$ {I_b}\left( {x, y} \right) $分别为处理前后的像素灰度值, $W$ ( $x$ , $y$ , $n$ , $m$ )是邻域像素( $x$ - $n$ , $y$ - $m$ )的权值,该权值与所在像素与中心像素的距离和灰度差相关,即

$ \begin{array}{l} \;\;\;\;\;\;W\left( {x, y, n, m} \right) = \exp \left( { - \frac{{{n^2} + {m^2}}}{{2\sigma _s^2}}} \right) \times \\ \exp \left( { - \frac{{{{\left( {{I_g}\left( {x, y} \right) - {I_g}\left( {x - n, y - m} \right)} \right)}^2}}}{{2\sigma _r^2}}} \right) \end{array} $ (2)

式中,$ {\sigma _s} $$ {\sigma _r} $为设定参数(本文所设参数值分别为2、0.1),其作用在于控制邻域像素的权值大小,以及距离差和灰度差对权值的影响程度。对灰度化后的原始影像进行双边滤波,结果如图 1(b)所示。由图 1可知,经过双边滤波处理后,影像中的噪声等高频信息明显减少,同一建筑物内的光谱信息变得更加均匀,且边缘信息也得到了较好保留。

图 1 双边滤波处理结果
Fig. 1 Result of bilateral filter
((a) original imagery; (b) bilateral filtered)

1.2 建筑物指数计算

建筑物光谱特性一般较为均匀,且在预处理后,这一特性得到了进一步加强,但建筑物边缘两侧光谱特征差异明显,边缘方向也存在多种情况。因此利用多尺度多方向梯度算子构造建筑物指数,图 2为选取的4个方向梯度算子, $s$ 为尺度大小,本文对所研究影像 $s$ 值设置为3~11,相邻尺度差异为2。

图 2 不同方向梯度算子
((a) 0°; (b) 45°; (c) 90°; (d) 135°)
Fig. 2 Gradient operator of different directions

将同一方向的相邻尺度梯度算子进行差分,并求取所有方向均值,即可获得相应的建筑物指数,其计算公式为

$ BI = \frac{{\sum\limits_{i = 1}^{{D_N}} {\sum\limits_{j = 2}^{{S_N}} {\left( {Grad\left( {{d_i}, {s_j}} \right) - Grad\left( {{d_i}, {s_j} - \Delta s} \right)} \right)} } }}{{{D_N} \times \left( {{S_N} - 1} \right)}} $ (3)

式中, $BI$ 为建筑物指数(building index),$ {{D_N}} $$ {{S_N}} $分别代表方向和尺度数量,$ {Grad\left( {{d_i}, {s_j}} \right)} $表示$ {{d_i}} $方向和$ {{s_j}} $尺度下的梯度大小,$ {\Delta s} $为相邻尺度差异。由于在特定方向下的梯度求解是求取两边灰度差的绝对值之和,且边缘作为灰度信息的突变线,其两侧灰度一般具有较好的稳定性,因此边缘梯度大小一般与尺度呈正比。将相邻尺度梯度信息进行差分处理,建筑物边缘像素计算结果将明显大于内部像素,故 $BI$ 越小则该像素属于建筑物内部的可能性越大。因此,利用 $BI$ 可以有效提取建筑物内部信息。

1.3 建筑物样本识别

在求得建筑物指数后,对其进行Otsu阈值分割,并采取八邻域增长方式生成对象。经过上述处理后,影像中主要包含建筑物对象以及部分同样具有均匀光谱特性的植被、阴影、道路和空地等。对于植被和阴影,可利用预处理过程提取的相应结果进行剔除;针对道路对象,本文引入矩形度和长宽比两个形状特征参数进行排除。此外,设定最小面积,避免噪声干扰。考虑到所提建筑物样本应具有较高的正确率,且道路对象一般呈细长型或曲型,故将矩形度下限和长宽比上限分别设定为0.8和5: 1。

图 3(a)(b)分别为美国某地区影像和利用上述方法得到的部分建筑物提取结果。由图 3(b)可知,提取结果中仍存在部分误提取,如箭头所指对象。为进一步提高初提取结果正确率,为后提取提供更可靠样本,本文将预处理过程中提取的阴影作为上下文信息对已提取建筑物进行筛选。

图 3 基于建筑物指数和形状特征的提取结果
Fig. 3 Extraction result based on building index and shape feature((a) imagery in America; (b) part of the building extraction result)

图 4所示为8个方向的线性结构元素,其中实心点为结构元素原点。利用各方向结构元素对已提建筑物对象依次进行膨胀运算,并求取膨胀结果与阴影交集包含的像素数目,具体计算公式为

$ \begin{array}{l} nu{m_{ij}} = shadow \cap \mathop {dilate}\limits_{{d_i}} \left( {B\left( {{x_j}} \right)} \right)\\ \;\;\;\;\;\;\;\;\;\;\;\;\;i = 1, 2, \cdots, 8 \end{array} $ (4)

图 4 多方向线性结构元素
Fig. 4 Multi-direction linear structural element

式中, $shadow$ 为阴影提取结果,$ {B\left( {{x_j}} \right)} $ $dilate$ 分别表示第 $j$ 个建筑物对象和形态学膨胀运算,$ {{d_i}} $为线性结构元素方向,$ nu{m_{ij}} $是相应建筑物对象与阴影交集包含的像素数目。

为求得影像的光照方向,并与多方向线性结构元素对应,设立投票矩阵。投票矩阵各元素的计算规则为:求取每一个建筑物对象$ nu{m_{ij}} $最大时对应的$ {d_i} $,将$ {d_i} $所在的投票矩阵元素数目加1。本文将投票矩阵最大数值对应方向作为光照方向,如图 5所示,该投票矩阵是图 3(b)中每个提取对象按照上述操作所得结果,其最大数值44对应的45°即为所求光照方向。

图 5 投票矩阵
Fig. 5 Vote matrix

在获得光照方向后,利用该方向的线性结构元素对已提取建筑物对象依次进行膨胀运算,求取膨胀结果与阴影交集包含的像素数目。若数目大于指定阈值,则保留该对象,否则,将该对象删除。该方法可以有效剔除空地,水域等周围无阴影地物,进一步提高初提取正确率。图 6图 3(a)美国某地区影像的建筑物初提取结果。

图 6 建筑物初提取结果
Fig. 6 Result of the initial building extraction

2 建筑物后提取

在建筑物初提取完成后,剩余建筑物对象往往内部结构复杂,或与周围地物信息接近,无法采用上述方法进行提取。因此,选择将初提取结果作为训练样本,建立概率模型,从而完整地提取影像的建筑物目标。

2.1 纹理特征提取

纹理特征作为基本视觉特征之一,可以有效区分细节特征丰富的地物目标[14]。Gabor变化[15]包含一组不同尺度和方向的滤波器,可以提取目标在各个方向和尺度的纹理特征。考虑到光谱信息变换方向的不确定性和滤波器在各分辨率影像的通用性,利用3个尺度、8个方向(22.5°~180°)的滤波器对遥感影像进行Gabor纹理特征提取,并求取各个对象在不同尺度的纹理特征均值和方差,从而构成纹理特征向量$ \mathit{\boldsymbol{T}} = \left( {{\mu _1}, \sigma _1^2, {\mu _2}, \sigma _2^2, {\mu _3}, \sigma _3^2} \right) $

2.2 概率模型建立

在获得纹理特征向量后,将建筑物初提取结果作为训练样本,对其进行相应建模。考虑到高斯模型在大多数情况下可以有效反应数据的分布情况,所以选择该函数模型对训练样本进行建模,函数表达式为

$ \begin{array}{l} \;\;\;\;\;\;\;\;\;p\left( {\mathit{\boldsymbol{x}}/{\rm{Building}}} \right) = \\ \frac{1}{{{{\left( {2{\rm{ \mathit{ π} }}} \right)}^{d/2}}{{\left| \mathit{\boldsymbol{ \boldsymbol{\varSigma} }} \right|}^{1/2}}}}{\exp ^{ - \frac{{{{\left( {x - \mathit{\boldsymbol{\mu }}} \right)}^{\rm{T}}}{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}^{ - 1}}\left( {x - \mathit{\boldsymbol{\mu }}} \right)}}{2}}} \end{array} $ (5)

式中,$ p\left( {\mathit{\boldsymbol{x}}/{\rm{Building}}} \right) $表示特征向量$ \mathit{\boldsymbol{x}} $在所建模型的概率大小, $d$ $ \mathit{\boldsymbol{ \boldsymbol{\varSigma} }} $$ \mathit{\boldsymbol{\mu }} $分别表示特征向量维数(本文为6),协方差矩阵和均值向量。

为验证所建模型的有效性,对图 3(a)影像的建筑物初提取结果按式(5)进行建模,计算已提取植被、阴影和建筑物对象在模型中的概率,同时人工采集了10个道路样本,进行相同计算,其结果如表 1所示(为方便计算,本文将$ {{{\left( {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{\mu }}} \right)}^{\rm{T}}}{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}^{ - 1}}\left( {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{\mu }}} \right)} $等效为模型概率)。

表 1 各地物对象概率统计表
Table 1 Probability statistics of the ground objects

下载CSV
等效模型概率区间
[0, 20] (20, 45] (45, +∞)
建筑物 47(97.92%) 1(2.08%) 0(0.00%)
植被 5 6 88
阴影 0 0 149
道路 1 7 2
非建筑物 6(2.32%) 13(5.04%) 239(92.64%)
注:括号内数值代表建筑物对象和非建筑物对象位于相应区间的数量比例。

表 1中首行的各个区间与地物的模型概率相对应,表中具体数字为相应地物的模型概率位于各区间的对象数目。从中可以看出在[0, 20]区间内主要为建筑物对象,且大部分建筑物对象位于该区间;非建筑物对象主要位于(45, +∞)区间,且该区间内不存在建筑物对象。因此建筑物对象和非建筑物对象的计算结果具有明显的区间性,该模型可以对两类地物进行有效区分。

2.3 建筑物识别

获得概率模型后,即可利用所求模型完成建筑物提取,提取过程存在像素级和对象级两种方式。由于建筑物周围地物种类并不统一,且一般情况下与建筑物本身光谱信息差异较大,造成建筑物边缘像素和内部像素的纹理特征差异明显,而建筑物初提取结果主要为建筑物内部像素。因此,若采用像素级方式进行提取会导致建筑物边缘部分漏检,以及部分其他地物误检;若直接在影像分割生成对象的基础上进行提取,建筑物边缘和内部像素将作为整体形成纹理特征向量,而两者的纹理特征差异明显,同样会导致部分建筑物漏检。综上所述,本文采取像素级和对象级相结合方法进行建筑物后提取,首先进行像素级建筑物提取,此时会将大部分建筑物像素成功标记,然后在影像分割生成对象的基础上,通过判断对象内属于建筑物的像素数量和比例实现建筑物的最终提取。这样可以充分利用像素级提取结果,并有效解决漏提取和误提取问题。具体实施过程如下:

1) 开辟一定大小窗口,计算窗口的纹理特征向量并赋予中心像素;

2) 将窗口在整幅影像内进行移动,从而获得所有像素的纹理特征向量,并将其依次带入概率模型,计算相应概率;

3) 对所求概率进行阈值分割(本文将模型概率位于[0, 25]的像素作为建筑物),获取像素级建筑物提取结果;

4) 采用均值漂移法[16]对影像进行分割,若生成的对象内属于建筑物的像素数量大于一定阈值,且超过对象面积一半,则认为该对象为建筑物;

5) 利用形状特征(面积和长宽比)剔除部分噪声和道路干扰,结合建筑物初提取结果完成建筑物提取。

3 建筑物提取方法

通过上述分析,本文提出一种多特征融合的高分辨率遥感影像建筑物分级提取方法。该方法主要分成两部分,第1部分是建筑物初提取,在影像预处理的基础上,利用多尺度多方向梯度算子构造建筑物指数,并结合形状特征提取部分建筑物,然后利用阴影特征对已提取结果进行筛选,完成建筑物初提取;第2部分为建筑物后提取,将第1部分提取结果作为训练样本,通过纹理特征向量和高斯模型获取未识别像素的模型概率,而后引入面向对象思想,在影像分割生成对象的基础上完成建筑物提取。具体流程如图 7所示。

图 7 建筑物提取流程
Fig. 7 The flow chart of building extraction

4 实验与分析

为验证所提方法对建筑物提取的有效性和可靠性,选取Google Earth提供的冲绳和芝加哥地区的高分辨率遥感影像进行实验。如图 8所示,冲绳地区影像大小为1 546 ×1 560像素,包含99个建筑物;芝加哥地区影像大小为1 030 ×774像素,包含126个建筑物。两幅影像均为RGB影像,空间分辨率约为0.8 m。

图 8 实验影像
Fig. 8 Experimental imageries((a) Okinawa; (b) Chicago)

实验主要分成以下3个部分:1)建筑物初提取实验;2)建筑物提取实验;3)实验参数分析。此外,为定量评价算法性能,通过计算3个精度指标[17]对提取结果进行评价,查准率( $P$ )、查全率( $R$ )和$ {F_1} $分数(取值越大,算法越好),其计算方法为

$ P = \frac{{TP}}{{TP + FP}} $ (6)

$ R = \frac{{TP}}{{TP + FN}} $ (7)

$ {F_1} = \frac{{2 \times P \times R}}{{P + R}} $ (8)

式中, $TP$ 表示人工采集和算法检测都为建筑物的数量, $FP$ 表示算法检测为建筑物但未被人工采集的数量, $FN$ 表示人工采集为建筑物但未被算法检测的数量。

4.1 建筑物初提取实验

为验证阴影作为空间上下文特征对初提取结果的影响,将阴影特征加入前后的初提取结果进行比较。此外,为证明本文构造的建筑物指数在初提取过程中的有效性,将本文方法分别与邻域总变分法[11]及Sobel算子进行对比, 此处Sobel算子的实验结果同样经过基于阴影特征的筛选处理,具体实验结果见图 9表 2

图 9 建筑物初提取结果对比
Fig. 9 Comparison on initial building extraction result
((a) neighborhood total variation; (b) Sobel operator; (c) the proposed method without using shadow feature; (d)ours

表 2 建筑物初提取结果数量统计
Table 2 Number of initial building extraction results

下载CSV
/个
邻域总变分 Sobel算子 未加入阴影特征 本文方法
冲绳地区 正确提取 55 58 67 64
误提取 6 2 1 1
芝加哥地区 正确提取 83 107 106 99
误提取 10 3 12 2
注:括号内数值代表建筑物对象和非建筑物对象位于相应区间的数量比例。

各种方法的建筑物初提取结果如图 9所示,提取标准为人工采集建筑物。表 2中正确提取和误提取分别为相应建筑物数量。从中可以看出阴影作为上下文特征,有效剔除了建筑物误提取部分。相比于邻域总变分法,本文方法在两区域均有更好效果。相对于Sobel算子,本文方法在冲绳区域的提取效果更好,但在芝加哥区域Sobel算子的正确提取个数多于本文方法,这主要因为Sobel算子对水平和垂直边缘敏感,而该区域建筑物边缘大多呈水平或垂直方向。总体来说本文方法综合了各方向梯度信息,适用性优于Sobel算子。

此外,当使用单一梯度算子进行建筑物初提取时,会将建筑物边缘部分一同提取,而本文方法会在建筑物边缘形成缓冲区,只提取建筑物内部像素(建筑物边缘将在面向对象的后提取中实现),如图 10所示。纹理特征作为光谱特征在一定空间范围内的整体特性,在边缘和非边缘区域差异显著,若训练样本不包含边缘,则样本的纹理特征向量将更加集中,建立的概率模型更具代表性,故本文方法提取的建筑物样本更为有效和可靠。

图 10 初提取边缘对比
Fig. 10 Comparison on initial extraction edge
((a) simulated imagery; (b) Sobel operator; (c) ours)

为进一步比较Sobel算子和本文方法的性能,利用两种方法在芝加哥区域的初提取结果进行验证。由图 11(a)可知本文方法所提建筑物对象的纹理特征方差明显小于Sobel算子,证明了本文方法提取对象的纹理特征向量稳定性。图 11(b)(c)是人工采集建筑物和非建筑物像素代入概率模型的计算结果(计算方式与表 1一致),由图 11可知两种方法在建筑物像素方面识别差异不大,均含有超过60%像素处于[0, 20]区间,但对于Sobel算子分别有超过20%的非建筑物像素位于[0, 20]和(20, 45]两个区间内,从而降低建筑物对象和非建筑物对象的可分离性,减弱了模型的可靠性。

图 11 初提取对象特征对比
Fig. 11 Comparison on features of the initial extraction objects((a) variance of texture; (b) probability distribution of the building pixels; (c) probability distribution of the non-building pixels)

4.2 建筑物提取实验

利用本文方法对两实验影像进行建筑物提取,并与文献[3]和文献[11]方法进行对比,结果如图 12所示,定量评价如表 3所示。图 12 (a)(b)(d)分别表示文献[3]、文献[11]和本文方法在两个区域的建筑物提取结果,图 12(c)为本文方法在两个区域的像素级建筑物提取结果,其中蓝色像素的标记结果为建筑物。结合图 12表 3可以看出冲绳地区影像的建筑物特征相对突出,干扰信息较少,3种方法的提取精度差异不大,只有文献[11]方法在基于面积的精度统计中查全率较低。但芝加哥地区影像信息较为复杂,建筑物周围干扰信息较多,本文的建筑物提取方法优势明显,尤其是查全率方面,在基于目标和基于面积两个层面都明显高于文献[3]和文献[11]方法,证明了本文方法的有效性、准确性和适用性。此外,从像素级建筑物提取结果来看,大部分建筑物像素识别结果与实际结果相同,且只有少部分非建筑物像素的识别结果为建筑物,证明了所建概率模型的可靠性,为后续基于对象的建筑物提取提供了可靠信息。

图 12 建筑物提取结果对比
Fig. 12 Comparison on building extraction result
((a) reference [3]; (b) reference [11]; (c) ours-pixel; (d) ours-object)

表 3 建筑物提取精度比较
Table 3 Accuracy assessment for building extraction

下载CSV
研究区 方法 基于目标 基于面积
查准率/% 查全率/% $ {{\rm{F}}_1} $ 分数 查准率/% 查全率/% $ {{\rm{F}}_1} $分数
冲绳 文献[3] 92.86 91.92 92.39 96.47 84.52 90.10
文献[11] 92.78 90.91 91.84 92.82 70.43 80.09
本文 96.84 92.93 94.84 96.23 85.05 90.30
芝加哥 文献[3] 92.50 58.73 71.84 93.25 63.80 75.76
文献[11] 87.61 78.57 82.84 93.37 69.40 79.62
本文 95.00 90.48 92.68 94.37 85.62 89.78
注:粗体数字代表相应精度指标最高。

4.3 实验参数分析

本部分实验主要研究可调参数对建筑物提取精度的影响,其中涉及的可调参数主要包括:1)像素级建筑物提取时开辟的窗口大小;2)建筑物后提取中影像分割的尺度大小。

在像素级建筑物提取时,开辟一定大小窗口,将该窗口的纹理特征均值和方差赋予窗口中心像素,构成纹理特征向量。依次利用3×3像素到15×15像素大小窗口进行实验,结果如图 13所示。从中可以看出两区域影像的查准率在基于目标和基于面积的精度评定中都随着窗口的增大呈现先减小后增大趋势,但都能达到94%以上。查全率在窗口过大或过小时,基于目标和基于面积的精度均下降明显,从而导致$ {{\rm{F}}_1} $分数明显减小。综上所述,当窗口大小位于5×5像素至11×11像素时,本文方法的查准率、查全率和$ {{\rm{F}}_1} $分数均可取得较高精度。

图 13 窗口大小与提取精度关系
Fig. 13 The relationship between window size and extraction accuracy((a) precision-object; (b) recall-object; (c) $ {{\rm{F}}_1} $-object; (d) precision-area; (e) recall-area; (f) $ {{\rm{F}}_1} $-area)

图 14为不同分割尺度(色域距离阈值与空域距离阈值之和,其中两者各占尺度大小的一半)下建筑物提取的精度分布示意图。可以看出两幅影像的查准率无论是基于目标还是基于面积都可取得较高精度,基本可以保持在93%以上。冲绳地区建筑物周围干扰信息较少,房屋形状较为规则,其查全率和$ {{\rm{F}}_1} $分数也具备较高稳定性。然而,芝加哥地区影像干扰信息较多,尺度过小或过大导致查全率和$ {{\rm{F}}_1} $分数在基于面积的精度统计中下降明显。总体来说,当建筑物周围干扰信息较少,且建筑物本身光谱信息比较均匀时,本文方法对分割尺度具有较强的适应性;当影像中尤其是建筑物周围干扰信息较多时,分割尺度不宜过大或过小。从实验结果来看,分割尺度位于14~18时,本文方法的各精度指标都较为理想。

图 14 分割尺度大小与提取精度关系
Fig. 14 The relationship between segmentation scale and extraction accuracy((a) precision-object; (b) recall-object; (c) $ {{\rm{F}}_1} $-object; (d) precision-area; (e) recall-area; (f) $ {{\rm{F}}_1} $-area)

5 结论

针对高分辨率遥感影像提出了一种综合运用光谱、形状、上下文和纹理特征的建筑物提取方法。该方法采取分级提取策略,首先提取形状趋于矩形,周围干扰信息较少且内部光谱信息均匀的建筑物,然后将初提取结果作为训练样本,建立概率模型,从而获取像素级建筑物提取结果,将该结果与影像分割相结合即可实现建筑物后提取。从提取结果来看,本文方法在不同类型的高分辨率遥感影像上均取得了较好的提取结果,显示了较强的鲁棒性和普适性,实现了较密集和较暗建筑物的高精度提取,并且可以同时提取不同形状和光谱特征的建筑物目标。

然而本文方法也存在不足之处。由于在后提取中主要依靠纹理特征,因此对于纹理特征不同于样本的建筑物识别效果不佳,在接下来的工作中考虑引入深度学习的方法。此外,对于存在遮挡的建筑物处理以及在后提取中如何有效确定最佳分割尺度仍有待进一步研究。

参考文献

  • [1] Wang J, Yang X C, Qin X B, et al. An efficient approach for automatic rectangular building extraction from very high resolution optical satellite imagery[J]. IEEE Geoscience and Remote Sensing Letters, 2015, 12(3): 487–491. [DOI:10.1109/LGRS.2014.2347332]
  • [2] Liu Z J, Zhang J X, Meng Y B, et al. Method of building extraction from high resolution image based on classification and shape generalization[J]. Science of Surveying and Mapping, 2007, 32(3): 38–39, 46, 193. [刘正军, 张继贤, 孟亚宾, 等. 基于分类与形态综合的高分辨率影像建筑物提取方法研究[J]. 测绘科学, 2007, 32(3): 38–39, 46, 193. ] [DOI:10.3771/j.issn.1009-2307.03.014]
  • [3] Huang X, Zhang L P. Morphological building/shadow index for building extraction from high-resolution imagery over urban areas[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2012, 5(1): 161–172. [DOI:10.1109/JSTARS.2011.2168195]
  • [4] Wu W, Luo J C, Shen Z F, et al. Building extraction from high resolution remote sensing imagery based on spatial-spectral method[J]. Geomatics and Information Science of Wuhan University, 2012, 37(7): 800–805. [吴炜, 骆剑承, 沈占锋, 等. 光谱和形状特征相结合的高分辨率遥感图像的建筑物提取方法[J]. 武汉大学学报:信息科学版, 2012, 37(7): 800–805. ] [DOI:10.13203/j.whugis2012.07.022]
  • [5] Tian H, Yang J, Wang Y M, et al. Towards automatic building extraction:variational level set model using prior shape knowledge[J]. Acta Automatica Sinica, 2010, 36(11): 1502–1511. [田昊, 杨剑, 汪彦明, 等. 基于先验形状约束水平集模型的建筑物提取方法[J]. 自动化学报, 2010, 36(11): 1502–1511. ] [DOI:10.3724/SP.J.1004.2010.01502]
  • [6] Liasis G, Stavrou S. Building extraction in satellite images using active contours and colour features[J]. International Journal of Remote Sensing, 2016, 37(5): 1127–1153. [DOI:10.1080/01431161.2016.1148283]
  • [7] Akçay H G, Aksoy S. Automatic detection of geospatial objects using multiple hierarchical segmentations[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(7): 2097–2111. [DOI:10.1109/TGRS.2008.916644]
  • [8] Li X D, Ling F, Du Y. Building extraction at the sub-pixel scale from remotely sensed images based on anisotropic Markov random field[J]. Journal of Image and Graphics, 2012, 17(8): 1042–1048. [李晓冬, 凌峰, 杜耘. 基于各向异性Markov随机场的遥感影像亚像元尺度建筑物提取[J]. 中国图象图形学报, 2012, 17(8): 1042–1048. ] [DOI:10.11834/jig.20120820]
  • [9] Li E, Femiani J, Xu S B, et al. Robust rooftop extraction from visible band images using higher order CRF[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(8): 4483–4495. [DOI:10.1109/TGRS.2015.2400462]
  • [10] Wang J, Qin Q M, Ye X, et al. A survey of building extraction methods from optical high Resolution remote sensing imagery[J]. Remote Sensing Technology and Application, 2016, 31(4): 653–662, 701. [王俊, 秦其明, 叶昕, 等. 高分辨率光学遥感图像建筑物提取研究进展[J]. 遥感技术与应用, 2016, 31(4): 653–662, 701. ] [DOI:10.11873/j.issn.1004-0323.2016.4.0653]
  • [11] Tao C, Tan Y H, Cai H J, et al. Object-oriented method of hierarchical urban building extraction from high-resolution remote-sensing imagery[J]. Acta geodaetica et Cartographica Sinica, 2010, 39(1): 39–45. [陶超, 谭毅华, 蔡华杰, 等. 面向对象的高分辨率遥感影像城区建筑物分级提取方法[J]. 测绘学报, 2010, 39(1): 39–45. ]
  • [12] Jing R, Deng L, Zhao W J, et al. Object-oriented aquatic vegetation extracting approach based on visible vegetation indices[J]. Chinese Journal of Applied Ecology, 2016, 27(5): 1427–1436. [井然, 邓磊, 赵文吉, 等. 基于可见光植被指数的面向对象湿地水生植被提取方法[J]. 应用生态学报, 2016, 27(5): 1427–1436. ] [DOI:10.13287/j.1001-9332.201605.002]
  • [13] Elad M. On the origin of the bilateral filter and ways to improve it[J]. IEEE Transactions on Image Processing, 2002, 11(10): 1141–1151. [DOI:10.1109/TIP.2002.801126]
  • [14] Tao C, Tan Y H, Peng B F, et al. A probabilistic latent semantic analysis based classification for high resolution remotely sensed imagery[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(2): 156–162. [陶超, 谭毅华, 彭碧发, 等. 一种基于概率潜在语义模型的高分辨率遥感影像分类方法[J]. 测绘学报, 2011, 40(2): 156–162. ]
  • [15] Chen X G, Feng J F. Fast Gabor filtering[J]. Acta Automatica Sinica, 2007, 33(5): 456–461. [陈小光, 封举富. Gabor滤波器的快速实现[J]. 自动化学报, 2007, 33(5): 456–461. ] [DOI:10.16383/j.aas.2007.05.002]
  • [16] Comaniciu D, Meer P. Mean shift:a robust approach toward feature space analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(5): 603–619. [DOI:10.1109/34.1000236]
  • [17] Ok A O. Automated detection of buildings from single VHR multispectral images using shadow information and graph cuts[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 86: 21–40. [DOI:10.1016/j.isprsjprs.2013.09.004]