Print

发布时间: 2020-05-16
摘要点击次数:
全文下载次数:
DOI: 10.11834/jig.190392
2020 | Volume 25 | Number 5




    图像理解和计算机视觉    




  <<上一篇 




  下一篇>> 





统筹图像变换与缝合线生成的无参数影像拼接
expand article info 高炯笠1, 吴军1, 刘祺昌1, 徐刚2
1. 桂林电子科技大学电子工程与自动化学院, 桂林 541004;
2. 中国科学院宁波材料技术与工程研究所, 宁波 315201

摘要

目的 为解决小重叠度、大视角影像自然拼接问题,提出一种统筹图像变换和缝合线生成过程的影像拼接新方法。方法 主要包括两部分:1)将单应性映射引入到薄板样条变换(thin plate spline,TPS)并建立二次图像变换模型,在同一变换框架下进行全局单应性透视变换及基于径向基函数的局部映射调整,实现拼接影像透视特性良好保持与减少局部变形,且有效满足缝合线控制点无误差配准计算需要;2)根据控制点像素配准精度优于非控制点像素配准精度,对基准影像控制点集进行三角构网,并从中搜索初始缝合线,结合二次配准模型参数和动态规划匹配过程,获得控制点更密集且配准误差总体最小的最终缝合线,有效抑制图像融合时鬼影现象的产生,且计算实现上更简单。结果 对两组标准影像进行拼接测试,并与3种方法(双单应性变换(dual-homography warping,DHW)、平滑变化的仿射拼接(smoothly varying affine stitching,SVA)、尽可能投影(as-projective-as-possible,APAP)的移动直接线性变换拼接(image stitching with moving direct linenr transform(DLT))对比,本文方法拼接影像局部变形失真最小、匹配控制点配准精度最高:在railtracks影像训练集(trarning set,TR)、测试集(test set)上分别为0和2.27;在temple影像训练集TR、测试集TE上分别为0和1.46;不同场景多路采集视频影像拼接透视特性保持良好,视觉效果自然。结论 本文方法影像拼接时无先验知识要求、参数可线性求解,整体视觉效果流畅、重叠区域与非重叠区域过渡平滑,具有较好的应用价值。

关键词

图像拼接; 图像变换; 图像融合; 缝合线生成; 全景影像; 薄板样条变换

Stitching of parametric-free images based on coordinated image transformation and seam-line generation
expand article info Gao Jiongli1, Wu Jun1, Liu Qichang1, Xu Gang2
1. School of Electronic Engineering and Automation, Guilin University of electronic technology. Guilin 541004, China;
2. Ningbo Institute of Metenals Technology&Engineering, Chinese Acaderny of Sciences, Ningbo 315201, China
Supported by: National Natural Science Foundation of China (41761087)

Abstract

Objective Image stitching technology aims to resample a group of interrelated (overlapping) images into a single image with a large angle of view and high resolution. This technology effectively overcomes the density limitation of a sensor array on the focal plane of common image acquisition equipment. Currently, numerous applications, such as realize virtual reality, security monitoring, and remote sensing detection, use the image stitching technology to obtain visual information of macro scenes and achievements have been made in the development of image stitching technology. However, due to the complexity of scene content, illumination conditions, and the changeability of camera pose, the acquisition of natural-looking visual effects of stitching image still depends mainly on post-processing interactively. Especially for applications with low measurement requirements and emphasis on visual experience, the parameter-free image stitching technology ignoring prior knowledge (scene 3D structure, camera parameters) is more valuable. To this end, this study presents a novel approach of stitching parametric-free images by comprehensively considering the process of image registration and fusion. Method The ghost phenomenon originates from an inaccurate image transformation model. Potential parameter estimation error has the greatest impact on the visual experience of stitching images. At present, the effective way to solve the problem is to find an optimal seam-line in overlapping regions of images to be stitched and take only one image pixel on each side of the seam-line for image fusion operation. Usually, the parameters of image transformation model are estimated using a set of control points located in overlapping regions of images. Thus, the accuracy of transformation at control points is better than that at non-control points. Accordingly, this study proposes to automatically generate an optimal seam-line from matched feature points for image stitching purpose. This technology mainly involves two aspects. The first one is the twice registration framework based on modified TPS (thin plate spline) transformation. It is established to meet the needs of error-free control point registration and automatic generation of reliable seam-line. In this step, the global homograph mapping and local mapping adjustment based on radial basis function are ingeniously incorporated into the uniform spatial transformation framework. Thus, it maintains perspective geometry and reduces local distortion in stitching image as much as possible. The second one is the reliable seam-line generated based on the fact that the registration accuracy of control point pixels is better than that of non-control point pixels in the process of image transformation. In this step, the initial seam-line is primarily searched out from triangulated control points in the reference image. Then, it is refined by adding more control points through dynamic programming matching process and remapping non-control point pixels with the transformation parameters estimated in advance. With the small registration error of pixels on seam-line, troublesome ghost phenomenon in stitching images can be effectively suppressed with computationally simpler image fusion operation. Result The experiments on two sets of standard images from the Internet are performed and compared with state-of-the-art methods in extant literature. The transformation accuracy of training set and test set of matching control points is found to be the highest in this study, whereas the local distortion of mosaic images is the smallest. Moreover, the stitching test is also performed on multiple videos with two different scenes. Its visual mosaic effect is quite natural. Conclusion The proposed method has a natural transition between images' overlapping and non-overlapping areas and achieves better visual effect in stitching images. Furthermore, it requires no prior knowledge on images, and its parameters can be solved linearly. Thus, it exhibits huge potential for application.

Key words

image stitching; image transformation; image fusion; seam-line generation; panoramic image; thin plate spline(TPS)

0 引言

图像拼接是将一组相互关联(具有一定重叠区域)的图像重采样成宽视角、高分辨率的单幅图像,从而克服普通图像采集设备在焦平面上的传感器阵列密度限制,实现宏大场景视觉信息集中呈现,在虚拟现实、安防监控、遥感探测等多方面具有广泛应用价值(陈辉等,2009程争刚和张利,2016杜往泽等,2016)。图像拼接可划分为图像配准和图像融合两个阶段,现有研究方法对其技术研究各有侧重。

图像配准目的在于将待拼接图像纳入到一个统一坐标框架,关键在于配准几何变换模型选取及其参数估计。单应性映射可直接实现图像到图像2D变换,广泛用于快速图像拼接过程(Marzotto等,2004李佳等,2013程争刚和张利,2016),其优点在于场景透视特性保持且计算实现简单,不足是存在平面场景或摄像机纯旋转条件限制,对其改进包括:采用双单应性映射(dual-homography warping, DHW)方案(Gao等,2011)对仅包含地平面和远处平面的场景影像进行拼接,但该方案难以扩展任意场景且依赖于图像分割结果;Chang等人(2014)提出了形状保持的半投影变换(shape-preserving half-projective warp for image stitching, SPHP)方法,拼接时在影像重叠区域内采用单应性映射,在非重叠区域内采用相似变换,关键在于两者间平滑过渡参数的选取;Zaragoza等人(2013, 2014)提出的尽可能投影(as-projective-as-possible, APAP)拼接方法实质上以局部单应性映射取代全局单应性映射,并通过影像格网划分、格网点权重设计及一种称为(moving direct linear transform, Moving DLT)的计算方式实现了格网区域局部单应性矩阵的整体最优估计,但算法需调节多个无规律参数(与格网划分相关),复杂度高且计算量大;Lin等人(2015)基于APAP思想提出了尽可能自然(adaptive as-natural-as possible, ANAP)拼接方法,首先建立一个全局相似变换框架,通过对局部单应性映射的线性分解,缓慢过渡到全局相似变换,前提是能获得场景中某一理想平面(尽可能平行于相机焦平面)单应性映射矩阵,以从中分解出全局相似变换参数。Dornaika和Chung(2004)以“摄像机平面运动+2D视差图”方法近似场景3D结构,利用三视图建立视差一致性约束,但对影像重叠度和摄影条件要求高,存在应用限制。

图像融合目的在于消除影像拼接时重叠区域内的鬼影现象,以及摄影时因光照条件、视角变换导致的曝光差异。若忽略场景中的运动物体,鬼影现象源于不精确的图像配准模型,及其潜在的参数估计误差导致拼接影像重叠区域内的像素空间位置不一致(错位),鬼影现象对拼接图像视觉体验影响最大,目前解决该问题的有效途径是在重叠区域内找出一条最佳缝合线(秦绪佳等,2015),在该线两侧分别取一幅图像像素以避免产生叠影(Duplaquet,1998)。以缝合线上两幅图像间像素差异最小化为目标函数,通过动态规划过程(Chon等,2010),或Twin Snake模型(Kerschner,2001),或图切割技术(Kwatra等,2003方贤勇等,2007),从影像重叠区域自动搜索出给定准则下的最优缝合线,但拼接效果难以保证,存在不同程度的局部鬼影现象。曝光差异导致沿缝合线直接拼接图像出现明显缝隙(拼接缝),可通过对缝合线两侧一定范围内像素加权融合处理予以消除。Szeliski(1996)采用渐入渐出算法实现像素灰度值的平滑过渡,计算简单高效,但仅能支持1维方向;肖甫等人(2007)基于变分原理构造了一个包含图像梯度的能量函数,并在重叠区域内最小化该函数来获得全局最优融合因子,该方法较好解决了光照变化对影像拼接质量的影响,且克服了传统线性融合处理的非最优性,但存在计算效率问题;Su等人(2004)在整图范围内采用多分辨率拼接方法,降低了对配准误差的敏感度,但多次滤波会造成信号减弱, 导致合成图像变暗、模糊等。

理论上,严格恢复待拼接图像场景3D结构和摄像机参数条件下,将场景点重投影到预设影像平面可有效消除鬼影现象、获得理想拼接结果,如摄影测量正射影像制作(张祖勋和张剑清,2012),但该方式仅适用于影像重叠区域较大的情况,高效、高质量3D场景重构技术本身仍面临大的挑战。对于量测要求不高、侧重视觉体验的诸多图像拼接应用场合,可忽略先验知识(场景3D结构、摄像机参数)的无参数影像(parameter-free image)拼接方式无疑更具应用价值,鉴于此,本文提出一种针对小重叠度、大视角、无参数影像的自然拼接新方法,其创新点在于:突破“图像变换→缝合线生成”这一传统的图像缝合线拼接串行处理模式,统筹考虑图像变换与缝合线生成过程,建立基于改进薄板样条变换(thin plate spline,TPS)模型的二次变换框架,可在简单变换模型下实现拼接图像透视特性的整体良好保持,并能结合控制点集通过缝合线搜索、配准参数引导下动态规划匹配、重映射计算最小化缝合线上的像素配准误差,从而确保拼接时仅通过缝合线附近像素简单混合即可获得流畅视觉效果。

1 缝合线搜索与控制点生成

图像拼接采用缝合线方式:1)配准模型参数通常利用待拼接影像重叠区域内的同名特征点(控制点)进行估计,控制点像素处的配准精度要优于非控制点像素,选用合适的配准模型时控制点像素处的配准误差基本可忽略;2)若缝合线由控制点像素连接得到,且缝合线上的控制点足够密集,则利用该缝合线进行影像拼接时,缝合线处将不会产生鬼影现象,仅需通过简单像素混合消除光照差异,即可获得流畅的视觉效果。

基于上述认识,给定基准影像$\mathit{\boldsymbol{b}}$和待配准影像$\mathit{\boldsymbol{m}}$上的控制点对$\mathit{\boldsymbol{CP = }}\left\{ {\left({P_b^i, Q_m^i} \right), i = 1, 2, 3, \cdots, N} \right\}$, 其中,$P_b^i = \left({x, y} \right)$$Q_m^i = \left({x', y'} \right)$分别表示基准影像、待配准影像上的特征(控制)点,本文从影像控制点中生成缝合线方式如图 1所示(这里假定影像拼接沿水平方向进行),包括:

图 1 控制点Delaunay三角网下的基准影像缝合线生成示意
Fig. 1 Seam-line generation of reference image through Delaunay triangulation of control points
((a)control point Delaunay triangulation $\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$; (b)seam-line)

1) 三角构网。对基准影像控制点集进行Delaunay三角构网(芮一康和王结臣,2007),见图 1(a),记为$\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$,该网中三角形顶点对应于控制点,三角形边界给出了控制点邻接关系,后续通过三角形相邻边界搜索可获得一条由若干控制点依次连接构成的路径(折线段)作为缝合线。

2) 基准线设置。旨在给出一条贯穿图像重叠区域(垂直于图像拼接方向)的直线$X$=$a$,见图 1(b)中蓝色线段,为$\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$中缝合线搜索提供方向参考,该基准线设置遵循两方面原则:一是基准线落在$\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$中的线段尽可能长,二是基准线两侧一定范围内的控制点数应尽可能多,从而有利于沿基准线方向搜索出一条尽可能贯穿较多重叠区域且控制点数多的缝合线。令(${x_{{\rm{min}}}}$, ${x_{{\rm{max}}}}$, ${y_{{\rm{min}}}}$, ${y_{{\rm{max}}}}$)表示$\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$区域围盒,通过在区间范围(${x_{{\rm{min}}}}$, ${x_{{\rm{max}}}}$)中遍历$a$并分析给出基准线位置,即对于不同$a$值基准线,考察以该基准线为中心、固定宽度$W$的条带区域($W$=25, $a \in \left[ {{x_{\min }} + W, {x_{\max }} - W} \right]$),统计条带区域内控制点数$n$及任意两控制点间最大$y$坐标差值$d$,基准线由适宜度因子${R_{a}}$最大值对应位置给出,适宜度因子计算公式为

$ {R_a} = {w_1} \cdot n/M + {w_2} \cdot d/H $ (1)

式中,$H$为待拼接影像高度,$M$为待拼接影像全部控制点数;${w_1}$, ${w_2}$为权重系数,表征缝合线上控制点数量及其高度(重叠区域覆盖深度)对基准线选择的重要性,优先考虑缝合线高度,取${w_1}$>${w_2}$,且${w_1}$=0.6, ${w_2}$=0.4。

3) 缝合线搜索。如图 1(b)所示,首先在$\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$中搜索距基准线最近的控制点,进而以该控制点为起始点,根据$\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$中三角形顶点、边几何拓扑关系分别向上、向下生长,依次获取邻接三角形中距基准线最近的点并记录,直至遇到轮廓点截止,搜索得到基准影像上的控制点序列:$\left\{ {P_b^{C1}, \cdots, P_b^{C2}} \right\}$${P_b^{C1}}$, ${P_b^{C2}}$$\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$轮廓上的控制点,依次连接该序列中的点即构成一条与基准线方向大致吻合的缝合线${S_0}$(黄色折线段);相应地,根据控制点对应关系可获得待配准影像上的缝合线${{S'}_0}$

由于自动匹配计算获得的影像控制点位置、数量具有不确定性,缝合线上控制点分布可能过于稀疏,对初始缝合线${S_0}$实施动态规划匹配以获得更多控制点,关键在于匹配窗口的确定。传统动态规划匹配是以立体影像同名核线像素为对象,以待拼接影像初始缝合线“取代”同名核线并结合图像配准模型参数来构建匹配窗口。给定从基准影像到待配准影像配准模型$\mathit{\boldsymbol{T}}$={${T_{x}}$, ${T_{y}}$},其模型参数由控制点对估计得到且满足:$\mathit{\boldsymbol{Q}} = T\left\{ P \right\}$$\left({x', y'} \right) = \left\{ {{T_x}\left({x, y} \right), {T_y}\left({x, y} \right)} \right\}$,本文从初始缝合线中获得更多控制点的步骤如下:

1) 缝合线伸展。因$\mathit{\boldsymbol{D}}\_\mathit{\boldsymbol{Net}}$不能完全覆盖影像重叠区域,从中搜索出的缝合线首、末端点(轮廓点)将不能到达图像边界,对基准影像缝合线$S$进行简单伸展处理, 通过在控制点序列首、末位置中分别插入图像上、下边界点(该边界点与其前一相邻点$x$坐标值相同,见图 1(b))来获得新点序列$\left\{ {P_b^S, P_b^{C1}, \cdots, P_b^{C2}, P_b^T} \right\}$,其中:${P_b^S}$, ${P_b^T}$为基准图像的上、下边界点。

2) 确定匹配窗口。首先确定基准影像匹配窗口,按序逐一取缝合线${S_0}$上像素构成一维匹配窗口$\mathit{\boldsymbol{Ib}}$,该匹配窗口长度即为缝合线${S_0}$长度$H$;再根据配准模型$\mathit{\boldsymbol{T}}$,将基准影像缝合线${S_0}$上像素逐一映射到待拼接影像上并按相同顺序排列构成待匹配窗口$\mathit{\boldsymbol{Im}}$。需要指出的是,基准影像、待拼接影像的缝合线匹配窗口采用了不同构建方式,后者并不直接从${{S'}_0}$上取像素,而是对${S_0}$上像素实施几何映射间接得到,其原因有二:一是当影像存在复杂相对运动时,${S_0}$${{S'}_0}$的像素同名关系除控制点外难以保证,而配准模型$\mathit{\boldsymbol{T}}$定义下的几何映射则一定程度地消除了这种影像相对运动;二是映射方式下,${S_0}$${{S'}_0}$匹配窗口长度大小一致,从而有利于动态规划匹配计算的实施。

3) 动态规划匹配。采用郭大波等人(2009)方法,以缝合线上已有控制点像素为约束,实施分段动态规划匹配计算以获得缝合线$S$${S'}$上更多同名像素。为剔除步骤2)中因配准模型几何映射误差引入的非同名像素,借鉴统计排序滤波思想,对动态规划匹配结果中的有效匹配像素按其匹配代价从小到大排序,取前25%为最后的控制点。

对于定义在图像空间的2D配准模型,图像上靠近控制点的像素将由于更为强烈的内插作用而具有相对小的配准误差,从这一角度出发,本文利用新引入的控制点重新估计配准模型参数,并对基准影像缝合线${S_1}$重新映射以获得新的待拼接影像缝合线${{S'}_1}$,从而尽可能降低缝合线上非控制点像素处的配准误差。因缝合线处的像素配准误差很小,采用渐入渐出法(Szeliski,1996)仅对缝合线较小邻域(x方向)内像素进行简单加权平均融合即可实现拼接目的。

2 改进TPS变换与二次配准框架

本质上,图像拼接中的像素融合是在视觉可接受条件下对错位或曝光差异像素的一种模糊处理,故而高精度图像配准对于降低图像融合难度、提升融合效率极其关键。借鉴文献(Zaragoza等,2013Chang等,2014Lin等,2015)思想并兼顾缝合线生成需要,结合全局单应性映射与TPS变换来建立图像配准模型,其原理如下:

TPS变换是自然样条函数在2维空间上的推广(Bookstein,1989),广泛应用于非刚性影像配准。对于2维影像,TPS采用两个独立函数$T\left({x, y} \right) = \left({{f_x}\left({x, y} \right), {f_y}\left({x, y} \right)} \right)$来建立其映射关系,数学形式为

$ {f_x}\left({{x_j}, {y_j}} \right) = {a_0} + {a_1}{x_j} + {a_2}{y_j} + \sum\limits_{i = 1}^n {{A_i}} g\left({{r_i}} \right) $ (2)

$ {f_y}\left({{x_j}, {y_j}} \right) = {b_0} + {b_1}{x_j} + {b_2}{y_j} + \sum\limits_{i = 1}^n {{B_i}} g\left({{r_i}} \right) $ (3)

$ g\left({{r_i}} \right) = \left\{ {\begin{array}{*{20}{l}} {r_i^2\lg r_i^2}&{{r_i} \ne 0}\\ 0&{{r_i} = 0} \end{array}} \right. $

$ r_i^2 = {\left({{x_i} - {x_j}} \right)^2} + {\left({{y_i} - {y_j}} \right)^2} $

$ \begin{array}{l} \sum\limits_{i = 1}^n {{A_i}} = \sum\limits_{i = 1}^n {{A_i}} {x_i} = \sum\limits_{i = 1}^n {{A_i}} {y_i} = \\ \sum\limits_{i = 1}^n {{B_i}} = \sum\limits_{i = 1}^n {{B_i}} {x_i} = \sum\limits_{i = 1}^n {{B_i}} {y_i} = 0 \end{array} $

式中,${a_0}$, ${a_1}$, ${a_2}$, ${b_0}$, ${b_1}$, ${b_2}$, ${A_{i}}$, ${B_{i}}$$\left({i = 1, \cdots, n} \right)$为2$n$+6个TPS参数,可利用$n$(>3)对控制点进行线性求解;$r$为控制点${P_{i}}$(${x_{i}}$, ${y_{i}}$)和${P_{j}}$(${x_{j}}$, ${y_{j}}$)间的欧氏距离。若从全局与局部的关系去看待TPS对映射的分解,TPS实质上是以仿射变换来表达影像全局运动,而以基于径向基函数的插值来实现影像局部非线性运动的描述,借助于TPS这种全局与局部运动的分解思路,可引入单应性映射来增强TPS全局运动的透视变换性能,即

$ {f_x}\left({{x_j}, {y_j}} \right) = \frac{{{h_1}{x_j} + {h_2}{y_j} + {h_3}}}{{{h_7}{x_j} + {h_8}{y_j} + 1}} + \sum\limits_{i = 1}^n {{A_i}} g\left({{r_i}} \right) $ (4)

$ {f_y}\left({{x_j}, {y_j}} \right) = \frac{{{h_4}{x_j} + {h_5}{y_j} + {h_6}}}{{{h_7}{x_j} + {h_8}{y_j} + 1}} + \sum\limits_{i = 1}^n {{B_i}} g\left({{r_i}} \right) $ (5)

式中,${h_j}\left({j = 1, \cdots, 8} \right)$为给定单应性矩阵$\mathit{\boldsymbol{H}}$的8个元素,${A_{i}}$, ${B_{i}}$, $n$, $r$定义同上,但TPS参数减少为2$n$个,仍利用控制点线性求解。

TPS通过最小化点集间的弯曲能求解映射参数(Bookstein,1989),这一潜在的影像拼接问题是,在保证控制点一一对应的同时,传统TPS对远离控制点的非重叠区域会形成较大变形、失真,对此利用单应性映射在影像非重叠区域(控制点三角网外)增加虚拟控制点来进行平衡,通过二次TPS变换完成计算。具体实施步骤如下:

1) 单应性矩阵估计。采用随机抽样一致(random sample consensus, RANSANC)算法从控制点集$\mathit{\boldsymbol{CP}}$中精确估计单应性映射参数${h_{j}}$

2) 首次TPS变换。根据式(3)求解2$N$个薄板样条参数${A_{i}}$, ${B_i}\left({j = 1, \cdots, N} \right)$,这里$N$为控制点数;

3) 缝合线搜索与控制点生成。从控制点中搜索得到初始缝合线并结合改进TPS变换,实施动态规划匹配获得数量更多的控制点(集),这里$M$为加密控制点数

$ \mathit{\boldsymbol{MP}} = \left\{ {\left({{P_{bj}}, {Q_{mj}}} \right), j =, 1, 2, 3, \cdots, M} \right\} $

4) 虚拟控制点设置。按固定网格大小在待拼接影像上简单取非重叠区域像素作为虚拟控制点,其在基准影像上的位置由单应性映射计算得到,两者构成虚拟控制点集,这里$S$为虚拟控制点数

$ \mathit{\boldsymbol{VP}} = \left\{ {\left({{P_{bk}}, {Q_{mk}}} \right), k =, 1, 2, 3, \cdots, S} \right\} $

5) 二次TPS变换。综合利用控制点集$\mathit{\boldsymbol{CP}}$$\mathit{\boldsymbol{MP}}$$\mathit{\boldsymbol{VP}}$,根据式(3)重新求解$2\left({M + N + S} \right)$个薄板样条参数${A_i}, {B_i}\left({i = 1, \cdots, M + N + S} \right)$, 该参数和单应性映射参数${h_{j}}$构成最后的图像变换模型参数;利用该变换参数对基准影像缝合线${S_1}$逐像素映射即可获得待拼接影像上的缝合线${{S'}_1}$

分析可知,源于TPS变换在光滑插值、参数线性求解等方面的独特优势,本文图像变换模型具有以下特点:1)全局变换与局部映射调整相结合且在一个统一计算框架下进行。以单应性映射作为全局变换可实现更好的透视特性保持,统一于TPS变换框架的局部映射调整则是对单应性映射局部“不完善”的一种合理“补偿”,从而有助于减少拼接影像的局部变形、失真;2)隐性地将拼接影像分为非重叠区域和重叠区域,两者采用不同图像映射模型,虚拟控制点的运用确保了全局单应性映射在非重叠区域起支配作用,匹配控制点所在的重叠区域则是TPS变换起主要作用。两种图像映射模型间的过渡借助于整体TPS变换更自然、平缓,不需要额外的参数选取;3)无需考虑控制点处的配准误差。TPS变换严格遵循点集约束特点,确保了获得的缝合线能有效用于图像拼接且计算实现上更简单、高效。图 2给出了本文统筹图像变换配准与缝合线生成的影像拼接技术路线。

图 2 统筹图像变换与缝合线生成的图像拼接技术路线
Fig. 2 Image stitching based on coordinated image transformation and seam-line generation

3 实验与分析

在PC机采用C++编程语言实现上述算法, 数据采用文献(Zaragoza等,2013, 2014)中的temple与railtracks测试影像,前者分辨率720×480像素,后者分辨率2 000×1 500像素,两者控制点集(绿色点)均利用尺度不变特征变换(scale-invariant feature transform, SIFT)算子(Lowe,2004)自动匹配得到, 并采用RANSANC算法剔除野点,见图 3

图 3 待拼接测试影像及其匹配控制点集示意
Fig. 3 Images to be stitched and their matching control point set ((a) railtracks reference image; (b) image to be stitched to (a); (c) temple reference image; (d) image to be stitched (c))

测试影像拼接分4个阶段进行:

1) 利用匹配控制点首次估计图像变换参数,利用其中的单应性映射给出虚拟控制点集(按固定间隔在待拼接影像非重叠区域取格网点像素作为虚拟控制点,见图 3(b)(d)中蓝色格网点,并通过单应性映射得到基准影像上对应点);

2) 从基准影像控制点集中搜索得到${S_0}$,经匹配计算并依次连接相邻控制点得到${S_1}$

3) 综合利用虚拟控制点、匹配控制点及缝合线控制点重新估计变换模型参数,利用该参数对${S_1}$逐像素映射获得${{S'}_1}$,并根据待配准影像边界信息对${{S'}_1}$${S_1}$进行必要裁减,以确保两者重叠、对应且落在各自影像范围内;

4) 利用步骤3)中图像变换参数、缝合线进行影像重映射、加权融合,获得最后的拼接影像。

以railtracks影像为例,图 4给出了缝合线(黄色折线段)生成过程。图 4(a)${S_0}$沿基准线(蓝色直线段)搜索控制点三角网顶点得到,折线段上绿色点为匹配控制点;图 4(c)${S_1}$是对${S_0}$进行伸展、匹配及裁剪处理后的结果,折线段上红色点为动态规划匹配生成的控制点;图 4(b)(d)${{S'}_0}$, ${{S'}_1}$分别对应于${S_0}$${S_1}$在待拼接影像上的缝合线,但两者产生方式不同,前者由${S_0}$上匹配控制点对应点连接得到,后者则是利用第2次变换参数对${S_1}$逐像素映射得到,${S_1}$${{S'}_1}$构成最后的缝合线。图 5给出了添加虚拟控制点对本文方法拼接结果的影响,由于非重叠区域内的虚拟控制点隐含利用了单应性映射,故拼接影像上相应区域(右下方红色标记)内竖直栅栏、汽车形状可获得良好透视特性保持,从而有效抑制传统TPS在非重叠区域的“弯曲”趋势,见图 5(b)

图 4 拼接影像缝合线生成示意
Fig. 4 Seam-line generation on images to be stitched ((a) initial seam-line ${S_0}$ on reference image; (b) corresponding seam-line ${S_0}$ on image to be stitched; (c) refined seam-line ${S_1}$ on reference image; (d) corresponding seam-line ${S_1}$ on image to be stitched)
图 5 本文方法图像拼接添加虚拟控制点对比示意
Fig. 5 Comparison of image mosaic after adding virtual control points
((a) adding virtual control points; (b) no virtual control points added)

表 1给出了不同方法拼接精度统计,DHW、SVA、APAP方法拼接精度由文献(Zaragoza等,2013)直接给出,本文方法配准精度计算按照该文献计算方式:将匹配控制点分为训练集TR和测试集TE(约占总点数10%,随机抽取)两部分,TR用于配准参数估计,并由重投影误差计算获得TR、TE各自拼接精度-均方根误差(not mean square enor, RMSE),即

$ {R_{{\rm{MSE}}}}(T) = \sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{{\left\| {T\left({P_b^i} \right) - Q_m^i} \right\|}^2}} } $ (6)

表 1 不同方法图像拼接精度RMSE对比
Table 1 Image registration accuracy RMSE statistics of different methods 

下载CSV
/像素
数据DHWSVAAPAP本文
railtracksTR14.097.484.510
TE14.127.34.662.27
templeTR6.6412.31.360
TE6.8412.212.041.46
注:加粗字体为最优结果。

式中,${P_b^i}$, ${Q_m^i}$为重叠图像的匹配点对。

表 1可以看出,本文方法TR和TE拼接精度均最高,尤其是TR的拼接误差为0,为生成理想缝合线奠定基础,沿缝合线仅需简单融合处理即可获得严密拼接结果。

图 6-图 7给出了本文方法、(DHW(Gao等,2011),SVA(Lin等,2011), APAP(Zaragoza等,2013)针对两组测试图像的拼接结果。3种颜色方框为选中的局部放大区域,红色椭圆为拼接有误之处。为便于分析、比较拼接图像中因不精确配准而产生的鬼影现象或几何扭曲、变形,上述对比方法图像融合时均只进行简单灰度平均处理。由图 6图 7可以发现,3种对比方法处理结果中APAP算法最优,既能有效去除重叠区域内的鬼影现象,也能较好保持非重叠区域透视变换特性,但重叠区域和非重叠区域过渡地带(靠近控制点)仍存在小的局部变形失真,原因是APAP虽然通过影像格网划分、格网点权重设计实现局部单应性矩阵整体最优估计,但并非闭合解且投影误差累积、分布无法预测。本文图像变换过程借助于TPS框架的优良计算特性(光滑插值、封闭解),在利用径向基函数插值“补偿”全局单应性映射之局部“不完善”、有效减少拼接影像局部变形失真的同时,可实现重叠区域和非重叠区域间的自然、平缓过渡,其效果媲美甚至优于APAP算法。

图 6 railtracks影像配准局部变形失真对比示意
Fig. 6 Local distortion of image registration by different methods on the railtracks image pair
图 7 temple影像配准局部变形失真对比示意
Fig. 7 Local distortion of image registration by different methods on the temple image pair

本文方法可扩展到更多影像拼接过程,任意两相邻重叠影像拼接过程同上,但需根据选取的基准影像进行参数传递计算,这里不再赘述。图 8图 9给出了本文方法对多路不同场景、视角、小重叠度视频影像的拼接结果,均获得令人满意的视觉效果,实现大场景监控信息的集中呈现。

图 8 三路监控视频影像拼接示意
Fig. 8 Stitching three surveillance video stream
图 9 四路监控视频影像拼接示意
Fig. 9 Stitching four surveillance video stream

本文研究结果表明:

1) 统筹考虑图像变换和缝合线生成前提下,从控制点集中搜索拼接缝合线并结合配准参数、动态规划匹配获取更多控制点的方法可行,因缝合线上像素配准误差小可有效抑制图像融合时鬼影现象的产生且计算实现上更简单。

2) 引入单应性映射的改进TPS变换及其二次配准模型,有助于拼接影像透视特性保持并减少局部变形、失真;同时该变换模型严格遵循控制点对应约束、控制点无配准误差的特点也为缝合线生成提供了保障。

3) 本文方法影像拼接时无先验知识要求、参数可线性求解,拼接影像整体视觉效果流畅、重叠区域与非重叠区域过渡平滑、自然,具有较好的应用价值。

4 结论

图像拼接技术已经取得诸多成果,但由于场景内容、摄像相机姿态及光照条件复杂、多变,拼接图像流畅视觉效果的获得目前仍主要依赖于后期处理。从控制点像素处的拼接精度优于非控制点像素这一事实出发,建立基于改进TPS的二次变换框架,结合动态规划匹配计算从控制点中自动生成用于图像拼接的缝合线,该缝合线上控制点配准精度明显优于DHW、SVA和APAP方法;因缝合线上像素配准误差很小,本文方法图像拼接时仅通过简单像素混合即可消除鬼影现象、光照差异,测试拼接影像及不同场景多路采集视频影像拼接局部变形失真小、透视特性保持良好,视觉效果自然。本文方法虚拟控制点格网选取方式并未考虑场景内容,故在复杂场景深度或剧烈视角变化条件下仍会产生投影误差,且格网疏密程度对投影误差的影响也有待深入分析。

下一阶段将通过更多场景影像测试完善本文方法,并以之为基础尝试构建多路视频融合下的全景监控系统及开展相关应用研究。

参考文献

  • Bookstein F L. 1989. Principal warps:thin-plate splines and the decomposition of deformations. IEEE Transactions on Pattern Analysis and Machine Intelligence, 11(6): 567-585 [DOI:10.1109/34.24792]
  • Chang C H, Sato Y and Chuang Y Y. 2014. Shape-preserving half-projective warps for image stitching//Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus: IEEE: 3254-3261[DOI:10.1109/CVPR.2014.422]
  • Chen H, Long A Q, Peng Y H. 2009. Building panoramas from photographs taken with an uncalibrated hand-held camera. Chinese Journal of Computers, 32(2): 328-335 (陈辉, 龙爱群, 彭玉华. 2009. 由未标定手持相机拍摄的图片构造全景图. 计算机学报, 32(2): 328-335) [DOI:10.3724/SP.J.1016.2009.00328]
  • Cheng Z G, Zhang L. 2016. An aerial image mosaic method based on UAV position and attitude information. Acta Geodaetica et Cartographica Sinica, 45(6): 698-705 (程争刚, 张利. 2016. 一种基于无人机位姿信息的航拍图像拼接方法. 测绘学报, 45(6): 698-705) [DOI:10.11947/j.AGCS.2016.20150567]
  • Chon J, Kim H, Lin C S. 2010. Seam-line determination for image mosaicking:a technique minimizing the maximum local mismatch and the global cost. ISPRS Journal of Photogrammetry and Remote Sensing, 65(1): 86-92 [DOI:10.1016/j.isprsjprs.2009.09.001]
  • Dornaika F, Chung R. 2004. Mosaicking images with parallax. Signal Processing:Image Communication, 19(8): 771-786 [DOI:10.1016/j.image.2004.06.008]
  • Du W Z, Song Z H, Yan W B, Wu L G. 2016. Fast image stitching under single camera rotate monitoring. Journal of Image and Graphics, 21(2): 245-254 (杜往泽, 宋执环, 闫文博, 吴乐刚. 2016. 单摄像头旋转监控下的快速图像拼接. 中国图象图形学报, 21(2): 245-254) [DOI:10.11834/jig.20160214]
  • Duplaquet M L. 1998. Building large image mosaics with invisible seam lines//Proceedings of the SPIE 338, Visual Information Processing Ⅶ. Orlando: SPIE: 369-377[DOI:10.1117/12.316427]
  • Fang X Y, Zhang M M, Pan Z G, Luo B, Wang P. 2007. Research of image mosaic based on graph cut. Journal of Image and Graphics, 12(12): 2050-2056 (方贤勇, 张明敏, 潘志庚, 罗斌, 王鹏. 2007. 基于图切割的图像拼接技术研究. 中国图象图形学报, 12(12): 2050-2056) [DOI:10.11834/jig.20071203]
  • Gao J H, Kim S J and Brown M S. 2011. Constructing image panoramas using dual-homography warping//Proceedings of CVPR 2011. Colorado Springs: IEEE: 49-56[DOI:10.1109/CVPR.2011.5995433]
  • Guo D B, Lu Z Y, Jiao W D, Cui L L. 2009. Dynamic programming in segments for occlusion detection/stereo matching. Acta Electronica Sinica, 37(7): 1516-1521 (郭大波, 卢朝阳, 焦卫东, 崔玲玲. 2009. 遮挡检测/立体匹配中的分段动态规划法. 电子学报, 37(7): 1516-1521) [DOI:10.3321/j.issn:0372-2112.2009.07.022]
  • Kerschner M. 2001. Seamline detection in colour orthoimage mosaicking by use of twin snakes. ISPRS Journal of Photogrammetry and Remote Sensing, 56(1): 53-64 [DOI:10.1016/S0924-2716(01)00033-8]
  • Kwatra V, Schödl A, Essa I, Turk G, Bobick A. 2003. Graphcut textures:image and video synthesis using graph cuts. ACM Transactions on Graphics (TOG), 22(3): 277-286 [DOI:10.1145/882262.882264]
  • Li J, Sheng Y H, Zhang K, Duan P, Wu H. 2013. Panoramic stitching method based on uncalibrated ordinary camera. Journal of System Simulation, 25(9): 2070-2074 (李佳, 盛业华, 张卡, 段平, 吴辉. 2013. 基于未标定普通相机的全景图像拼接方法. 系统仿真学报, 25(9): 2070-2074) [DOI:10.16182/j.cnki.joss.2013.09.032]
  • Lin C C, Pankanti S U, Ramamurthy K N and Aravkin A Y. 2015. Adaptive as-natural-as-possible image stitching//Proceedings of 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston: IEEE: 1155-1163[DOI:10.1109/CVPR.2015.7298719]
  • Lin W Y, Liu S Y, Matsushita Y, Ng T T and Cheong L F. 2011. Smoothly varying affine stitching//Proceedings of CVPR 2011. Providence: IEEE: 345-352[DOI:10.1109/CVPR.2011.5995314]
  • Lowe D G. 2004. Distinctive image features from scale-invariant Keypoints. International Journal of Computer Vision, 60(2): 91-110 [DOI:10.1023/B:VISI.0000029664.99615.94]
  • Marzotto R, Fusiello A and Murino V. 2004. High resolution video mosaicing with global alignment//Proceedings of 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington: IEEE: #8161456[DOI:10.1109/CVPR.2004.1315099]
  • Qin X J, Wang Q, Wang H L, Zheng H B, Chen S N. 2015. Image fusion method based on best seam-line for serial remote sensing images mosaic. Computer Science, 42(10): 306-310 (秦绪佳, 王琪, 王慧玲, 郑红波, 陈胜男. 2015. 基于最佳缝合线的序列遥感图像拼接融合方法. 计算机科学, 42(10): 306-310) [DOI:10.11896/j.issn.1002-137X.2015.10.062]
  • Rui Y K, Wang J C. 2007. A new study of compound algorithm based on sweepline and divide-and-conquer algorithms for constructing delaunay triangulation. Acta Geodaetica et Cartographica Sinica, 36(3): 358-362 (芮一康, 王结臣. 2007. Delaunay三角形构网的分治扫描线算法. 测绘学报, 36(3): 358-362) [DOI:10.3321/j.issn:1001-1595.2007.03.020]
  • Su M S, Hwang W L, Cheng K Y. 2004. Analysis on multiresolution mosaic images. IEEE Transactions on Image Processing, 13(7): 952-959 [DOI:10.1109/TIP.2004.828416]
  • Szeliski R. 1996. Video mosaics for virtual environments. IEEE Computer Graphics and Applications, 16(2): 22-30 [DOI:10.1109/38.486677]
  • Xiao F, Wu H Z, Xiao L, Tang Y. 2007. An ambient light independent image mosaic algorithm. Journal of Image and Graphics, 12(9): 1671-1675 (肖甫, 吴慧中, 肖亮, 汤杨. 2007. 一种光照鲁棒的图像拼接融合算法. 中国图象图形学报, 12(9): 1671-1675) [DOI:10.11834/jig.20070929]
  • Zaragoza J, Chin T J, Brown M S and Suter D. 2013. As-projective-as-possible image stitching with moving DLT//Proceedings of 2013 IEEE Conference on Computer Vision and Pattern Recognition. Portland: IEEE: 2339-2346[DOI:10.1109/CVPR.2013.303]
  • Zaragoza J, Chin T J, Tran Q H, Brown M S, Suter D. 2014. As-projective-as-possible image stitching with moving DLT. IEEE Transactions on Pattern Analysis and Machine Intelligence, 36(7): 1285-1298 [DOI:10.1109/TPAMI.2013.247]
  • Zhang Z X, Zhang J Q. 2012. Digital Photogrammetry. 2nd ed. Wuhan: Wuhan University Press (张祖勋, 张剑清. 2012. 数字摄影测量学(第二版). 武汉: 武汉大学出版社)