论文引用格式:Liu Y J, Zhang R, Liu Q S and Hang R L. 2023. Location information-fused estimation method in relevance to tropical cyclone intensity. Journal of Image and Graphics, 28(08):2522-2535(引用格式:刘英杰, 张芮, 刘青山, 杭仁龙. 2023. 融合定位信息的热带气旋强度估计. 中国图象图形学报, 28(08):2522-2535)[0 引 言热带气旋(tropical cyclone,TC)起源于热带或副热带海洋,是一种破坏力巨大的灾害性天气系统,可造成大风、强降水等恶劣天气现象,以及洪水、滑坡和泥石流等次生灾害(张文龙和崔晓鹏,2013)。因此,精确预报热带气旋的发生发展是一个重要的研究领域。其中,热带气旋的强度估计作为后续预报工作的基础,它的准确度也起到至关重要的作用。热带气旋大多发生于远海上,传统的观测设备如雷达、浮标等,难以实现实时的观测和预报。而气象卫星的出现提供了丰富而实时的热带气旋观测数据(Shimada等,2016;Hu和Weng,2020),提高了强度估计的精度,已经成为监测和预报热带气旋的重要工具。目前大多数热带气旋强度估计方法都基于卫星云图。其中,Dvorak(Dvorak,1975;Olander等,2004)技术是业务上最常用的方法。该方法首先需要确定热带气旋的中心,再结合过去24小时的热带气旋强度变化来确定当前时刻的强度,这导致该方法严重依赖专家的主观经验。为了实现强度估计的自动化,很多学者提出了改进的Dvorak方法,例如,ODT(objective Dvorak technique)(Velden等,1998)和AODT(advance objective Dvorak technique)(Olander等,2004)。但这些方法不能很好地估计较弱的热带气旋。针对这一问题,Olander和Velden(2007)提出的ADT(advanced Dvorak technique)提升了对弱热带气旋的估计。除了Dvorak类方法,还有其他的一些方法,例如偏角方差技术(deviation angle variance technique,DAVT)(Ritchie等,2014),该方法通过热带气旋的轴对称性来估计强度。上述方法都是基于人工提取特征来估计热带气旋强度。随着人工智能技术的发展,越来越多的研究者尝试将人工智能与气象结合起来。卷积神经网络(convolutional neural network,CNN)作为人工智能的一种代表性方法,能够直接从输入图像中学习高级语义特征,显著提高了目标检测、分类和语义分割等图像处理任务的性能,因此广泛应用于热带气旋强度估计任务。Pradhan等人(2018)提出了Deep-CNN,根据Saffir-Simpson飓风风力等级将热带气旋分为8类。其平均分类准确率达到70%以上,且均方根误差(root mean square error,RMSE)达到了5.8 m/s。Chen等人(2019)基于CNN模型,使用卫星红外亮温和降雨率数据,估算了全球海域的热带气旋强度,该方法的RMSE为5.34 m/s(1 kt ≈ 0.51 m/s)。同样,Wimmers等人(2019)提出了DeepMicroNet,探索从基于微波成像仪的卫星图像中估计热带气旋强度的可行性。该模型的均方根误差与最佳路径集相比为 7.34 m/s,但与更高标准的飞机侦察辅助最佳路径集相比则降低至5.45 m/s。Zhang等人(2020)提出了双分支网络TCIENet(tropical cyclone intensity estimation net)进行强度估计,其RMSE可以达到5.13 m/s。另外,Zhang等人(2021)提出的TCICENet(tropical cyclone intensity classification and estimation net)网络与Deep-CNN有着异曲同工之妙,同样分为两步进行操作,首先将热带气旋分为3类,再对每类进行强度估计,最后求其平均,其RMSE为4.93 m/s。CNN模型在热带气旋的强度估计上已经有了不错的表现,然而还有一些问题等待解决。以上CNN方法的输入图像往往以热带气旋的定位为中心,这就需要最佳路径集提供热带气旋的位置,并不利于实时估计强度。另外,许多研究表明,热带气旋强度估计精度与选取的图像半径有关(Wimmers等,2019;Wang等,2022)。因此,本文提出融合定位信息的强度估计模型(intensity estimation fusing location,IEFL)来提升强度估计的精度,模型采用双分支结构,分别进行强度估计和定位(王燕燕 等,2002;张长江 等,2018),通过自动学习热带气旋位置的方式,将定位特征与强度特征融合后估计强度,保证了估计的实时性,利用了定位信息提升准确性。同时,双分支结构可以同时优化两种任务,达到相互促进的效果。本文使用CNN作为两个任务的特征提取器来估计卫星图像中的热带气旋强度和中心定位。将2015—2020年的葵花-8卫星图像作为模型的输入,其中,2015—2018年的数据用于训练模型,2019和2020年的数据用于测试模型的性能。葵花-8卫星云图如图1所示。本文的主要贡献为:1)提出一种融合定位信息的强度估计模型IEFL,用来估计热带气旋强度,性能优于无定位信息时的效果;2)使用IEFL模型在葵花-8卫星不同通道图像上进行热带气旋强度估计,分析每个通道的性能,探讨了不同通道对强度估计的影响,并通过大量实验得到了性能最好的通道组合,强度估计准确率优于现有方法。10.11834/jig.220348.F001图1葵花-8卫星云图Fig.1Himawari-8 satellite cloud1 数据本文选择的实验数据是葵花-8的L1级数据,数据格式为NetCDF。考虑到主要是研究西北太平洋热带气旋的强度估计,只截取了空间分辨率为5 km的0°N—50°N,100°E—180°E范围(图像大小为1 000 × 1 400像素),时间分辨率为1 h,时间范围为2015年8月1日—2020年12月13日。选取了葵花-8中5个典型的波段进行实验,分别是3.9 μm,6.2 μm,10.4 μm,12.3 μm,13.3 μm。中国气象局(tcdata.typhoon.org.cn)的最佳路径集(Ying等,2014;Lu等,2021)提供了6小时分辨率热带气旋强度与经纬度,为了与葵花-8数据时间分辨率匹配,对最佳路径集进行线性插值到1小时,并根据提供的经纬度对原始图像进行裁剪,只截取包含热带气旋云系(耿晓庆 等,2014)的图像以去除背景信息干扰,截取大小为512 × 512像素,覆盖范围超过5 000 km,能够完整地包含热带气旋云系。为了提高模型定位任务鲁棒性,对热带气旋中心加入随机噪声,即中心进行20~40像素(110~220 km)的一个随机位置偏移,偏移后热带气旋图像如图2所示,模型的任务即估计出当前图像的强度值和x轴和y轴偏移的像素分别是多少。当热带气旋中心不在106°E—164°E和5°N—45°N范围时,将该样本删除。10.11834/jig.220348.F002图2数据增强Fig.2Data enhancement ((a) original image; (b) vertical flip; (c) horizontal flip; (d) horizontal and vertical flip simultaneously)为了增加训练样本数量,提高模型鲁棒性以及泛化能力,对训练数据分别沿顺时针方向进行水平翻转、垂直翻转以及同时水平垂直翻转,同时对位置中心的标签信息也进行相应翻转改变,如图2所示,训练集样本从10 507幅增加到42 028幅,测试集图像不进行处理,共5 229幅。为了使模型更快收敛,输入图像和标签都进行了归一化,使其保持在0~1之间。根据中国气象局“关于实施热带气旋等级国家标准(GB/T 19201—2006)”,热带气旋按近中心最大持续风速划分为6个等级:热带低压(tropical depression, TD;10.8~17.1 m/s)、热带风暴(tropical storm, TS;17.2~24.4 m/s)、强热带风暴(severe tropical storm, STS;24.5~32.6 m/s)、台风(typhoon, TY;32.7~41.4 m/s)、强台风(severe typhoon, STY;41.5~50.9 m/s)和超强台风(super typhoon,SuperTY; 51.0 m/s)。各类别中的训练集和测试集的样本数及所占百分比如表1所示。从表1可以看到,训练集共42 028幅图像,其中7 767幅是TD,占18.46%,11 276幅是TS,占26.83%,6 432幅是STS,占15.30%,6 268幅是TY,占14.91%,5 996幅是STY,占14.27%,4 296幅是SuperTY,占10.22%。10.11834/jig.220348.T001表1各类别中的训练集和测试集的样本数及所占百分比Table 1Number and percentage of samples in the training and test sets under each category热带气旋种类训练集测试集样本/幅占比/%样本/幅占比/%总计42 0281005 229100TD7 76018.461 33925.61TS11 27626.831 38326.45STS6 43215.3097018.55TY6 26814.9168213.04STY5 99614.274859.28SuperTY4 29610.223707.082 方法2.1 模型结构图3给出了IEFL模型结构图,IEFL是一种融合定位信息的双分支模型,根据输入卫星云图自动得到当前的强度值和中心点的坐标。在进行这两个任务时,IEFL通过优化定位任务提高强度估计的精度,模型的结构主要包括两个部分,特征提取模块(图3绿色部分)和特征融合模块(图3蓝色部分)。模型首先通过特征提取模块分别提取云图强度估计和定位所需要的特征,然后通过特征融合模块将两部分特征融合后输出估计的强度。10.11834/jig.220348.F003图3IEFL模型Fig.3IEFL model2.1.1 特征提取模块特征提取部分主要参考了RepVGG(re-param VGG)(Ding等,2021)。RepVGG是在VGG(Visual Geometry Group)(Simonyan和Zisserman,2015)的基础上进行了改进,VGG的模型性能差,且网络模型很大,不利于部署。而RepVGG在训练时加入了1 × 1残差分支和恒等变换分支(identity)来丰富所提取的云系特征,模型在训练过程中自动将强度估计所需的云系特征保留下来。在模型测试阶段,通过Op(operator)融合策略将网络转换成仅有3 × 3卷积的单路模型进行加速。如图3绿色部分所示,特征提取模块由特征编码器、强度特征提取和定位特征提取模块3部分组成。从同一输入图像中,模型提取的特征既可以用来估计强度,也能实现中心定位,如轮廓、纹理等。因此,模型IEFL模型首先构建了一个共享特征编码器提取图像的浅层特征,得到尺寸为32 × 32像素,通道为256的特征图,该模块由4层RepVGG卷积块构成。为了分别适应两个具体的任务,IEFL使用双分支的结构对强度和定位特征进行细化,分别经过强度特征提取模块和定位特征提取模块,模块分别由1层RepVGG卷积块构成,细化后的云系特征更加符合相应的任务。2.1.2 特征融合模块通过特征提取模块分别得到尺寸为16 × 16像素、通道为1 280的强度特征图与定位特征图,定位特征图直接通过全连接层得到热带气旋定位坐标。许多研究表明,定位的准确性能够影响强度估计的结果,所以IEFL对强度特征图进行了特征融合,如图3蓝色部分所示,特征融合模块将细化后的强度特征图和定位特征图拼接,进行信息融合,得到尺寸为16 × 16像素、通道为2 560的融合特征图。融合后的特征图包含丰富的云系信息,并且对热带气旋中心保持一定关注,因此更适应强度估计。最后融合特征图通过全连接层得到强度估计结果。2.2 损失函数基于强度估计的回归任务,模型选用了3种RMSE损失函数进行优化,具体为L(c)RMSE=1N∑i=1Ncir-cip2 (1)L(x)RMSE=1N∑i=1Nxir-xip2 (2)L(y)RMSE=1N∑i=1Nyir-yip2 (3)式中,L(c)RMSE、L(x)RMSE和L(y)RMSE分别为强度估计损失、定位x坐标损失和定位y坐标损失。N表示样本个数,cir表示热带气旋强度真实值,cip表示热带气旋强度预测值。xir表示样本位置定位x坐标真实值,xip表示位置定位x坐标预测值。yir表示位置定位y坐标真实值,yip表示位置定位y坐标预测值。RMSE能够衡量热带气旋强度的真实值与预测值的差值,在进行模型优化的过程中,RMSE随之减小,真实值与预测值也尽可能接近,朝着误差为零的方向优化,L(c)RMSE越小,说明强度估计性能越好。另外,定位回归的损失函数同样为RMSE,如式(2)和式(3)所示。LxRMSE和L(y)RMSE越小,定位性能越好。模型总损失即以上3个损失函数权重之和,具体为Ltotal=λLcRMSE+LxRMSE+L(y)RMSE (4)式中,λ为权重系数。2.3 实验设计与评价指标2.3.1 实验设计实验的模型都是在NVIDIA TITAN Xp上的Pytorch框架上(Python3.6版本)进行训练。实验分为训练阶段和测试阶段,batch size设为5,使用梯度下降法(stochastic gradient descent,SGD),学习率为0.001,训练100个epoch。本文设计了大量实验来探讨不同波段对强度估计的影响。整个实验分为两组,第1组使用IEFL对不同通道进行无定位信息与融合定位信息的强度估计(无定位信息时去掉定位分支),以分析融合定位信息对强度估计的影响。第2组选择不同通道组合在融合定位信息模型上进行强度估计,以分析不同通道组合对强度估计的影响。2.3.2 评价指标模型评价指标主要包括两个方面,1)强度估计的误差衡量;2)位置定位中心点的误差衡量。对于强度估计的误差衡量指标,主要使用RMSE和MAE(mean absolute error);定位的误差是计算像素点的误差,通过Haversine公式(Robusto,1957)将经纬误差转换为km误差。3 实验结果和分析3.1 融合定位信息对强度估计的影响不同通道的图像可以提供热带气旋在多个侧面下的特征。本文主要对3.9 μm,6.2 μm,10.4 μm,12.3 μm,13.3 μm通道进行无定位信息模型与融合定位信息模型的强度估计对比,共设计了10次实验,其中M1—M5表示无定位信息的模型,M6—M10表示融合定位信息时的模型。实验结果如表2所示。可以看出,对于无定位信息的模型M1—M5,10.4 μm,12.3 μm,13.3 μm通道的效果较好,这3个通道都位于长波红外波段,通常用于云的图像、云顶情况观测,可以得到热带气旋云顶的亮温分布,以反映对流强弱。其中,10.4 μm通道图像性能最好,RMSE为5.20 m/s。3.9 μm通道图像的性能最差,RMSE为6.13 m/s。与无定位信息的模型模型结果类似,融合定位信息后模型M6—M10也在10.4 μm通道的效果最好,RMSE可以达到4.94 m/s,性能相比M3提高了5%左右,定位误差为51.59 km。3.9 μm通道强度估计性能最差,RMSE为5.80 m/s,但比无定位信息模型的强度估计时精度同样有所提升,定位误差为49.25 km。总体而言,融合定位信息后的强度估计模型比只进行强度估计的模型强度估计性能均有所提升。10.11834/jig.220348.T002表2葵花-8数据不同通道强度估计误差和定位误差Table 2Intensity estimation errors and location errors of different channel data of Himawari-8波段/μm模型强度误差RMSE/(m/s)定位误差/km3.9M16.13-6.2M25.30-10.4M35.20-12.3M45.28-13.3M55.21-3.9M65.8049.256.2M74.9757.0010.4M84.9451.5912.3M95.0153.9313.3M104.9655.27注:加粗字体表示各列最优结果。“-”表示定位误差不存在。3.2 不同通道组合对于强度估计误差的影响不同通道图像所提供的信息不同,不同通道组合性能也会有所不同,本文也对不同通道组合进行了融合定位信息后模型的强度估计性能分析。对于多通道图像,依据单通道模型的性能来挑选。首先将单通道精度最高的10.4 μm通道图像与其他通道进行组合得到双通道的热带气旋图像,然后将性能最优的双通道组合再与其他通道结合,一共得到10组结果(M11—M20)。为了方便与无定位信息模型比较,将无定位信息模型(M11_s—M20_s)的性能列入表中。实验发现,不同通道组合对强度估计性能有一定影响,结果如表3所示。通过表3发现,合理的通道组合能够改善模型的性能。除M14模型外,大部分在融合定位信息模型上进行强度估计性能均有一定提升。其中,10.4 μm,13.3 μm,6.2 μm,12.3 μm组合的M18模型强度估计误差最小,RMSE为4.74 m/s,定位误差为42.86 km,相比M8模型强度估计性能提升4%左右。因此后文都基于M18模型进行分析。10.4 μm和3.9 μm组合的M14模型强度估计性能最差,RMSE为5.09 m/s,定位误差为46.51 km,相比于M8模型,模型性能不仅没有提升,反而有所下降。10.11834/jig.220348.T003表3葵花-8数据多通道强度估计误差与定位误差Table 3Multi-channel intensity estimation error and location error for Himawari-8 data波段/μm模型强度误差RMSE/(m/s)定位误差/km10.4、12.3M11(M11_s)4.84(5.23)43.8410.4、13.3M12(M12_s)4.79(5.14)40.6810.4、6.2M13(M13_s)4.82(5.16)44.1110.4、3.9M14(M14_s)5.09(5.49)46.5110.4、13.3、12.3M15(M15_s)4.84(5.24)43.3810.4、13.3、6.2M16(M16_s)4.77(5.10)45.8410.4、13.3、3.9M17(M17_s)4.91(5.38)44.5710.4、13.3、6.2、12.3M18(M18_s)4.74(5.08)42.8610.4、13.3、6.2、3.9M19(M19_s)4.98(5.23)40.8110.4、13.3、6.2、12.3、3.9M20(M20_s)4.89(5.15)44.55注:加粗字体表示各列最优结果,第3列括号内数值为无定位信息时的模型误差。3.3 损失函数权重对强度估计性能的影响为了探讨不同权重系数对模型结果的影响,在M18模型上对损失函数赋予一定权重进行实验。首先将强度损失系数设置为λ,定位损失权重保持不变,通过改变λ的大小调整模型强度估计的性能。共进行了7组不同权重实验,结果如表4所示。不同的权重设置有着不同的性能,随着权重λ的增加,强度误差呈现出先下降后上升的趋势,当λ为1时,模型性能最好,强度估计的RMSE为4.74 m/s,当权重为0.01时,模型性能最差,强度估计的RMSE最大,达到了5.56 m/s。因此模型选择λ为1作为模型的权重,即强度损失和定位损失之和。10.11834/jig.220348.T004表4不同权重大小模型性能Table 4Performance of models with different weight权重λ大小强度误差RMSE/(m/s)0.015.560.15.190.54.8614.7454.91104.961005.20注:加粗字体表示最优结果。4 分析与讨论4.1 误差分布从2015—2018年的数据中选取了122个热带气旋用于模型训练,从2019年和2020年的数据中选取了50个热带气旋用于测试,并使用M18模型进行分析,热带气旋强度估计误差分布图如图4所示。图4(a)显示了强度估计与最佳路径集之间的关系。直线是模型估计的强度与实际强度的线性拟合曲线。其相关系数R为0.93。强度估计值分布在11.52~66.09 m/s之间。图4(b)显示了绝对误差的概率分布。横轴是小于某些绝对值的误差百分比,纵轴是最佳路径集和估计强度之间的绝对误差。结果表明,25%的绝对误差小于1.17 m/s,50%的绝对误差小于2.64 m/s,75%的绝对误差小于4.85 m/s,90%的绝对误差小于7.85 m/s。图4(c)是2019—2020年热带气旋样本最佳路径集和模型估计的强度偏差曲线,显示了热带气旋测试集上的偏差分布,高估和低估的程度总的来说是相似的,偏差在0 m/s左右波动,均值为-0.27 m/s。图4(d)显示了最佳路径集和绝对误差之间的关系,曲线表示的是最佳路径集到绝对误差的多项式拟合曲线。这说明绝对误差与热带气旋强度之间并非线性相关的。但总体上是正相关的,即强度越大,绝对误差越大。10.11834/jig.220348.F004图4热带气旋强度估计误差分布图Fig.4Distribution of tropical cyclone intensity estimation error ((a) scatter diagram comparing the estimated intensities with the best-track intensities; (b) absolute error curve related to the percentage of over some absolute errors; (c) curve of the bias between the best-track intensities and the estimated intensities; (d) scatter diagram comparing the absolute errors with the best-track intensities)4.2 不同类别热带气旋强度的误差分析表5给出了M18模型的强度估计值和实际强度之间的均方根误差(RMSE)、平均绝对误差(MAE)、偏差(bias)、平均相对误差和低估样本数。从表5可以看出,强度估计RMSE总体上是随着强度的增加而增大的。其中,TD类别的RMSE最小,为3.15 m/s,而SuperTY的RMSE是最大的,为7.59 m/s。MAE分布与RMSE类似,从2.22 m/s到5.99 m/s不等。平均相对误差整体呈下降趋势,TD的平均相对误差最大,为15.47%,STY平均相对误差最小,为9.57%,模型估计效果最好,而SuperTY的模型平均相对误差却有所上升。10.11834/jig.220348.T005表5不同类别热带气旋的强度估计Table 5The intensity estimation of different categories tropical cyclone种类RMSE/(m/s)MAE/(m/s)Bias/(m/s)平均相对误差/%低估样本/%平均4.743.52TD3.152.221.8215.47289(21.58)TS3.812.960.3614.57679(49.10)STS4.993.98-0.1914.19493(50.82)TY5.864.55-1.2512.49384(56.30)STY5.654.42-2.689.57340(70.10)SuperTY7.595.99-5.3610.16316(85.41)注:加粗字体表示各列最优结果,低估样本为低估样本个数(百分比)。另外,表5显示,高估样本与低估样本的百分比是不平衡的,低估样本百分比最少的是TD,为21.58%,最高是SuperTY,为85.41%,并且随着热带气旋强度的增强,低估样本在整体上是逐渐增加的。其中一个可能的原因是因为样本分布不平衡导致的。测试样本中,超过90%的热带气旋样本强度低于SuperTY,导致大量的SuperTY样本被低估,而大约74%的样本高于TD,导致大量的TD样本被高估。在以后的预测中,不同样本赋予不同权重也许是一个不错的解决方法。图5显示了每个热带气旋类别融合定位信息的模型(M18)与无定位信息模型(M18_s)的平均相对误差箱线图。平均相对误差总体上随着热带气旋强度的减小而增加,TD的异常值很多,这就导致TD的平均相对误差很大,而到了TS类别,异常值有所减少,使得平均相对误差相较于TD有所下降。除TS类别以外,融合定位信息模型的平均相对误差相比无定位信息模型有所下降,说明融合定位信息对强度估计任务的精度有所提升。10.11834/jig.220348.F005图5融合定位信息模型与无定位信息模型平均相对误差箱线图Fig.5Box plot of average relative error between fusing location information and no location information表6显示了IEFL与其他方法的比较情况。与其他方法相比,IEFL在强度估计上达到了目前最优的效果。DAVT手工提取的方式估计热带气旋强度,RMSE为6.53 m/s。Pradhan等人(2018)使用Deep-CNN估计热带气旋强度,RMSE为5.8 m/s。CNN-TC是由Chen等人(2019)提出来的,通过深度卷积神经网络进行估计热带气旋强度,RMSE为5.34 m/s。Zhang等人(2020)提出的TCIENet使用双分支网络进行强度估计,RMSE为5.13 m/s。另外,Zhang等人(2021)提出的TCICENet网络,RMSE为4.93 m/s。而本文IEFL模型的RMSE为4.74 m/s,MAE为3.52 m/s,相比于其他方法,IEFL模型使用的葵花-8数据集图像能够保证测试的实时性,无论是RMSE与MAE,效果都是最优的,并且还具有一定的热带气旋定位效果。10.11834/jig.220348.T006表6IEFL与其他模型的比较Table 6Comparison of IEFL with other models方法数据RMSEMAEDAVT (Ritchie等,2014)IR6.53-Deep-CNN (Pradhan等,2018)IR5.80-CNN-TC (no smoothed) (Chen等,2019)IR,PMW5.34-DeepMicroNet(Wimmers等,2019)MINT5.45-TCIENet (Zhang等,2020)IR,WV5.134.03TCICENet (no smoothed) (Zhang等,2021)IR4.933.83本文(无定位信息)IR,WV5.083.85本文IR,WV4.743.52注:加粗字体表示各列最优结果,“-”表示其值不存在。m/s4.3 个例分析图6给出2019年和2020年的50个热带气旋(TC)的样本数量及均方根误差,其平均RMSE为4.74 m/s。从图中可以看出,木恩(MUN)的强度估计误差最小,RMSE为0.70 m/s,夏浪(HALONG)的强度估计误差最大,RMSE为7.44 m/s。10.11834/jig.220348.F006图6不同测试样本热带气旋的样本数以及RMSEFig.6Sample size and RMSE of tropical cyclones for different test samples本文选择了3个热带气旋来验证ITML模型的性能。因MUN样本较少,剑鱼(KAJIKI)的许多样本不在106°E—164°E和5°N—45°N范围内。因此首先选择2020年性能较好的鹦鹉(Nuri),其样本数为76,热带气旋类别为TS。对于Nuri,图7(a)给出预测路径与真实路径图,图7(b)反映出最佳路径集与模型估计强度情况,RMSE为2.37 m/s,MAE为1.87 m/s,偏差(Bias)为0.30 m/s。在热带气旋初始阶段,模型估计的强度为13.79 m/s,随着时间的增加,模型的估计曲线基本呈高估现象,当热带气旋强度超过17 m/s时,整体呈现低估现象。图7(c)给出模型强度误差最小时图像,平均绝对误差为0.05 m/s。图7(c)呈现出明显的初期阶段特征,云系白亮但无明显螺旋结构,形状不规则,模型能够准确估计其强度。图7(d)给出模型强度误差最大时图像,误差为6.86 m/s。图7(d)云系整体呈规则圆形,白亮,且具有一定螺旋结构,使得模型严重高估。图7(c)(d)中,红框表示路径真实值,绿框表示模型估计值。10.11834/jig.220348.F007图7热带风暴Nuri误差分析Fig.7Tropical storm Nuri error analysis ((a) true track and model-estimated track; (b) best-track intensities and model-estimated intensities; (c)10.4 µm channel image at 19:00 on June 10, 2020; (d)10.4 µm channel image at 20:00 on June 11, 2020)其次,选择性能最差的热带气旋HALONG(夏浪),样本数为132,如图8所示,热带气旋类别为SuperTY,图8(a)给出预测路径与真实路径图。图8(b)显示最佳路径集和模型估计强度曲线,RMSE为7.44 m/s,MAE为5.91 m/s,偏差(bias)为-2.80 m/s。在热带气旋初始阶段,模型估计存在异常值,存在明显高估情况,如图8(c)所示,误差达到20.69 m/s,从图中可以看到,HALONG螺旋结构明显,云形规则,整体白亮,使得模型严重高估。随着时间的推移,热带气旋强度增大,模型与真实强度基本一致,图8(d)给出了模型强度误差最小时刻图像,误差为0.01 m/s,云系层次清晰,误差较小。当热带气旋逐渐消散时,模型估计值整体呈低估趋势。图8(c)(d)中,红框表示真实值,绿框表示模型估计值。10.11834/jig.220348.F008图8超强台风HALONG误差分析Fig.8Super typhoon HALONG error analysis ((a) true track and model-estimated track;(b) best-track intensities and model-estimated intensities; (c) 10.4 µm channel image at 12:00 on November. 02, 2019;(d) 10.4 µm channel image at 03:00 on November. 03, 2019)最后,选择2019年的强台风KROSA(罗莎),样本数为242,如图9所示,热带气旋类别为STY,图9(a)给出预测路径与真实路径图。图9(b)显示最佳路径集和模型估计强度曲线,与超强台风HALONG不同的是,KROSA误差较小,RMSE为3.20 m/s,MAE为2.49 m/s,偏差(bias)为1.72 m/s。模型估计值与真实值曲线基本一致,整体存在轻微高估情况。随着时间的推移,热带气旋强度增大,当热带气旋强度达到32.5 m/s时,模型的平均误差达到11.00 m/s,图9(c)给出模型强度误差最大时的图像,可以看到图9(c)螺旋结构明显,整体白亮,模型存在高估的情况。当热带气旋达到消散阶段时,强度逐渐下降,模型误差也随之减少,图9(d)给出了模型强度误差最小时刻的图像,误差为0.01 m/s,云系螺旋结构明显,整体呈灰暗、云系层次清晰,误差较小。在图9(c)(d)中,红框表示路径真实值,绿框表示模型估计值。10.11834/jig.220348.F009图9强台风KROSA误差分析Fig.9Severe typhoon KROSA error analysis ((a) true track and model-estimated track;(b) best-track intensities and model-estimated intensities; (c) 10.4 µm channel image at 15:00 on August. 07, 2019;(d) 10.4 µm channel image at 10:00 on August. 11, 2019)5 结 论针对葵花-8卫星云图,本文利用最佳路径集对其进行标注,使用CNN网络模型对热带气旋图像进行强度估计,并提出一个融合定位信息的网络模型IEFL来提高强度估计的性能。该模型利用2015—2018年的数据进行训练,并使用2019年和2020年的数据进行测试。结论如下:1)融合定位信息模型性能明显优于无定位信息模型。对于不同通道,无论是否融合定位信息均在10.4 μm时表现最好,其中融合定位信息后RMSE为4.94 m/s,而无定位信息的模型RMSE为5.20 m/s;对于多通道组合,无论是否融合定位信息,10.4 μm,13.3 μm,6.2 μm,12.3 μm的4个通道组合分别取得最佳结果,其中融合定位信息后RMSE达到4.74 m/s,而只进行强度估计RMSE为5.08 m/s。2)本文对性能最好的10.4 μm,13.3 μm,6.2 μm,12.3 μm通道组合图像进行分析,强度估计值与最佳路径集具有良好的相关性,其相关系数为0.93。此外,25%的绝对误差小于1.17 m/s,50%的绝对误差小于2.64 m/s,75%的绝对误差小于4.85 m/s,90%的绝对误差小于7.85 m/s。强度估计误差总体上随着热带气旋强度增强而增加。TD类别RMSE最低,为3.15 m/s。SuperTY类别RMSE最高,为7.59 m/s。TD类别容易被高估,STY和SuperTY类别容易被低估,随着热带气旋类别强度增大,低估样本百分比呈上升趋势。3)通过个例分析发现,对于较弱热带气旋(如TD、TS等)云形规则,整体白亮的云图来说,模型误差较大,容易被高估。另外,对于处在消散期的热带气旋,模型更容易出现极度低估的情况(如超强台风HALONG)。在这项工作中,本文使用IEFL模型对热带气旋强度估计任务RMSE达到了4.74 m/s的精度,但是在有些地方还有待改进,例如TD类别容易被高估,STY和SuperTY类别容易被低估,一个原因可能是由长尾分布导致的,在以后的工作中可以尝试从这一方面进行研究。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读