摘要:目的随着人脸伪造技术的快速发展与广泛传播,由其引发的虚假信息泛滥与身份冒用诈骗等社会问题日益严峻。现有的基于人脸图像重建的伪造检测方法仅进行真实或伪造人脸的单视角重建,未显式放大二者重建前后的差异,导致网络模型的检测准确率和泛化性能提升有限。针对上述问题,提出一种差异化重建驱动的残差引导人脸伪造检测方法,扩大真伪人脸重建前后的差异,显著提升了模型检测性能。方法首先,为了显式放大真伪人脸重建前后的差异,提出一种对比差异化重建网络(Contrastive Differential Reconstruction Network,CDRNet),分别为真实与伪造人脸构建清晰与模糊图像的重建目标,提升整体网络模型对真伪人脸的辨别能力。其次,考虑到现有检测方法对残差图的引导信息利用不充分等问题,设计了残差双域引导模块(Residual Dual-Domain Guidance Module,RDDGM),深度融合图像的空间域与高频域特征,并利用重建残差信息引导融合后的双域特征,增强了网络模型捕捉细微伪造痕迹的能力。此外,为了促使模型学习不同伪造方法之间的通用伪造特征,设计了文本感知损失模块(Text-Aware Loss Module,TALM),通过引入文本模态信息的引导,进一步优化对比差异化重建结果,大幅提升了网络模型对未知伪造方式的泛化性能。结果在域内实验中,与性能最好的对比方法相比,该方法的准确率(accuracy,ACC)与曲线下面积(area under the curve,AUC)指标分别提升2.83%和1.75%。在跨域实验中,该方法在5个公开测试集上与13种典型方法进行性能测试与比较,平均AUC指标提高1.75%。结论本文在人脸伪造检测中创新性结合对比学习与图像差异化重建,显著提升了模型对未知伪造方式的检测准确率,在多个基准测试中性能优于已有方法。
摘要:目的针对视觉显著性预测中长程建模开销较大、复杂背景响应易随全局传播扩散以及解码上采样导致注视热点不够集中的问题,提出一种不确定性门控Mamba建模增强与动态频域调制相结合的显著性预测网络(Spatio-Spectral Uncertainty-Gated Mamba Network ,S²UG-Mamba)。方法在编码端,设计不确定性感知状态空间增强模块(Uncertainty-Aware State Space Enhancement Module,UA-SSM),通过双向蛇形交叉扫描Mamba建模捕获长程上下文信息,并结合空间与通道方差统计进行不确定性估计,生成置信度门控,以抑制不可靠区域响应。在解码端,针对连续上采样引起的预测响应扩散问题,提出语义引导的动态频域调制模块(Semantic-Guided Dynamic Frequency Modulation Module,SDFM),利用深层语义先验对频域调制过程进行动态引导,从而提升注视热点区域的响应集中性。结果在SALICON、MIT300等5个公开数据集上的实验结果表明,所提S²UG-Mamba在多个主流评价指标上均优于现有先进方法。与GSGNet相比,S²UG-Mamba在LSUN'17竞赛上将KL由0.190降低至0.176,降低7.4%,IG达到0.943,提升4.0%;在MIT300盲测中,CC相对提升2.2%,KL降低9.8%;在MIT1003零样本测试中,NSS、CC和SIM分别提升2.2%、2.0%和5.6%,KL降低5.1%。结论所提方法实现了长程上下文建模、背景噪声抑制和显著结构恢复的协同优化,在保持较高计算效率的同时提升了复杂自然场景下显著性预测的分布一致性、跨域泛化能力和鲁棒性。