Aug, 2024

基于上下文的跨模态注意力用于音视频深度伪造检测与定位

TL;DR本研究针对音视频深度伪造检测中的异构数据融合难题,提出了一种基于递归神经网络的多模态注意力框架。该方法利用上下文信息增强音视频数据的特征学习,在深度伪造检测与定位上显示出显著的性能提升,准确率和精确率分别提高了3.47%和2.05%。