Nov, 2023

MFAAN:利用多特征真实性网络揭示音频深度伪造

TL;DR为了解决深度伪造音频内容的问题,该研究引入了多特征音频真实性网络 (MFAAN),该网络结构利用 Mel 频率倒谱系数 (MFCC)、线性频率倒谱系数 (LFCC) 和色度短时傅立叶变换 (Chroma-STFT) 等多种音频表示方法,通过协同融合这些特征,能够准确鉴别真实和伪造的录音,初步评估显示其在两个基准数据集上表现出卓越的性能,实现了分别达到 98.93% 和 94.47% 的准确率,这不仅突显了 MFAAN 的功效,还凸显了它作为应对深度伪造音频内容的关键工具的潜力。