BriefGPT.xyz
Ask
alpha
关键词
attention-based fusion technique
搜索结果 - 1
RTFS-Net: 循环时间频率建模 有效的音频视觉语音分离
本文提出了一种新颖的基于时频域的音视频语音分离方法:递归时频分离网络 (RTFS-Net),通过在短时傅里叶变换产生的复杂时频区间上运用算法来独立地对音频的时间和频率进行建模,并引入了独特的基于注意力的融合技术,以有效地整合音频和视觉信息,
→
PDF
9 months ago
Prev
Next