关键词visual acoustic matching
搜索结果 - 2
- 自监督视觉声音匹配
通过条件生成对抗网络框架和一种测量去偏音频中残留声学信息水平的新型指标,我们提出了一种自监督的视觉声学匹配方法,能够在不使用不匹配的源音频作为参考的情况下,将音频重构为目标环境中的音频并学习解开房间声学效应,无论是通过野外网络数据还是模拟数 - CVPR视听呼应
本研究提出了一种使用交叉模态转换模型的视听匹配任务,该模型使用音频 - 视觉注意力将视觉特性注入音频,以生成逼真的音频输出,并使用自我监督训练目标从 “野外” Web 视频中学习声学匹配,以便将人类语音成功转换为多种实际环境,在实验中证明该