Nov, 2023

跨模态生成模型视觉引导下的双耳立体声生成

TL;DR通过使用视觉引导生成对抗方法,本论文第一次提出了从单声道音频生成双元立体音频的方法,并且引入了一个测量音频空间感知的度量标准,通过定量和定向的方式评估音频的空间感知,在 2 个数据集和 5 个评价指标上实现了最先进的性能。定性实验和用户研究证明了该方法生成的空间逼真的立体音频。