Oct, 2022

音乐到文本的共感现象:从音乐录音生成描述性文本

TL;DR考虑到现有音乐数据集缺乏语义描述,本文收集了包括 1,955 个经典音乐录音和文本描述的新数据集,提出了一种计算模型来生成描述音乐内容的句子,并设计了一种组拓扑保持损失来解决经典音乐的非判别性问题。在我们的数据集上,与其他竞争方法相比,该模型在定性和定量实验中均表现出明显的优越性。