CVPRJun, 2023

基于语言引导的视频音乐推荐系统

TL;DR该研究提出了一种音乐推荐的方法,允许用户使用自由形式的自然语言来引导音乐选择,解决了没有音乐文本描述的挑战,并使用文本合成方法训练了新的三模态模型,该模型的检索音频可通过与视频呈现的视觉风格和语言查询中描述的音乐风格、心情或器乐匹配,以匹配两个输入模态的准确性。