Sep, 2023

MusiLingo:使用预训练语言模型在音乐字幕和查询响应中连接音乐和文本

TL;DRMusiLingo 是一个创新系统,通过使用单个投射层将来自预训练的冻结音乐音频模型 MERT 和冻结的 LLaMA 语言模型中的音乐表示对齐,弥合了音乐音频和文本环境之间的差距,从而在音乐字幕生成和音乐相关的查询响应中展现了竞争性能。