Jun, 2024

跨模态音乐处理的带语义注释的 Mosa 数据集

TL;DR本文介绍了 MOSA(Music mOtion with Semantic Annotation)数据集,它包含由 23 位专业音乐家演奏的 742 个专业音乐表演的高质量三维运动捕捉数据,与音频录音及音高、节拍、乐句、动态、演奏和和谐等音符级的语义注释,是迄今为止最大的音乐领域的交互式数据集。数据集的用途在于交叉模态音乐信息检索(MIR)和音乐内容生成任务,包括从音频、视频和运动数据中检测节拍、下拍、乐句和表现内容,并根据给定的音乐音频生成音乐家的身体动作。数据集和代码可在本文所附网址中获取。