自监督对比学习用于稳健的音乐 - 乐谱检索系统
通过深度学习方法,通过跨模态音乐检索技术,连接大量乐谱图片和相应音频录音,解决音频和乐谱图片相互关联的问题,同时提出了一些挑战和方法来解决这些挑战,以实现跨模态音乐检索的统一和稳定的方法。
Sep, 2023
设计了一种跨模态循环网络,通过学习联合嵌入,能够总结相应音频和乐谱的更长的段落,解决了强对齐数据和音频与乐谱节奏差异导致的局部和全局差异问题,并在实验中验证了该方法在所有可能的配置中进行更准确的检索。
Sep, 2023
本文研究了不同对比自监督学习方案学习的音乐音频表示,并在不同的音乐信息检索任务中经验性地评估嵌入向量,以分析结果并讨论对不同 MIR 任务的适当对比学习策略方向,表明这些表示传达了关于音乐的听觉特征的综合信息,尽管每个自我监督策略在某些方面的信息方面有效。
Jul, 2022
该研究使用神经网络跨模态嵌入空间解决音频和乐谱图像之间的匹配问题,并在五个不同作曲家的古典钢琴音乐上进行实验,展示出多模态神经网络处理乐谱和音频的成果。
Jul, 2017
本研究在音乐 / 视频跨模态推荐方面采用自监督学习范式,并利用预训练的 MuSimNet,OpenL3,MusicCNN 或 AudioSet 等音频嵌入来大幅改善推荐效果。其中,通过跨模态三元组损失进行学习比通常自监督学习采用的二元交叉熵损失具有更好的效果,验证了 VM-NET 的有效性。
Apr, 2021
本文旨在研究跨媒体检索中的乐曲检索,基于 Deep Canonical Correlation Analysis 学习相关空间,能够检索图片和音频之间的乐曲片段,初步实验结果有所进展。
Dec, 2016
本文介绍了一种利用 YouTube-8M 数据库中视听文件间共同区域来建立联系以自主训练深度神经网络的方法,实现了跨模态特征学习的无监督方法,并得出了良好的检索结果。
Jan, 2018
通过对音频和视频模态的对比学习,研究表明预训练网络在音乐视频的标签和流派分类任务上优于对比学习方法,通过定性分析了解对比学习在音乐视频中的困难并提出未来工作的可能方向。
Sep, 2023