我们提出了一种注意力层的方法,使用用户提供的自相似矩阵来在生成音乐时添加模板结构,并通过与没有注意力机制的模型进行比较,证明了该方法显著提高了网络的特定结构复制能力,以及在未见测试集上的性能。
Jun, 2024
本文提出了 MUlti-Segmental Informational Coding(MUSIC)方法,使用信息理论测量直接优化划分样本到不同语义聚类的多个划分部分,以避免最小解,证明了 MUSIC 比最相关的 Barlow Twins 和 VICReg 方法在 ImageNet 分类方面线性探测时具有更好的结果。
Jun, 2022
本研究提出了一种基于自我监督学习方法的模型,通过介绍自我监督辅助损失的度量学习方法来解决基于相似性的检索挑战。实验结果表明,该方法可以增强检索和标记性能指标,可用于所有音乐曲目和部分音乐曲目的两种情况。
Apr, 2023
本研究提出了三种方法,其中两种是基于图形的新颖算法,通过形式或结构对符号音乐进行分割。使用两个公共数据集对其进行了消融研究,发现使用图形表示对结构进行符号音乐编码,并计算从图中获取的邻接矩阵的新颖性可以很好地表示符号音乐的结构,同时无需提取其特征。我们成功实现了在线无监督变点检测方法,F_1 值为 0.5640,容忍间隔为 1 拍,本研究希望这些方法能用于改进其他音乐信息检索任务。
Mar, 2023
我们通过自监督对比学习的方法,研究了如何减轻多模态音乐检索模型中标注数据稀缺的限制,并提出了经过预训练的模型能够更好地检索音乐片段,并在交叉模态的作品识别任务中获得更好的检索质量的观察结果。
Sep, 2023
本文研究了不同对比自监督学习方案学习的音乐音频表示,并在不同的音乐信息检索任务中经验性地评估嵌入向量,以分析结果并讨论对不同 MIR 任务的适当对比学习策略方向,表明这些表示传达了关于音乐的听觉特征的综合信息,尽管每个自我监督策略在某些方面的信息方面有效。
Jul, 2022
本研究旨在开发一种可解释的音乐相似性分类系统,通过结合符号和音频内容,提高音乐检索、推荐和分析的效率和精度。
Jun, 2023
研究视频配乐中的跨模式推荐问题,使用自我监督系统学习音乐和视频间的内容关联,提出了结构感知推荐方法,在训练与推断过程中,使用语义片段和不同的排序指标和分割方法来显著提高系统性能。
提出了一种基于数据驱动的结构感知性能指标同步方法,其中使用了卷积 - 注意力架构并采用基于时间序列差异的自定义损失,实验证明该方法可以在各种测试设置下优于先前的同步方法。
Apr, 2022
文章提出了一种基于结构相似度指标(SSIM)的新的加权结构相似度损失(LWSSIM)来代替均方误差(MSE)损失函数, 可以解决像素的独立性和样本空间相关性的矛盾,该模型在各种自编码器中得到了成功的应用。
Apr, 2019