利用用户收听数据学习音频嵌入以进行基于内容的音乐推荐
本文提出了一种深度内容 - 用户嵌入模型,它采用混合方法解决了冷启动问题,并考虑了不同模式数据的联合,同时在音乐推荐和音乐自动标记任务中,表现出了明显的优势。
Jul, 2018
本研究在音乐 / 视频跨模态推荐方面采用自监督学习范式,并利用预训练的 MuSimNet,OpenL3,MusicCNN 或 AudioSet 等音频嵌入来大幅改善推荐效果。其中,通过跨模态三元组损失进行学习比通常自监督学习采用的二元交叉熵损失具有更好的效果,验证了 VM-NET 的有效性。
Apr, 2021
通过深度神经网络结构,结合文本和音频信息以及用户反馈数据,从艺术家的传记和可用反馈数据中学习艺术家和音轨的嵌入向量,并在多模态网络中将其组合,以解决音乐流媒体服务中的冷启动问题并提高精度。
Jun, 2017
本文提出一种由协同过滤数据样本优化得到的基于内容相似度度量的音乐推荐系统,能够对于新颖或不受欢迎音乐领域的查询给出高精度和高效率的回答,并且在实验中得出了显著的精度改善。
May, 2011
通过比较应用 CLMR 和 CLAP 嵌入到相似度测量中的作用,我们建立了可复制的方法来系统地识别具有相似音频的音乐作品,以便了解训练数据来源,此工作对于将自动化影响归因纳入生成模型是基础性的,可以让模型创作者和用户从无知的借用转向知情的创造。
Jan, 2024
调查了在 few-shot 设置中对文本到音乐扩散模型进行个性化的工作。首次探索了将预训练的文本到音频扩散器与两种常用的个性化方法结合的组合。实验了音频特定数据增强对系统整体性能的影响,并评估了不同的训练策略。构建了一个包含提示和音乐片段的新数据集进行评估,使用基于嵌入和基于音乐的量化评估指标,以及用户研究进行定性评估。分析表明相似度度量与用户偏好一致,并且当前的个性化方法更容易学习到节奏音乐结构而非旋律。该研究的代码、数据集和示例资料对研究社区开放。
Sep, 2023
本文研究深度音频嵌入技术对于音乐情感识别领域的应用,探讨了 L3-Net 和 VGGish 等深度音频嵌入方法在情感识别上的表现,结果表明这些方法可有效提高基线情感识别模型的性能,且不需要人工专家工程。
Apr, 2021
本文介绍了一种利用 YouTube-8M 数据库中视听文件间共同区域来建立联系以自主训练深度神经网络的方法,实现了跨模态特征学习的无监督方法,并得出了良好的检索结果。
Jan, 2018
该研究回顾了最近在社交媒体用户的表征学习领域的进展,并提供了从异构用户数据(例如,将社交媒体文本与图像相结合来学习统一用户表征)中学习统一用户嵌入的典型方法,该技术对于创建高性能的基于社交媒体的人类特征和行为模型至关重要。
Jun, 2019
通过在嵌入空间中捕捉用户和歌曲的文化细微差别,我们提出了两种新的增强方法来解决音乐推荐中的流行度偏见,从而减少了流行度偏见并提高了人群和文化的公平性。
May, 2024