歌词风格与偏见解码
本文运用自然语言处理技术分析了 377808 首来自 “Two Million Song Database” 歌曲文本,并着重研究了性别歧视在五十年来(1960 年至 2010 年)在英语歌词中的表现和测量性别偏见。我们使用了性别歧视分类器,它可以发现规模更大的歌曲歧视,比以前使用手动标注的热门歌曲小样本的研究更明确。此外,我们通过在歌曲歌词上学到的词嵌入中测量相关性来揭示性别偏见。我们发现,性别歧视在时间上有所增加,尤其是男性艺术家和在 Billboard 排行榜上出现的热门歌曲。另外,男性独唱艺术家的歌曲在性别偏见上存在更多和更强的偏见。这是第一次进行如此大规模的分析,可以为我们认识流行文化中这一般性话语的使用提供见解。
Aug, 2022
利用自然语言处理和机器学习进行文化演变以及刻板印象和文化变革方面的研究,对过去 50 年间的 25 万首歌曲进行分析,发现歌词中的性别歧视(misogyny)有所减少但仍然存在,女性与理想特质(如能力)的相关性更低。而且,男性艺术家比女性艺术家更可能引起歌词的转变,并且这些转变可能有助于推动对女性的社会定型观念的演变。
Jan, 2022
音乐中情感或心情可以在不同层面上表达自己。我们评估了基于歌词和音频的情感分析模型,并提出了结合音频和歌词结果的不同方法。我们还研究了音频和歌词情感之间的错误分类和矛盾,并确定了可能的原因。最后,我们解决了这个研究领域的一些基本问题,如主观性高,数据缺乏以及情感分类的不一致性。
May, 2024
通过歌词分析、心理测量分数以及机器学习,研究了个体音乐偏好与道德价值观之间的关联,发现音乐歌词可以很好地预测人们的道德观念,而传统和分层的价值观更容易通过歌词体现。
Sep, 2022
比较分析了计算模型和人类感知中的歌词相似性,发现基于预训练 BERT 模型嵌入、歌曲音频和音素特征的计算模型能够准确表示感知中的歌词相似性,这一发现为相似性推荐系统的发展提供了伪标签和客观评估指标。
Apr, 2024
本研究通过使用 Spotify 音乐流媒体平台用户播放列表推导出的情绪和近一百万首歌曲的数据集,利用基于 transformers 的最先进的自然语言处理模型,研究了歌词和情绪之间的关联。研究表明,预训练的 transformer-based 语言模型在零 - shot 场景下能够强大地捕捉到歌曲情绪的关联。 此外,通过比较使用歌词和使用声学特征的模型的预测,我们观察到,相对于声学,歌词对情绪的预测具有不同的重要性,从而验证了模型是否捕捉了人类对歌词和声学的情绪相关性的相同信息。
May, 2022
本研究通过探究人类感知和机器词汇重要性这两个视角,研究了文本的语言风格对词汇用法的影响,通过收集人类感知数据 Hummingbird 并参考目前常用的 BERT 语言风格分类器,比较了两者对于词汇标签的不同理解。研究表明,对于某些风格,如积极情感和愉悦,人类和机器的识别结果存在显著的重叠,但机器标记某些内容词非风格相关,而人们不能通过这些词汇准确感知对应的风格。
Sep, 2021
介绍自动歌词注释 (ALA) 任务,旨在通过重新表述原始文本并增加额外信息来帮助读者理解创意文本中的歧义和行话;分析翻译和检索模型在任务上的表现,并发现每个模型捕获任务重要的不同信息类型。
Aug, 2017