歌词风格与偏见解码

SIGIRJul, 2019

Decoding the Style and Bias of Song Lyrics

Manash Pratim Barman, Amit Awekar, Sambhav Kothari

TL;DR本文通过计算方法深入理解歌词，侧重于歌词的风格和偏见，通过分析超过 500,000 首歌曲，研究了歌曲风格和含有的性别和种族偏见，并发现歌词的偏见与社会中存在的偏见有相关性。

Abstract

The central idea of this paper is to gain a deeper understanding of song lyrics computationally. We focus on two aspects: style and biases of song lyrics. All prior works to understand these two aspects are limited to manual analysis of a small corpus of →

song lyrics style bias distributed representation methods weat test

发现论文，激发创造

歌词中的性别偏见和性别歧视的大规模分析

本文运用自然语言处理技术分析了 377808 首来自 “Two Million Song Database” 歌曲文本，并着重研究了性别歧视在五十年来（1960 年至 2010 年）在英语歌词中的表现和测量性别偏见。我们使用了性别歧视分类器，它可以发现规模更大的歌曲歧视，比以前使用手动标注的热门歌曲小样本的研究更明确。此外，我们通过在歌曲歌词上学到的词嵌入中测量相关性来揭示性别偏见。我们发现，性别歧视在时间上有所增加，尤其是男性艺术家和在 Billboard 排行榜上出现的热门歌曲。另外，男性独唱艺术家的歌曲在性别偏见上存在更多和更强的偏见。这是第一次进行如此大规模的分析，可以为我们认识流行文化中这一般性话语的使用提供见解。

Aug, 2022

消费文化中性别偏见的量化

利用自然语言处理和机器学习进行文化演变以及刻板印象和文化变革方面的研究，对过去 50 年间的 25 万首歌曲进行分析，发现歌词中的性别歧视（misogyny）有所减少但仍然存在，女性与理想特质（如能力）的相关性更低。而且，男性艺术家比女性艺术家更可能引起歌词的转变，并且这些转变可能有助于推动对女性的社会定型观念的演变。

Jan, 2022

只是文字，我全靠它们

该论文表明了利用分布式表示范式进行音乐挖掘和自然语言处理任务时歌词的优势，并通过使用分布式表示克服了手工特征和歌词被认为是流派和流行度的弱指标两个瓶颈。

Jan, 2019

音乐中歌词和音频的联合情感分析

音乐中情感或心情可以在不同层面上表达自己。我们评估了基于歌词和音频的情感分析模型，并提出了结合音频和歌词结果的不同方法。我们还研究了音频和歌词情感之间的错误分类和矛盾，并确定了可能的原因。最后，我们解决了这个研究领域的一些基本问题，如主观性高，数据缺乏以及情感分类的不一致性。

May, 2024

不仅仅是歌词”：通过歌词联系音乐偏好和道德价值观

通过歌词分析、心理测量分数以及机器学习，研究了个体音乐偏好与道德价值观之间的关联，发现音乐歌词可以很好地预测人们的道德观念，而传统和分层的价值观更容易通过歌词体现。

Sep, 2022

歌词相似性感知的计算分析

比较分析了计算模型和人类感知中的歌词相似性，发现基于预训练 BERT 模型嵌入、歌曲音频和音素特征的计算模型能够准确表示感知中的歌词相似性，这一发现为相似性推荐系统的发展提供了伪标签和客观评估指标。

Apr, 2024

歌词和声学对情绪协作理解的贡献

本研究通过使用 Spotify 音乐流媒体平台用户播放列表推导出的情绪和近一百万首歌曲的数据集，利用基于 transformers 的最先进的自然语言处理模型，研究了歌词和情绪之间的关联。研究表明，预训练的 transformer-based 语言模型在零 - shot 场景下能够强大地捕捉到歌曲情绪的关联。此外，通过比较使用歌词和使用声学特征的模型的预测，我们观察到，相对于声学，歌词对情绪的预测具有不同的重要性，从而验证了模型是否捕捉了人类对歌词和声学的情绪相关性的相同信息。

May, 2022

研究诗歌创作系统中的社会偏见

本研究旨在探讨如何在诗歌创作系统中进行下一个诗句建议检索时减轻社会偏见，并通过情感风格转换的数据增强方法，为减轻社会偏见提供了潜在的解决方案。

Nov, 2020

BERT 是否学习人类感知？通过词汇了解语言风格

本研究通过探究人类感知和机器词汇重要性这两个视角，研究了文本的语言风格对词汇用法的影响，通过收集人类感知数据 Hummingbird 并参考目前常用的 BERT 语言风格分类器，比较了两者对于词汇标签的不同理解。研究表明，对于某些风格，如积极情感和愉悦，人类和机器的识别结果存在显著的重叠，但机器标记某些内容词非风格相关，而人们不能通过这些词汇准确感知对应的风格。

Sep, 2021

自动歌词注释研究

介绍自动歌词注释 (ALA) 任务，旨在通过重新表述原始文本并增加额外信息来帮助读者理解创意文本中的歧义和行话；分析翻译和检索模型在任务上的表现，并发现每个模型捕获任务重要的不同信息类型。

Aug, 2017