揭示歌声转录中的性别公平

MMAug, 2023

Elucidate Gender Fairness in Singing Voice Transcription

Xiangming Gu, Wei Zeng, Ye Wang

TL;DR通过使用属性预测器对韵律事件进行条件对齐，我们提出了一种减少性别偏见的方法，在不降低整体歌唱声音转录性能的情况下，显著减少了性别偏见，从而提供更好的公平性 - 实用性权衡。

Abstract

It is widely known that males and females typically possess different sound characteristics when singing, such as timbre and pitch, but it has never been explored whether these gender-based characteristics lead to a performance disparity in →

singing voice transcription gender-based characteristics performance disparity gender bias fairness-utility trade-off

发现论文，激发创造

不放过任何音高：通过调整音高解决自动语音识别中的性别不平衡问题

通过使用一个数据增强技术，我们可以减轻性别偏见问题，在语音识别系统中模拟女性说话者的声音，增加各性别组内的变异性，并显著提高女性说话者的识别准确性。

Oct, 2023

自监督语音转文本系统中性别影响的研究

本研究使用法语作为研究语言，通过比较不同性别平衡的预训练数据集在 ASR 和 ST 中的表现来探究其影响。结果表明，性别平衡的预训练模型不一定导致最佳结果，并且使用自监督模型作为特征提取器时，ASR 和 ST 的结果会遵循更复杂的模式。

Apr, 2022

使用无旋律监督预训练提升单音人声合成的音域

基于先前的研究，在一个多歌手的数据集上进行的旋律无监督多说话人预训练方法，提高了单个说话人的声域，同时不降低音色相似性。这种预训练方法可以应用于只包含音频和歌词对的大规模多歌手数据集，并改善了合成歌声的音质和节奏自然度。

Sep, 2023

促进的歌唱声音合成：通过自然语言提示实现可控

提供了一种新的歌声合成方法 Prompt-Singer，使得合成歌声能够通过自然语言明确地控制歌手的性别、音域和音量，并使用基于解码器的 transformer 模型和多尺度层次结构设计了分离音域旋律的音高表示方法以保持旋律准确性，同时，对不同类型的文本表示、文本编码器微调和引入语音数据以减轻数据稀缺问题等不同实验设置进行了探索，旨在促进进一步的研究，实验证明该模型具有良好的控制能力和音频质量。

Mar, 2024

关于训练数据的歌声分离研究

本研究探讨了训练数据集的特征对半监督唱声分离系统性能的影响和数据增强方法。结果表明，训练数据集的分离质量和多样性是性能的关键因素。

Jun, 2019

SPA-SVC：自我监督的歌声转换中的音高增强

在这篇论文中，我们提出了一种自监督的 SPA-SVC 方法，该方法可以改善 SVC 任务中的声音质量，无需额外的数据或增加模型参数。我们通过引入循环音高转换训练策略和结构相似性指数（SSIM）损失，有效提升了 SVC 模型的性能，实验结果表明我们的方法在一般的 SVC 场景和跨域 SVC 场景中都显著提高了模型性能。

Jun, 2024

性别倾斜：通过属性操作实现计算机视觉模型的反事实公平性

本文提出了一种使用编码器 - 解码器网络开发的人脸图像合成方法，以测量商业计算机视觉分类器的反事实公平性，并报告了在线搜索服务中与职业相关的关键字中出现的偏向性，用以解释模型偏差的来源。

May, 2020

衡量和评估讲话方规整度的方法

本研究提出了一个分析讲话者分离公平性的新协议和评分方法，对性别、年龄、口音及发音时长等因素对讲话者分离结果的影响进行了大规模数据集实验，发现讲话者口音和性别会对分离结果产生偏见。

Feb, 2023

学习歌曲之美：神经唱声美化器

本研究通过引入条件变分自动编码器作为神经网络，提出了一种名为 NSVB 的算法以解决唱歌者专业音色的问题，主要包括时间伸缩技术和基于隐变量的映射算法，该算法能够有效地进行音高校正并且在客观和主观尺度上均获得了更好的实验效果。

Feb, 2022

培育基于性别意识的直接语音翻译系统

本研究探讨无需转录的直接语音翻译模型在性别翻译方面的性别偏见及其潜在危害，并比较不同方法通知模型说话人性别信息的效果，结果表明性别感知模型相比于无性别感知模型在性别标记词的翻译准确率上可提高 30 个百分点，同时保证总体翻译质量。

Dec, 2020