应用 ASV 进行语音识别：TTS 模型中 VC 和持续性预测改进的应用

Jun, 2024

应用 ASV 进行语音识别：TTS 模型中 VC 和持续性预测改进的应用

Application of ASV for Voice Identification after VC and Duration Predictor Improvement in TTS Models

Borodin Kirill Nikolayevich, Kudryavtsev Vasiliy Dmitrievich, Mkrtchian Grach Maratovich, Gorodnichev Mikhail Genadievich, Korzh Dmitrii Sergeevich

TL;DR该论文介绍了一种自动发言人验证系统，以从目标发言人的音频中提取嵌入信息，用于获取他的声音的重要特征，如音高、能量和音素的持续时间，并在多声音 TTS 流水线中使用该信息。

Abstract

One of the most crucial components in the field of biometric security is the automatic speaker verification system, which is based on the speaker's voice. It is possible to utilise ASVs in isolation or in conjunc

biometric security automatic speaker verification system neural networks voice conversion sstc

发现论文，激发创造

自动说话人验证系统的反欺诈方法

本研究旨在通过分析不同的声学特征空间和分类器，确定可靠和强大的对抗欺骗攻击的措施。实验结果表明，基于深度神经网络（DNN）的方法在欺骗检测任务中获得了相当低的等错误率 (EER)

May, 2017

嵌入空间中语音验证泛化及欺骗感知

通过在嵌入空间中利用有限的训练数据来增强简单的后端分类器，我们提出了通用的独立式自动说话人验证（G-SASV）系统，以对抗欺骗攻击，同时避免在测试（认证）阶段单独使用 CM 模块，在 ASVspoof 2019 逻辑访问数据集中，我们相对统计 ASV 后端在合并（真实和欺骗）和欺骗条件下的性能分别最大提高了 36.2％和 49.8％，以等错误率为指标。

Jan, 2024

自动说话人验证中的防御者视角：一综述

该研究论文旨在全面系统地概述自动说话者验证中用于防御欺诈攻击的方法，包括重播和合成语音，以及对抗性攻击和最近出现的部分假语音。

May, 2023

ASV 系统对抗假冒攻击的自然防御程度如何？

研究了自动说话人验证（ASV）任务中的欺骗攻击，并通过对不同 ASV 系统和欺骗攻击系统的分析，证明了 ASV 系统的进化本质上包含了对欺骗攻击的防御机制。然而，研究还强调了欺骗攻击的进步远远超过了 ASV 系统的进展，因此需要进一步研究针对欺骗攻击的 ASV 方法论。

Jun, 2024

级联自监督学习模型对自动说话者验证的对抗性防御

通过使用级联自监督学习模型可在 ASV 中对抗对抗攻击，并提高自身的鲁棒性。实验结果表明，该方法能在攻击者知道或不知道自监督模型的情况下有效地抵御攻击，提高了防御性能。

Feb, 2021

ASVspoof 2019：欺诈和假音频检测的未来展望

ASVspoof 2019 是社区带领的挑战活动之一，主要关注自动说话人验证（ASV）系统面对欺骗的反制措施，其中考虑了逻辑和物理接入情况，三种欺骗攻击方式，使用神经声学和波形模型生成欺骗攻击，采用双重检测费用函数（t-DCF）对 ASV 系统可靠性进行评估，并囊括了对伪造音频侦测的关注。共有 63 个研究团队参与了此次活动，半数以上的团队报告的系统性能优于两个基线欺骗反制措施。 - 摘自 ASVspoof 2019 的数据库、协议和挑战结果。该工作展示了在反制欺骗和伪造音频方面的实际进展。

Apr, 2019

面向单一集成的防欺骗说话人验证嵌入

本研究旨在开发一种单一的整合了反欺骗技术的演讲者验证嵌入式系统，此系统具备拒绝非目标演讲者及目标演讲者欺诈性输入的能力，而且与融合自动演讲者验证（ASV）及反欺骗对策（CM）嵌入式系统相比，能够具备竞争性的表现。该研究提出的新框架包括多阶段训练与损失函数的组合，并利用多种声码器与合成技术，来回应训练数据不足及短缺欺骗性数据的问题。实验结果表明出色的改善，进而实现了对 SASV2022 挑战赛评估协议的 SASV-EER 低至 1.06% 的性能。

May, 2023

无监督域自适应的防欺骗说话人验证

研究如何提高自动说话人验证系统的欺骗稳健性，主要从基于概率线性判别分析的后端分类器入手，并运用三种无监督领域适应技术来优化它。旨在提高系统在逻辑和物理接近情境下的表现，对于后者，尤其是在被重放音频攻击时，针对真实的和伪造的情况，相对改进率分别达到 36.1% 和 5.3% 接近最高点。除此之外，还进行了一些额外的研究，如攻击分析、数据构成和与高斯后端的分数级别的对策系统的集成分析。

Mar, 2022

SVVAD：用于说话人验证的个人语音活动检测

我们提出了一种基于说话人验证的语音活动检测框架，实现了无标签训练方法并使用三元损失来适应 SV 中最具信息的声学特征。结果表明，相对于传统方案，该框架在混合说话人的条件下明显提高了等误差率，并揭示了人类判断中不同语音部分的重要性。

May, 2023

2020 年语音转换挑战赛主观评级和欺骗性评估的预测

该研究分析了五种客观评估方法对于語音转换（VC）的有效性，并发现与具有客观评估相比，排行榜依赖用户测试的次要评估可能效果较差；同时，还揭示了某些 VC 方法存在潜在的高安全风险。

Sep, 2020