语音匿名化对病理学的影响及其局限性

Apr, 2024

语音匿名化对病理学的影响及其局限性

The Impact of Speech Anonymization on Pathology and Its Limits

Soroosh Tayebi Arasteh, Tomas Arias-Vergara, Paula Andrea Perez-Toro, Tobias Weise, Kai Packhaeuser...

TL;DR对匿名化技术在病理性语音中的影响进行了研究，发现它可以增强隐私性，同时强调了为了应对逆向攻击，需要采用定制化方法来平衡隐私和诊断效用。

Abstract

Integration of speech into healthcare has intensified privacy concerns due to its potential as a non-invasive biomarker containing individual biometric information. In response, speaker →

speech anonymization pathological speech privacy demographic fairness

发现论文，激发创造

语音匿名化对基于语音的 COVID-19 检测的影响

本研究关注于一项针对基于语音的 COVID-19 诊断的健康监测应用，测试了两种常见的匿名化方法并将其应用于三个公共数据集，验证了匿名化方法的有效性并量化了在不同测试场景下的影响，最后展示了匿名化作为数据增强工具的益处。

Apr, 2023

匿名化语音：评估和设计说话人匿名化技术

该论文讨论了语音用户界面的增长，以及由此带来的语音数据收集和存储问题。研究提出了匿名化语音和度量匿名程度的解决方案，并介绍了评估协议需要考虑的挑战，最后探讨了一种新的攻击方法以逆转匿名化。

Aug, 2023

评估说话人匿名在情感语音上的效果

该研究研究了在语音隐私保护的 VoicePrivacy 2020 Challenge 中对说话人匿名化基线系统对语音情感信息的影响，结果表明该系统对知情攻击者未能抑制说话人的情感，且匿名化后的语音相比原始语音情感识别性能下降了 15%，与其保留语言信息的评估方式使用自动语音识别得到的结果类似。

Apr, 2023

临床文本处理中哪种匿名技术最好？──这要看任务。一项系统研究

探究匿名化技术对多种 NLP 任务中 ML 模型性能的影响，旨在寻找更好的匿名化技术，同时发现一些技术并不能有效避免由相似性搜索发起的重新识别攻击。

Sep, 2022

评估基于语音转换的隐私保护对抗已知攻击者的有效性

本文考察了基于语音转换的匿名化方法，在三种攻击情景中比较了两种基于频率扭曲的转换方法和一种基于深度学习的方法，结果表明语音转换方案不能有效地防止具有广泛知识的攻击者，但可能为不太熟悉的攻击者提供一定的保护。

Nov, 2019

基于对说话人嵌入进行对抗扰动的异步语音匿名化

本文研究声音匿名化技术，重点探讨改变语音特征以防止机器识别但保留人类感知的异步声音匿名化方法，采用包含说话人解缠机制的语音生成框架生成匿名语音，并通过对说话人嵌入进行对抗扰动改变说话人特征，同时通过控制扰动强度保留人类感知。实验结果表明，在 LibriSpeech 数据集上处理的 utterances 中，60.71％的处理结果达到了说话人特征的匿名化且保留了人类感知。

Jun, 2024

大型语言模型在临床文本匿名化中的潜力开发：一项比较研究

自动化临床文本匿名化有潜力在保护患者隐私和安全的同时促进医疗数据的广泛共享，本论文提出了基于大型语言模型的新评估指标，并通过与基准技术的比较研究证明了大型语言模型在临床文本匿名化领域的可靠性，为可信的临床文本匿名化铺平了道路。

May, 2024

使用 f0 轨迹的函数数据分析提高说话人去识别能力

本研究提出了一种新颖的说话者去识别方法，采用简单的共振峰偏移和基于函数数据分析的 f0 轨迹操作，可以在音素可控的方式下掩盖潜在的识别音调特征，提高了基于共振峰的语音匿名度最多达 25%。

Mar, 2022

低延迟语音匿名化端到端流模型

提出了一种流式模型来实现低延迟的说话人匿名化，通过使用轻量级内容编码器、预训练的说话人编码器和变化编码器，将语音信息解耦为语音内容、说话人身份和音调能量信息，并通过解码器重新合成语音信号，该模型实现了 230ms 的延迟，并在自然性、可理解性和隐私保护方面保持了最先进的性能。

Jun, 2024

自动病理说话检测中的语音模式影响

自动病理性言语检测方法在识别不同病理情况方面表现出有希望的结果。本文研究了言语模式对于自动病理性言语检测方法的影响，并对传统机器学习和深度学习两类方法进行了分析。结果表明，传统方法在捕获自发言语中的病理鉴别线索方面存在困难，相比之下，深度学习方法表现出更高的性能，能够提取在非自发言语中无法获得的额外线索。

Jun, 2024