语音匿名化对病理学的影响及其局限性
本研究关注于一项针对基于语音的 COVID-19 诊断的健康监测应用,测试了两种常见的匿名化方法并将其应用于三个公共数据集,验证了匿名化方法的有效性并量化了在不同测试场景下的影响,最后展示了匿名化作为数据增强工具的益处。
Apr, 2023
该论文讨论了语音用户界面的增长,以及由此带来的语音数据收集和存储问题。研究提出了匿名化语音和度量匿名程度的解决方案,并介绍了评估协议需要考虑的挑战,最后探讨了一种新的攻击方法以逆转匿名化。
Aug, 2023
该研究研究了在语音隐私保护的 VoicePrivacy 2020 Challenge 中对说话人匿名化基线系统对语音情感信息的影响,结果表明该系统对知情攻击者未能抑制说话人的情感,且匿名化后的语音相比原始语音情感识别性能下降了 15%,与其保留语言信息的评估方式使用自动语音识别得到的结果类似。
Apr, 2023
探究匿名化技术对多种 NLP 任务中 ML 模型性能的影响,旨在寻找更好的匿名化技术,同时发现一些技术并不能有效避免由相似性搜索发起的重新识别攻击。
Sep, 2022
本文考察了基于语音转换的匿名化方法,在三种攻击情景中比较了两种基于频率扭曲的转换方法和一种基于深度学习的方法,结果表明语音转换方案不能有效地防止具有广泛知识的攻击者,但可能为不太熟悉的攻击者提供一定的保护。
Nov, 2019
本文研究声音匿名化技术,重点探讨改变语音特征以防止机器识别但保留人类感知的异步声音匿名化方法,采用包含说话人解缠机制的语音生成框架生成匿名语音,并通过对说话人嵌入进行对抗扰动改变说话人特征,同时通过控制扰动强度保留人类感知。实验结果表明,在 LibriSpeech 数据集上处理的 utterances 中,60.71%的处理结果达到了说话人特征的匿名化且保留了人类感知。
Jun, 2024
自动化临床文本匿名化有潜力在保护患者隐私和安全的同时促进医疗数据的广泛共享,本论文提出了基于大型语言模型的新评估指标,并通过与基准技术的比较研究证明了大型语言模型在临床文本匿名化领域的可靠性,为可信的临床文本匿名化铺平了道路。
May, 2024
本研究提出了一种新颖的说话者去识别方法,采用简单的共振峰偏移和基于函数数据分析的 f0 轨迹操作,可以在音素可控的方式下掩盖潜在的识别音调特征,提高了基于共振峰的语音匿名度最多达 25%。
Mar, 2022
提出了一种流式模型来实现低延迟的说话人匿名化,通过使用轻量级内容编码器、预训练的说话人编码器和变化编码器,将语音信息解耦为语音内容、说话人身份和音调能量信息,并通过解码器重新合成语音信号,该模型实现了 230ms 的延迟,并在自然性、可理解性和隐私保护方面保持了最先进的性能。
Jun, 2024
自动病理性言语检测方法在识别不同病理情况方面表现出有希望的结果。本文研究了言语模式对于自动病理性言语检测方法的影响,并对传统机器学习和深度学习两类方法进行了分析。结果表明,传统方法在捕获自发言语中的病理鉴别线索方面存在困难,相比之下,深度学习方法表现出更高的性能,能够提取在非自发言语中无法获得的额外线索。
Jun, 2024