- EMNLPSYSML:带有结构和多任务学习的样式学习:对暗网论坛移民分析的影响
本研究利用基于样式的多任务学习方法来进行对用户活动的作者归属度量,进而在四个不同的暗网论坛上取得了比现存算法更好的效果。
- SIGIRPchatbot: 用于个性化聊天机器人的大规模数据集
介绍了 Pchatbot 数据集,该数据集是从微博和司法论坛等地收集的大规模对话数据集,通过去重、标准化、过滤等过程来适应对话系统,提供匿名用户 ID 和时间戳等隐私保护技术,为未来的个性化对话模型提供基础,公开在 Github 上。
- CVPRCIAGAN: 有条件身份匿名的生成对抗网络
该论文提出了一种基于条件生成对抗网络的图像视频去标识化模型 CIAGAN,可以同时保证匿名性和多样性,用于保护隐私并在计算机视觉任务中得到高质量处理结果。
- X-vector 基础发言人匿名化的设计选择
本文针对 VoicePrivacy Challenge 设计了一种基于 x-vector 的柔性伪说话人选择技术,并探索了多种设计选择以评估它的匿名化和实用性,同时使用 LibriSpeech 数据集进行实验,报告了匿名数据的 Equal - 引入 VoicePrivacy 计划
VoicePrivacy 倡导发展语音技术的隐私保护工具,在声音匿名化任务和相关数据集和攻击模型等方面提出挑战,并报告了基于两个匿名化基线的客观评估结果。
- 评估基于语音转换的隐私保护对抗已知攻击者的有效性
本文考察了基于语音转换的匿名化方法,在三种攻击情景中比较了两种基于频率扭曲的转换方法和一种基于深度学习的方法,结果表明语音转换方案不能有效地防止具有广泛知识的攻击者,但可能为不太熟悉的攻击者提供一定的保护。
- DeepPrivacy:一种用于人脸去识别的生成性对抗网络
该研究提出了一种基于条件生成对抗网络的新型体系结构,可以在保留原始数据分布的同时自动地对图像中的人脸进行匿名处理,以隐私安全信息为基础生成图像实现了对图像中所有人脸的完全匿名化,并且引入了包括非传统姿势、遮挡脸部和背景变化巨大的人脸数据集。 - 移动传感器数据匿名化
通过信息论方法,设计并使用多目标损失函数训练基于自编码器的移动设备上的传感器数据匿名化方法,实现了保护用户隐私的同时,仍具备监测用户选择日常活动的应用工具。
- GANs 重建匿名化面部特征的 Refacing 技术
本研究利用 CycleGAN 无监督图像转换框架,分别对面部有模糊和无脸部的 T1 MR 图像进行匿名化测试。结果表明,进行脸部模糊可能无法提供足够的保护措施,而脸部去除虽然提供更强的匿名化保护,但仍部分可逆。
- ACL改进文本到 SQL 评估方法
为了评估系统在现实世界中未见数据上的泛化能力,本文首先比较了人工生成和自动生成的问题,提出了当前 Text-to-SQL 系统评估的局限性和改进方法。其次,我们展示了现有数据集分为训练集和测试集的方法只能部分测试系统对新查询的泛化能力,因此 - 基于生成对抗网络的数据合成
该研究提出了一种名为 table-GAN 的方法,使用生成对抗网络(GANs)合成伪造表格,用于保证数据匿名性和模型兼容性。实验证明,该方法在隐私和模型兼容性之间取得平衡,同时解决了数据泄露问题。
- IJCAI通过对抗扰动匿名化 k 面部属性
本文提出了一种新颖的算法,通过对面部图像进行不可感知噪声的添加,从而实现对用户选择的关键属性的匿名化处理,既可以匿名关键属性,又能保护图像质量和身份信息。
- SIGIRSynTF: 用于隐私保护文本挖掘的合成和差分私有词项频率向量
本文提出了一种基于向量空间模型的自动化文本匿名化方法,可用于保护作者的身份,并且实现了差分隐私,防止被重新辨认。实验结果表明此方法对于文本分类任务的准确性影响较小,但对于作者识别技术的准确性影响很大。
- 使用对抗神经网络学习匿名表示
本研究探讨基于表示学习和深度神经网络的匿名化方法,介绍了一种新的训练目标,同时训练一个预测器和防止中间表征成为私有标签的预测值。该三子网络的基架对应输入到表征、表征到预测的常规标签和表征到预测的私有标签。在保留有关常规标签的信息的同时,摒弃