- 减轻举报人重新识别风险的半自动化文本清理工具
我们提出并评估了一种用于重写文本的分类和缓解策略,该策略涉及向揭发者征求风险和实用性评估,并使用微调的 LLM 进行复述,能够显著降低作者归属攻击的准确性,同时保留原始内容语义的多达 73.1%。
- 分析深度对话中的有害性:Reddit 案例研究
使用基于树的方法分析在线社交媒体上用户对有害内容的行为和上下文,研究发现毒性评论会增加在线对话中产生后续毒性评论的可能性,并观察到在用户行为和模式方面,共识亵渎与非共识亵渎存在重叠的相似性。
- 加密货币交易与在线金融论坛之间的相互作用
加密货币论坛与比特币价值波动之间的相互作用的研究,强调论坛数据能够解释金融领域的特定事件,并且强调在某些话题集中讨论、比特币价格触顶以及价格下跌时的引用的相关性。
- 以 UID 作为自动作者混淆的指标
在这篇论文中,我们通过利用统一信息密度(UID)理论,设计了三种小说的作者模糊化方法,并通过对 50 篇人工文章和 50 篇 GPT-3 生成文章进行模糊化,观察了每种方法对误导作者识别器的效果,虽然在语义保留和意义变化方面模糊化的质量较高 - 利用深度强化学习的反事实图搜索进行社区成员隐藏
通过深度强化学习,本研究提出了一种将社区成员隐藏作为约束反事实图目标的方法,并在节点和社区欺骗两个任务上对其有效性进行了验证。实验证明,该方法在两个任务中总体优于现有基线模型。
- 抵御作者身份识别攻击
作者身份辨识的有效性为人所知,在未签名的文档中推断出作者的身份,即使敏感个人信息已被小心地省略。在数字时代,个人通过其书面内容留下持久的数字足迹,无论是在社交媒体上发布,存储在雇主的计算机上,还是其他地方。当个人需要公开交流但希望保持匿名时 - 大语言模型的重新识别能力评估:匿名性受到威胁吗?
匿名性在欧洲联盟和瑞士的隐私保护中是一个关键方面。本研究探索了 LMLs 在法院判决中重新识别个人的潜力,并使用瑞士联邦最高法院的实际法律数据构建了一个概念验证。此研究表明,目前利用 LLMs 进行重新识别可能无法实现,但通过在维基百科上的 - 延迟、组合和部分匿名回报的强化学习
本文研究了具有延迟、组合和部分匿名奖励反馈的无限期望回报马尔可夫决策过程,并提出了名为 DUCRL2 的算法来获得近似最优策略,并证明其达到了类似于 ODS 的遗憾界。
- 利用图神经网络揭示比特币地址行为
本文提出了一种基于机器学习的比特币地址分类工具 BAClassifier,该工具利用地址图结构和特征网络,对比特币地址行为进行自动分类,实验结果表明该方法在比特币地址分类上表现优秀,可有效提高识别比特币网络中恶意交易的能力。
- Neural-FacTOR: TOR 匿名下的网站指纹识别攻击的神经表征学习
本文提出了一种基于卷积神经网络的网站指纹识别攻击模型,实现了对 TOR 网络中的网站匿名性的破解,相比现有方法提高了 12.21% 的准确率。
- 对对抗文体学实验的再现与复制
该研究旨在探讨防止作者识别的方法,在复制一个初步研究中的实验条件和结果时,验证了完全自动的转换方法可能会降低已有的作者识别方法的有效性。
- 最公平的选举规则
本研究旨在解决社会选择中的匿名性、中立性和可解决性之间的关系,提出了最公平的细化概念,并针对排名表和委员会设计了可满足匿名性、中立性和可解决性的投票规则及算法。
- 编码、洗牌、隐私分析再探讨:正式化及实证评估
通过 Encode-Shuffle-Analyze 框架,本文提供了隐私保护报告的正式处理方式和指南,并在真实世界数据集上进行了大量实验来展示该方法的应用和局限性,包括匿名性、差别隐私和数据分片等。
- 从局部到中心差分隐私的扩大:通过匿名化实现
本文研究了本地差分隐私模型下敏感统计信息的收集,提出了一种算法,其隐私成本与用户值的更改数量的对数成正比。通过匿名化用户报告,基于用户报告的匿名性,我们还展示了当以中心式差分隐私模型来看待时,我们的 LDP 算法的隐私成本实际上会更低。通过 - 深入探究匿名性:Quora 问题的大规模分析
通过 5.1 万个问题的分析,揭示了社交问答平台 Quora 上匿名和非匿名问题的差异:匿名问题的提问者更倾向于谈论抑郁、焦虑以及个人的问题,且匿名群体与外向性、宜人性呈现正相关,与开放性质呈现负相关;此外,对于个人与敏感问题的回答,社区支 - Gradient-Leaks: 理解和控制联邦学习中的去匿名化
本文介绍了联邦学习(FL)系统,探讨了通过个人设备(例如智能手机)收集的大规模用户数据进行机器学习(ML)模型的训练,以及其匿名用户设备共享训练信息的核心部分,还讨论了利用数据混合等手段防范匿名化攻击。
- 当 Cookie 遇上区块链:通过加密货币进行网络支付的隐私风险
展示了第三方 web 追踪器如何解匿名加密货币的用户,并呈现了两种不同但互补的攻击方法。
- 平凡也非凡:一种普通化的风格掩盖和作者混淆方法的论证
提出了一种改变文本的方法以减少样式特征的差异。该方法能有效地保护作者的匿名,并在 PAN-2016 竞赛的作者混淆任务中获得最佳表现。
- 在 Verdict 中主动对匿名消息负责
Verdict 利用公钥密码学构建了前向可验证的 DC 网络,支持匿名组通信,速度达到每轮 1 秒 / 100 个客户端或每轮 10 秒 / 1,000 个客户端,并实现了对失信行为的快速识别。
- 社交网络去匿名化
介绍了一种分析社交网络中隐私和匿名性的框架,并开发了一种新的针对匿名化社交网络图的重新识别算法。此算法纯基于网络拓扑,无需创建大量虚假节点,可对抗噪声和所有现有防御,哪怕目标网络与攻击者的辅助信息之间的重叠很小。