- 大型语言模型:大规模隐私政策分析的新方法
利用大型语言模型(LLM)以替代传统的自然语言处理技术,在较大规模上从隐私政策中高效准确地提取隐私做法,并实现出色的性能评估和降低成本。
- PrivComp-KG:利用知识图谱和大型语言模型进行隐私政策合规性验证
提出了基于大型语言模型和语义网络的隐私合规方法,通过开发隐私政策合规验证知识图谱(PrivComp-KG),有效存储和检索有关隐私政策、法规框架和领域特定知识的全面信息,实现对供应商隐私政策与相关政策法规的合规性查询。
- 法律约束力但不公平吗?评估隐私政策的公平性
本研究论文介绍了一种评估隐私政策公平性的方法,基于文本统计、语言学方法和人工智能,从信息公平性、表征公平性和伦理 / 道德等方面自动评估隐私政策。初步实验结果发现隐私政策存在信息公平性、表征公平性和伦理等方面的问题。
- 使用真实语料库进行数据实践的自动检测和分析
我们提出了一种自动化的方法来识别和可视化不同细节级别的隐私政策中的数据实践,通过利用 ToS;DR 平台的众包注释,我们尝试使用各种方法将政策摘录与预定义的数据实践描述相匹配,进一步进行了一个案例研究来评估我们的方法在真实政策上的有效性,实 - Calpric: 集众包和主动学习的隐私政策全面细粒度标注
Calpric 使用自动文本选择和分割、主动学习和众包注释器相结合的方法,以低成本生成大规模、均衡的隐私政策训练集,使得不具备专业训练的注释者能够与法律学生等经过训练的注释者相竞争,降低注释成本,并通过少量训练样本高效覆盖输入空间,进一步降 - 专家参与:在隐私问答制定过程中建立有效的工作流程
通过将隐私政策转化为隐私问答对,我们提出了一种动态工作流程,以便通过对话人工智能系统轻松获取隐私政策,促进法律专家和对话设计师之间的跨学科合作,并考虑到大型语言模型生成能力的利用及相关挑战,同时强调隐私问答构建过程中的持续改进和监控,并倡导 - PolicyGPT: 使用大型语言模型自动分析隐私政策
通过利用大型语言模型(LLM)开展文本分析,本研究构建了 PolicyGPT 隐私政策文本分析框架,并在两个数据集上进行了测试,结果表明在零样本学习条件下,PolicyGPT 取得了强大的性能,并优于传统机器学习和神经网络模型。
- ATLAS: 自动检测隐私政策和隐私标签之间的不一致性
本文介绍了利用 Automated Privacy Label Analysis System (ATLAS) 系统分析 iOS 应用商店的大量 APP 的隐私政策与隐私标签的一致性,发现了一些潜在的合规问题。ATLAS 有助于帮助开发人员 - 一种基于人机协同的数据稀缺条件下隐私政策信息抽取方法
本文介绍了一种针对隐私政策注释的 “人在回路”(Human-in-the-Loop)原型系统,该系统集成了机器学习生成的建议和最终的人为注释决策,提供了一种特定于数据稀缺性的基于机器学习的建议系统,其提供了有意义的预测,优于其他近期用于法律 - 沙特隐私政策数据集
本研究收集并创建了一份包括来自沙特阿拉伯不同行业的个人数据保护政策的汇编,这些政策经过了根据《个人数据保护法》的 10 项原则进行的注释。最终数据集可以用于评估隐私政策合规性、制定自动化工具以监测数据保护法规遵从性的数据分析。
- 更多数据类型更多问题:隐私政策复杂性、稳定性和敏感性的时间分析
研究了 1997-2019 年间来自隐私政策的大型文本数据集,以调查数据经纪人和数据处理器的数据收集活动。同时,研究开发了一个 PII 相关术语的词汇表,用于识别被收集的数据类型,并通过对隐私政策的稳定性、复杂性和敏感性的 mesoscal - 针对英语隐私政策的语言理解评估基准 PLUE
通过多种任务的评估,我们介绍了隐私政策语言理解评估(PLUE)基准,并收集了大量的隐私政策,以促进未来该领域的研究;同时,我们证明了领域特定的预训练对所有任务都有性能提升。
- 通过答案集编程生成叙述来探索隐私政策的后果
使用 ASP(Answer Set Programming)的框架,将隐私政策形式化为叙事规划空间上的约束,并通过 HIPAA 的范例演示如何使用该系统来询问可能性并确定给定事件序列中违反法律条款的内容。
- 隐私政策问答的检索增强数据增强技术
本文通过集成检索模型和利用多个预训练语言模型及去噪防护,开发了一种新型数据增强框架,以捕获未标记的策略文件中的相关文本段,并扩展训练集中的正面示例。使用此增强数据,该研究在 PrivacyQA 基准测试中将现有水平提高了 10% F1,实现 - ACL隐私政策的意图分类和槽填充
本文提出 PolicyIE 数据集,对比两种基准神经方法处理语义意图分类和信息填充。结果表明序列到序列(Seq2Seq)模型在信息填充任务上优于序列标注方法。
- 隐私政策中模糊词汇和句子的自动检测
该论文旨在使用构建的第一个含人类标注的模糊词汇和句子的语料库,对隐私政策的模糊内容进行自动检测,研究上下文敏感和上下文不敏感模型以及辅助分类生成性对抗网络来表征句子模糊性,研究结果表明所提出的方法有效,并提出解决模糊性和提高隐私政策可用性的 - Polisis: 使用深度学习自动分析和呈现隐私政策
我们提出了一个基于 Polisis 的自动化框架,能够在隐私政策的众多细节方面进行可扩展的、动态的、多维查询。最初的 Polisis 具有一个隐私中心语言模型和神经网络分类器的新等级结构,支持由结构化和自由形式查询支持的两个应用程序:自动分