Apr, 2024
揭开晦涩法律用语的面纱:自动化方法用于隐私政策和服务条款的摘要和重叠分析
Demystifying Legalese: An Automated Approach for Summarizing and Analyzing Overlaps in Privacy Policies and Terms of Service
Shikha Soneji, Mitchell Hoesing, Sujay Koujalgi, Jonathan Dodge
TL;DR我们的研究致力于通过开发语言模型来为合同和政策文件提供自动化、易于理解的摘要和分数,以增强用户理解,促进知情决策。我们在数据集上比较了基于 Transformer 和传统模型,RoBERTa 整体表现更好,达到了 0.74 的 F1 分数。利用我们表现最佳的模型 RoBERTa,我们通过识别 GDPR 文件的重叠部分突出了冗余和潜在的指导方针违规情况,强调了对更严格 GDPR 合规性的必要性。