Apr, 2022

隐私政策问答的检索增强数据增强技术

TL;DR本文通过集成检索模型和利用多个预训练语言模型及去噪防护,开发了一种新型数据增强框架,以捕获未标记的策略文件中的相关文本段,并扩展训练集中的正面示例。使用此增强数据,该研究在 PrivacyQA 基准测试中将现有水平提高了 10% F1,实现了 50% 的新水平。(其中,F1 是一种综合度量,用于评估二元分类器的准确性。)