Jan, 2022

对抗性环境下的 Q&A 演员 - 评论家网络

TL;DR该论文介绍了一种基于强化学习框架,将生成对抗性数据的目的与修改现有架构以建立稳健性的两个重点领域相结合的方法,使用 Adversarial SQuAD “Add One Sent” 数据集表明该方法在保护免受对抗性攻击方面有某些有希望的迹象。