Aug, 2019

对话安全的建立、破坏和修复:来自于人类对抗性攻击的鲁棒性

TL;DR本研究以交互式学习的方式开发出一种训练方案,提高自然语言处理在对话中检测攻击性语言的鲁棒性,并证明此方法比前一代系统稳健性更强。同时,该研究表明检测对话中的攻击性语言不能看作是单个句子的任务,必须考虑到对话背景。