EMNLPSep, 2021

ConvAbuse: 会话式人工智能中微妙辱骂检测的数据、分析和基准

TL;DR本研究首次对三种对话人工智能系统 (包括一个开放域社交机器人、一个基于规则的聊天机器人和一个任务型系统) 搜集到的辱骂语言进行了英语语料库研究,发现这些系统面临着更多性侵犯色彩的攻击,并进一步测试了现有模型表现,发现 F1 得分不到 90%。