Sep, 2018

神经序列到序列模型中检测极端响应

TL;DR本文通过实证方法,设计了离散优化算法,有效地找到了会导致训练良好的离散空间神经网络序列到序列模型生成攻击性文本输出的输入序列,以及针对真实世界用户的输入序列。 通过在通话响应生成模型上进行实验,发现部分触发语句可以让得出的结果是有攻击性的。