Jul, 2022

一种基于强化学习的聊天机器人攻击性语义审查系统

TL;DR本研究提出了一种基于强化学习的语义审查聊天机器人系统,由攻击性语义审查模型和清洗模型两部分组成。通过集成一次性学习方法,加快了语义净化速度,同时减少了对回复质量的影响,实验结果表明,本方案降低了聊天模型生成攻击性回复的概率,并有效地减缓了BLEU值下降。