Mar, 2022

面向稳健的在线对话响应生成

TL;DR通过采用分层抽样的方法,引入了强化学习和重新排序机制,以提高聊天机器人在实际应用场景中的鲁棒性,并缓解聊天机器人在多轮对话中生成不一致响应的问题。