Jul, 2019

通过强化学习进行协作多智能体对话模型训练

TL;DR本文利用 DSTC2 数据为种子数据,建立了功能包括:natural language understanding 和 natural language generation 的 conversational agent,并让它们通过生成自然语言进行在线交互,进而将这个交互行为建模成一个随机协作游戏,并在实验中表现出优于 deep learning 的结果。