MMSep, 2018

具有连贯言者的交互世界中的交流出现

TL;DR本文提出了一种新的模型和训练算法,在以原始像素为输入的环境中,利用学习到的表征空间的结构产生更一致的发言者,稳定学习,并提出了一种用于度量文本独立性的新型基于对齐的指标,相比策略梯度和其他竞争基线,我们的算法在通信效果方面有了大幅提升。