Feb, 2019

让历史有意义:面向视觉对话的历史优势序列训练

TL;DR本文提出一种新的训练方式 History Advantage Sequence Training (HAST),通过引入 Actor-critic 策略梯度思想和历史上错误策略来更好地生成对话回复。此外,通过提出一种新的注意力网络 History-Aware Co-Attention Network (HACAN),该方法在多轮回合的图像对话中表现出了显著的性能提升。