Sep, 2017

学习如何学习: 一种用于增量学习视觉定位词义的自适应对话代理

TL;DR本研究基于强化学习模型,针对生动图像作为学习基础的人机交互场景,训练了一种多模态对话代理,并基于BURCHAK语料库对代理进行了交互式学习和评估,在提高分类器准确性的同时,尽量减少学习过程中的人工操作。结果表明,该代理学习策略的性能超过基于手工定制的策略,并能够与人类模拟器有效协同学习。