Aug, 2022

将任务特定的概念知识融入脚本学习中

TL;DR本文介绍了 Tetris 任务,它考虑更现实和更通用的设置,其中输入不仅包括目标,还包括附加的用户上下文,包括偏好和历史。为了解决这个问题,我们提出了一种新的方法,它使用两种技术来改进性能:(1)概念提示,和(2)面向脚本的对比学习,解决了步骤重复和幻觉问题。在我们的基于 WikiHow 的数据集上,我们发现两种方法都改善了性能。该数据集,代码仓库和模型将公开提供,以促进对这个新任务的进一步研究。