Jul, 2024

通过世界动态建模增强智能体学习

TL;DR本研究解决了现有大型语言模型在理解环境动态方面的知识缺口。我们提出了DiVE框架,能够从少量示范中发现世界动态并验证其正确性,从而发展出适应当前情境的动态。研究表明,借助DiVE的智能体在决策上表现更优,达到了与人类玩家相当的奖励水平。