Dec, 2023

通过最大化证据推断行动:从观察中无标签模仿的世界模型

TL;DR通过最大化证据的行动推理(AIME)和世界模型,在不需要进一步训练或与环境在线交互的情况下,通过观察和模仿他人的行为实现零 - shot 模型的人工智能代理。