Mar, 2024

通过逆事实扰动将语言计划与演示相结合的基础

TL;DR利用大型语言模型对物理领域中的常识推理进行基础性指导和解决工作,通过任务结构和约束的搜索,使用人类示范和模拟干扰生成覆盖训练数据集,并通过解释性学习方法来提高模仿学习的可解释性和反应性。