Jan, 2023

学习多模态环境中物理动作的影响

TL;DR通过加入图像和文本等多种形式的感官信息以及使用对象的潜在表示对 LLM 进行扩展,以更好地预测动作结果,进而推广并学习物理常识推理。