Feb, 2022

学习推理和行动物理级联事件

TL;DR介绍了一个称为 “Cascade” 的新型监督学习框架,使用基于事件的前向模型和语义树搜索算法来教会 AI 在复杂的动态环境中进行干预,并推动级联式事件触发达到特定的 “反事实” 目标,从而有效地遵循指令。