Jan, 2024

快慢思维的语言条件下的机器人操作

TL;DR通过模仿人类认知结构,我们引入了一种名为 RFST 的框架,该框架利用语言指令对任务进行分类并基于指令类型做出决策,包含指令鉴别器和一个与策略网络相匹配的精调视觉语言模型,可以识别用户意图或执行推理任务,我们的实验结果验证了我们的方法在需要意图识别和推理的复杂任务中的出色表现。