关键词goal-directed behavior
搜索结果 - 4
- 自然语言子目标的层次强化学习
我们提出了一种新颖的方法,利用人类在 3D 实体环境中解决任务时使用的无约束自然语言数据,通过软约束目标空间,对一组长期任务进行层次强化学习,从而实现在现实或开放环境中实现目标导向行为的挑战。
- 习惯和目标的协同作用:行为的变分贝叶斯框架
该研究提出了一种使用变分贝叶斯理论桥接惯常性和目标导向性行为相互作用的框架,通过引入用于生成习惯性行为的意图先验分布和用于生成目标导向性行为的意图后验分布的贝叶斯潜变量,实现了两种行为的技能共享,并且其能够使代理程序轻松地从习惯性行为泛化到 - 主动采样学习多任务
提出了一个高效的多任务学习框架,该框架采用主动学习原则来解决多个目标导向任务的问题,通过对 7 个多任务实例进行测试,实现了竞争性的多任务表现。
- 协作参照表达
本文提出了一个计算模型,探讨了会话参与者如何协作以使指称行为成功,使用规划法建立指称表达式和确认其标识参照物的过程,并提出了如何使用元操作来澄清指称表达式及其成果以及计划如何影响行动代理的问题。