BriefGPT.xyz
Ask
alpha
关键词
skill composition
搜索结果 - 2
学习理解:模块化算术任务中上下文学习和技能组合的出现
通过研究模块化算术任务中上下文学习和技能组合的出现,我们证明了 GPT-style transformer 模型从分布内到分布外泛化的转变,也发现了最小的能够进行分布外泛化的模型需要两个 transformer 块。
PDF
a month ago
ICLR
使用深度强化学习组合无关任务的策略
本文介绍了一种基于深度强化学习的技能转移和组合方法,该方法将智能体的原始策略应用到解决未知任务中,并可在高数据效率下解决需要任务规划和动作控制的挑战性环境。
PDF
5 years ago
Prev
Next