BriefGPT.xyz
大模型
Ask
alpha
关键词
rich sensory inputs
搜索结果 - 1
学习抽象世界模型用于值保持规划和选项
通过学习抽象 MDP(Markov 决策过程)来提高智能体在多任务环境中的决策和学习效率。
PDF
12 days ago
Prev
Next