BriefGPT.xyz
大模型
Ask
alpha
关键词
pacoh-rl
搜索结果 - 1
通过概率模型为基础的元强化学习实现数据高效的任务泛化
PACOH-RL 是一种基于模型的元强化学习算法,用于有效地适应控制策略对变化的动力学。它通过元学习动力学模型的先验知识来实现对新动力学的快速适应,同时利用正则化和认知不确定性量化来引导探索和数据收集,从而在数据有限的情况下实现正向传递,适
→
PDF
8 months ago
Prev
Next