BriefGPT.xyz
Ask
alpha
关键词
misgeneralization
搜索结果 - 2
强化学习中的颜色对形状目标误泛化:一项案例研究
探讨了 Di Langosco 等人在 Procgen Maze 环境中最初展示出的颜色与形状目标错误泛化,即在一个模棱两可的选择中,代理人似乎更喜欢基于颜色而不是形状的泛化。训练了 1000 多个代理并在超过 1000 万个回合中对其进行
→
PDF
7 months ago
ICML
深度强化学习中的目标错泛化
本文研究强化学习中的一种广义泛化失败 —— 目标错误泛化。在此类失败中,强化学习代理在越出分布的情况下保留其能力,但追求错误的目标。我们阐明了能力和目标泛化之间的差别,提供了目标错误泛化的第一次经验演示,并对其原因进行了部分表征。
PDF
3 years ago
Prev
Next