BriefGPT.xyz
Ask
alpha
关键词
dynamic reward
搜索结果 - 1
情景感知交通规则例外的知情强化学习
应用有结构的规则书与情景感知奖励设计,我们引入了 Informed Reinforcement Learning,通过学习轨迹使代理能够学习需要控制交通规则例外的情况,并在自动驾驶领域中展示了高完成率。
PDF
5 months ago
Prev
Next