dynamic reward | BriefGPT - AI 论文速递

关键词dynamic reward

搜索结果 - 1

情景感知交通规则例外的知情强化学习
应用有结构的规则书与情景感知奖励设计，我们引入了 Informed Reinforcement Learning，通过学习轨迹使代理能够学习需要控制交通规则例外的情况，并在自动驾驶领域中展示了高完成率。
PDF5 months ago