Sep, 2023

迈向人类化强化学习:通过 3D 游戏中自适应行为成本驯服非自然行为

TL;DR通过对行为限制的自适应行为成本,提出了一种新的方法称为自适应行为成本在强化学习中(ABC-RL)来训练一种具有竞争力的类人代理,以达到与人类相似的表现和行为水准。