Dec, 2023

朝着计算高效的逆强化学习方向进发:通过奖励塑形

TL;DR逆向强化学习是具有计算挑战性的,常见方法需要解决多个强化学习子问题。本研究激励使用基于潜力的奖励塑造来减轻每个强化学习子问题的计算负担,并希望能激发未来对计算效率高的逆向强化学习的发展。