Feb, 2024

基于原则的惩罚方法在双层强化学习和 RLHF 中的应用

TL;DR通过惩罚的形式引入首个系统的算法框架,解决了新的双层强化学习问题,包括激励设计、逆向强化学习和人类反馈强化学习,通过在 Stackelberg Markov 游戏、人类反馈强化学习和激励设计中的模拟验证了算法的有效性。