Jul, 2023

NetHack 中模仿学习的规模定律

TL;DR探究模型和数据规模的逐渐扩大对模仿学习的影响,以 NetHack 游戏为基础,发现模仿学习在具有挑战性的领域中的扩展行为,以及在 NetHack 游戏中扩大当前方法以获得更强大的智能体的可行性。