May, 2024

语言瓶颈下的政策学习

TL;DR现代AI系统如自动驾驶汽车和游戏代理实现了超人类的表现,但是通常缺乏类似人类的特征,如泛化能力、可解释性和人机互操作性。我们通过受到人类语言和决策之间丰富交互的启发,引入了Policy Learning with a Language Bottleneck(PLLB)框架,使AI代理能够生成捕捉其最有回报行为背后策略的语言规则。通过在双人通信游戏、解迷任务和两个图像重构任务中展示,PLLB代理不仅能够学习更可解释和具有泛化性的行为,而且还可以与人类用户共享所学规则,实现更有效的人机协调。