Feb, 2022

基于数据驱动的计算机控制学习方法

TL;DR该研究使用强化学习和行为先验相结合的方法,以自然语言指定目标,实现了最新的并具有人类水平的表现,并证明了在训练机器使用计算机时,统一的人机界面是非常有用的。