Sep, 2023

使用离线强化学习进行自适应人机界面引导

TL;DR通过离线预训练和在线微调的组合,利用强化学习算法解决噪声命令信号和稀疏奖励的挑战,并通过学习去噪用户命令信号和提供共享自主辅助的方式,使得自适应界面能够成功辅助用户完成任务。