Sep, 2023
使用离线强化学习进行自适应人机界面引导
Bootstrapping Adaptive Human-Machine Interfaces with Offline Reinforcement Learning
Jensen Gao, Siddharth Reddy, Glen Berseth, Anca D. Dragan, Sergey Levine
TL;DR通过离线预训练和在线微调的组合,利用强化学习算法解决噪声命令信号和稀疏奖励的挑战,并通过学习去噪用户命令信号和提供共享自主辅助的方式,使得自适应界面能够成功辅助用户完成任务。