Jul, 2023

基于机器人的 POMDP 的贝叶斯强化学习

TL;DR该论文提出了一个面向物理系统的专门框架,利用 Bayesian reinforcement learning(BRL)和专家知识对机器人的学习进行优化,实现了在人机交互任务中的快速学习和处理环境中的不确定性。