基于模型的高斯过程演示学习
本文介绍了一种基于用户反馈的偏好学习方法,利用高斯过程 (GP) 对奖励函数进行建模,在不增加结构限制并避免数据不足和刚性的问题的情况下,仅通过比较轨迹即可有效学习机器人任务的表达性奖励函数。
May, 2020
本文提出了一种解决多输出高斯过程模型主类型和相关环境现象多种共存的主动学习问题的方法,该问题涉及选择最具信息量的采样位置和每个位置的测量类型,以在预算范围内最小化目标感兴趣的预测不确定性(即后验联合熵),为了解决优化时的问题,我们利用了稀疏 MOGP 模型的常见结构,推导出一种新的主动学习准则,并利用新准则的放松形式子模性质,设计了一种多项式时间近似算法,实证评估表明我们的方法优于 MOGP 和单输出 GP 模型的现有算法。
Nov, 2015
高斯过程学习模型预测控制(GP-MPC)系统地介绍了一种先进的方法,将高斯过程(GP)与模型预测控制(MPC)相结合,以提高复杂系统中的控制效果。它从 GP 回归基础知识开始,说明了它如何提高 MPC 的预测准确性和鲁棒性处理。本教程的一个重点贡献是对 GP-MPC 进行了首次详细、系统的数学形式化,重点关注了推导用于 GP 多步预测的均值和方差传播近似方法。通过讨论在机器人控制中的实际应用,如移动机器人在具有挑战性的地形中的路径跟随和混合车辆编队等,展示了 GP-MPC 的实际有效性和适应性。本教程旨在使 GP-MPC 对研究人员和实践者更加易于理解,为学习控制领域提供深入的理论和实践洞察,并促进复杂系统控制领域的进一步创新。
Apr, 2024
本文提出了一种使用高斯过程回归模型的模型预测控制方法,用于建模非线性动态系统并计算模型残差不确定性以实现谨慎控制。通过近似计算实现计算效率,并在模拟实验和硬件实现中展示了该方法在自主赛车方面的表现改进。
May, 2017
提出了一种基于高斯过程(GP)的模型,用于主动检测未来运动规划失败的风险,并在风险超过阈值时触发恢复行为来从事实现目标的安全状态。该方法仅在仿真环境中进行训练,并可以泛化到不同机器人平台的实际环境中。仿真和物理实验证明了该框架既能预测规划器的失败,又能将机器人恢复到可能成功规划的状态,并以敏捷的运动方式进行操作。
Feb, 2024
该研究介绍了一种新型模型,称为潜在变量多输出高斯过程 (LVMOGP),该模型可以捕捉多种条件的潜在信息,实现在测试时对新条件的有效推广,并提出了高效的变分推断方法,该方法的计算复杂度低于稀疏高斯过程。研究表明,在多个任务中,LVMOGP 在合成和真实数据上表现优异,并比相关的高斯过程方法优异。
May, 2017
本文介绍了一种模型基于策略搜索的自动学习方法,使用概率非参数高斯过渡模型从数据中提取更多信息,以提高学习速度并降低模型误差的影响,已在真实机器人和控制任务中得到了应用。
Feb, 2015
该研究论文提出了一个扩展多输出高斯过程(MOGPs)用于分层数据集的方法,通过定义适合层次结构的核函数来捕捉不同层次的相关性,并通过引入潜在变量表达输出之间的潜在依赖关系,以提高可扩展性。通过合成数据和基因组学以及动作捕捉的真实世界数据进行了广泛的实验研究,以支持该方法。
Aug, 2023