Oct, 2023

使用Sum-GP-UCB估计相互作用物体的材料属性

TL;DR机器人需要从观察中估计物体的材料和动态特性,本研究提出了基于贝叶斯优化的方法来识别物体的材料属性参数,通过对不同场景下互动物体的观察进行估计,利用奖励函数的结构,仅使用场景中对象的参数作为输入,得到更好的广义模型来加速优化过程,还通过部分评估奖励函数来减少仿真运行次数,实验证明该方法能够有效进行增量学习而不重置奖励。