Jan, 2024

在连续空间中集成人类专业知识:一种新颖的交互式贝叶斯优化框架与偏好预期提升

TL;DR交互式机器学习(IML)旨在将人类专业知识整合到机器学习过程中。我们提出了一种基于贝叶斯优化(BO)的新框架,即交互式贝叶斯优化(IBO),以实现机器学习算法和人类之间的协作,以确保机器能够从人类专业知识中受益,实现更加协调和有效的学习过程,并通过模拟和使用 Franka Panda 机器人在真实世界任务中展示人机协作。