Apr, 2023

多目标多智能体决策中的演示推理

TL;DR本研究提出了一种算法,能够从优化或接近最优演示中推断出线性优先权重,并在三个环境中进行评估。经验证实,相对于基线算法,该算法在时间需求和推断偏好的准确性方面都有显著的改进。未来,我们计划在多智能体系统中评估该算法的有效性,其中一个智能体能够使用我们的偏好推断算法推断对手的偏好。