Apr, 2024

面向一般行为代理的基于数据驱动的目标识别设计

TL;DR目标识别设计旨在在决策环境中作出有限的修改,以使更容易推测在该环境下行动的代理人的目标。我们通过使用数据驱动的方法和基于梯度的优化框架来对目标识别设计进行优化,以解决现有方法中的计算需求和对代理人决策的假设性限制,从而实现对决策环境的改进。