Nov, 2023

交互式自主导航与内部状态推断及交互度估计

TL;DR通过引入空间 - 时间相关推理等辅助任务,将深度强化学习框架与神经网络结合,以提高智能代理(如自动驾驶车辆)在复杂场景中的决策性能和可解释性。首次通过推理和预测他人行为,确定他们对自身行为的影响程度,提供了详尽的中间指标用于决策制定。