Mar, 2025

基于信息价值的对抗性干预下的欺骗路径规划的价值

TL;DR本研究解决了现有欺骗路径规划方法无法处理对抗性干预的问题,提出了一种基于马尔可夫决策过程的新模型。通过引入信息价值目标,使路径规划代理能够诱使对手选择次优干预,从而显著提升了在对抗性环境下的欺骗效果,并在实验中验证了其优越性能。