Nov, 2023
具有状态约束的两人对称差分博弈的价值逼近
Value Approximation for Two-Player General-Sum Differential Games with State Constraints
Lei Zhang, Mukesh Ghimire, Wenlong Zhang, Zhe Xu, Yi Ren
TL;DR使用三种方法解决了物理信息机器学习方法在机器人应用中由于采样性质而产生的不连续解的问题,并在 5D、9D 车辆模拟和 13D 无人机模拟中证明了混合方法在泛化和安全性能方面的优越性。