Nov, 2023

使用强化学习近似凸包

TL;DR使用随机控制方法估计非凸函数的凸包问题,并基于此开发了强化学习方案来近似凸包,使用改进的 Q 学习方法进行控制性最优停止,在标准测试题库上取得了非常有希望的结果。