Jun, 2023

McKean-Vlasov 控制问题的连续时间 q 学习

TL;DR本文研究连续时间 McKean-Vlasov 控制问题中的 q-learning 方法,探究了其定义及两种不同的 q 函数,提出了相应的学习算法,并在金融应用中进行了模拟实验。