BriefGPT.xyz
Ask
alpha
关键词
feynman-kac type probabilistic representation formulae
搜索结果 - 1
关于策略改进算法的收敛性和收敛速度
该论文提供了一个简单的证明,从头开始验证了连续时间熵正则化随机控制问题的策略改进算法的收敛性。通过利用 PIA 所涉及的迭代 PDE 中的复杂 PDE 估计,Huang-Wang-Zhou (2023) 已经建立了这样的收敛性。我们的方法基
→
PDF
20 days ago
Prev
Next