Nov, 2022

利用强化学习进行并行自动历史匹配算法

TL;DR通过将历史匹配问题从最小二乘数学优化问题转化为马尔可夫决策过程,引入了一种方法,可以利用强化学习来解决该问题,从而实现了人工深度神经网络代理与油藏模拟器的交互,找到多个不同的解决方案。这种方法允许通过启动多个并发环境并行解决问题,使代理同时从所有环境中学习,从而实现了显著的加速。