Mar, 2022

深度强化学习优化地下系统不确定地质条件下的井控

TL;DR本文提出了一种基于深度强化学习(DRL)的一般控制策略框架,用于地下流动环境中的闭环决策制定。针对数据同化 / 历史匹配和鲁棒优化步骤中的挑战,将闭环油藏管理(CLRM)问题表示为一个部分可观察的马尔科夫决策过程,并使用近端策略优化算法来解决相关的优化问题。数据集由多个地质模型场景合集构成,训练结果表明相对于既有地质模型的鲁棒优化以及传统的 CLRM 方法,基于 DRL 的方法在油水注入生产中的净现值(NPV)获得了 15% 和 33% 的提升,并且相对于传统 CLRM 平均提升了 4% NPV,并且在多种地质模型场景中均能发挥较好的效果。