Sep, 2022

基于模块化强化学习的自动定理证明器项目建议

TL;DR建议建立一个强化学习证明独立组件:演绎系统(环境),证明状态表示(代理如何看待环境)和代理训练算法。为此,我们为OpenAI Gym环境的饱和证明器提供了一个基于Vampire的环境,并展示了使用gym-saturation和流行的强化学习框架(Ray RLlib)的原型。最后,我们讨论了将此正在进行的工作完成到一个竞争性自动定理证明器的计划。