Sep, 2023

基于物理信息的强化学习通过概率共调整函数

TL;DR通过使用协克里金调整(CKA)和岭回归调整(RRA)方法,本研究探索了将精简的模拟模型快速适应个体实例的方法,并通过更准确的不确定性量化提高了整个系统动力学的准确性。该方法在解锁有效且具有不确定性意识的强化学习方法方面,为仅拥有不完善模拟模型的复杂真实世界系统提供了一种途径。