Aug, 2022

因果世界模型的内在激励学习

TL;DR研究探索通过推断环境因果结构以收集相关干预数据为手段,建立捕捉传感器运动交互背后真实物理机制的世界模型对于提高深度学习、强化学习、迁移学习和泛化能力至关重要。