ICLRFeb, 2024

强大的代理学习因果世界模型

TL;DR任何能够满足大量分布变化下后悔边界的代理必须学习数据生成过程的近似因果模型,对于最优代理而言,该模型将趋近于真实的因果模型。这一结果对于包括迁移学习和因果推断在内的几个研究领域具有重要影响。