Aug, 2024

重新思考因果强化学习中的状态解耦

TL;DR本研究解决了在强化学习中处理噪声时,通过观测估计潜在状态的挑战。论文提出了一种新的方法,结合了强化学习的具体上下文,减少了先前识别性分析中的不必要假设,并通过简单的转移和奖励保持约束,确保算法能够有效解耦状态与噪声。实验证明,该方法在多个基准控制任务中优于现有算法。