关键词causal dynamics learning
搜索结果 - 2
- ICML细粒度的因果动力学学习与量化技术在增强学习中的鲁棒性改进
我们提出了一种新的动力学模型,通过推断细粒度的因果结构并用于预测,以改善强化学习中的鲁棒性。该模型通过将状态 - 动作空间离散化为子群,共同学习动力学模型和离散潜变量的关键点子,从而识别显示稀疏依赖性的有意义的上下文,并在训练中为每个子群学 - ICML用于任务无关状态抽象的因果动态学习
本文介绍了一种名为 CDL 的任务无关状态抽象的因果关系动力学学习模型,它不仅从学习的动力学中产生状态抽象,而且还通过消除状态变量和动作之间的不必要依赖来提高泛化能力,并在两个模拟环境和下游任务中表现出比现有状态抽象方法更好的样本效率和对未