BriefGPT.xyz
Ask
alpha
关键词
causal bisimulation modeling
搜索结果 - 1
AAAI
构建简化和可重用的因果状态抽象用于增强学习
用因果对等建模(CBM)方法在有因子的状态空间中学习动力学和奖励函数的因果关系,以得出最小的,任务特定的抽象。CBM 的隐式动力学模型可以在相同环境中重复使用,实验验证表明 CBM 的学习到的隐式动力学模型比显式模型更准确地识别了底层因果关
→
PDF
5 months ago
Prev
Next