BriefGPT.xyz
大模型
Ask
alpha
关键词
ais losses
搜索结果 - 1
递归 Q 学习的近似信息状态收敛分析
该论文研究了强化学习算法中的一种非马尔可夫过程,提出了一种基于近似信息状态 (AIS) 的改进方法,展示了其比基线更好的表现和与 AIS 表示相关的性能变化。
PDF
a year ago
Prev
Next