BriefGPT.xyz
Ask
alpha
关键词
credit assignment methods
搜索结果 - 2
透过反事实贡献分析的长期信用分配问题
本文介绍了一种基于 Counterfactual Contribution Analysis(COCOA)的信用分配算法,在衡量行动对未来奖励的影响时,通过量化一个反事实的查询来实现精确的信用分配,即 “如果智能体采取另一个行动,它仍然能达
→
PDF
a year ago
强化学习的进化算法
本文针对强化学习问题,重点介绍了进化算法在该问题上的应用,以及替代策略表述、信誉分配方法和问题特定遗传算子等方面的思考,在总结代表性应用的同时呈现了进化方法在强化学习中的优势和劣势。
PDF
13 years ago
Prev
Next