BriefGPT.xyz
Ask
alpha
关键词
deep offline reinforcement learning
搜索结果 - 2
CORL:面向研究的深度离线强化学习库
CORL 是一个开源库,提供单文件实现的深度离线强化学习算法,强调简单的开发体验和现代化的分析跟踪工具,通过将方法实现隔离到不同的单个文件中,使得性能相关的细节更易识别,同时提供实验跟踪功能,可将指标、超参数、依赖等日志记录到云端,并通过对
→
PDF
2 years ago
平衡重现和悲观 Q 集合的离线到在线强化学习
本文提出了一种平衡重放机制和多 Q 函数的方法来解决深度离线强化学习中的状态 - 动作分布移位问题,以提高机器人代理在不同运动和操作任务中的样本效率和最终性能。
PDF
3 years ago
Prev
Next