BriefGPT.xyz
Ask
alpha
关键词
exploration technique
搜索结果 - 2
有效多智能体 Q-Learning 的图探索
本文提出了一种基于图通信的多智能体强化学习探索技术,通过邻近智能体的协作来估计状态 - 动作空间的不确定性,从而在不需要计数机制且可以应用于连续状态环境的前提下执行更有效的探索行为,可以实现最小的信息交换和完全分散的通信方式,并用理论和实验
→
PDF
a year ago
高效稳定的多步稀疏奖励强化学习的抽象演示和自适应探索
本文提出了一种 DRL 探索技术 A^2,通过将复杂任务分解成子任务、提供正确的子任务顺序以及自适应探索环境的方式,改善了学习效率,实验表明在多个任务中,A^2 有助于 DQN、DDPG 和 SAC 等普通 DRL 算法在这些环境中更高效、
→
PDF
2 years ago
Prev
Next