关键词combinatorial action spaces
搜索结果 - 4
- 利用分解的行动空间实现医疗保健中高效的离线强化学习
本文研究了如何在强化学习的组合行为空间中通过线性 Q 函数分解来更好地处理少见子行动组合的情况,并对该方法进行了理论分析和实验评估,证明了它可以提高数据效率和策略优化的性能。
- 组合动作空间中的高效规划及其在合作多智能体强化学习中的应用
本篇研究论文是关于如何在具有组合行动空间的多智能体强化学习中,通过访问 argmax oracle 并建立在线模拟和线性函数逼近的最小要求,提出了一种高效的算法,以在所有相关问题参数的多项式计算和查询复杂度内实现计划。
- 从零开始的非正式外交
本文介绍了一种在组合动作空间游戏中进行动作探索和平衡逼近的算法,该算法同时执行价值迭代和学习策略建议网络。 我们使用这个算法,训练了一种名为 DORA 的代理,完全从零开始,它在人类玩家之上展现了超人类的表现,这是对 “Diplomacy” - 交互式小说游戏:巨大的冒险
介绍了 Jericho,IF 游戏的学习环境,并通过对丰富游戏集合上的文本代理进行全面研究,强调了代理可以提高的方向。