proximal policy optimisation | BriefGPT

关键词proximal policy optimisation

搜索结果 - 4

PyTAG：用于多智能体强化学习的桌面游戏
本研究提出了 PyTAG 框架，支持与桌面游戏接口的互动，并探讨了桌面游戏对多智能体强化学习所带来的挑战和研究机会。通过在 PyTAG 上进行自我对弈训练，我们使用近端策略优化算法训练了模型，在一部分游戏上评估了训练得到的策略与某些简单智能
PDFa month ago
基于体素化模型的深度强化学习提升车辆空气动力学性能
本文介绍了一种使用深度强化学习在汽车设计中优化空气动力学的新方法，使用体素化模型来离散化车辆几何形状，通过训练深度强化学习代理网络来优化车辆的设计参数以获得更好的空气动力性能。实验结果表明该方法在实现显著的空气动力性能方面具有有效性和高效性
PDFa month ago
PyTAG：桌面游戏中强化学习的挑战与机遇
近年来，游戏人工智能研究在使用强化学习方面取得了重要突破，然而现代桌面游戏的强化学习领域却鲜有关注，尽管相较于电子游戏，桌面游戏提供了一系列独特的挑战。为填补这一空白，我们引入了 PyTAG，一个用于与 Tabletop Games 框架（
PDFa year ago
AAAI变量动作环境的 Transformer 作为策略
研究了在变量行动环境中，使用 Transformer 编码器进行策略设计的有效性，证明了使用 PPO 算法用于 Gym-$\mu$RTS 环境中训练代理的可行性，并与使用 GridNet 架构的下一个最佳 RL 代理相比，使用了一半的计算资
PDFa year ago