Mar, 2023
Pgx: 强化学习游戏模拟的硬件加速并行化
Pgx: Hardware-accelerated parallel game simulation for reinforcement learning
Sotetsu Koyamada, Shinri Okano, Soichiro Nishimori, Yu Murata, Keigo Habara...
TL;DR使用 JAX 编写的 Pgx 可以模拟 Backgammon、Shogi 和 Go 等重要的人工智能研究基准测试,并且可以轻松扩展到数千个并行执行的 GPU / TPU 加速器,其单个 A100 GPU 的模拟速度比现有的强化学习库快 10 倍。