Apr, 2024

基于 Transformer 的观察空间规划及其在扑克牌游戏中的应用

TL;DRGO-MCTS 是一种利用代理观察生成序列进行搜索的广义观察蒙特卡洛树搜索方法,通过基于种群的自我对弈迭代训练 transformer 模型,有效解决了在不完全信息游戏中搜索算法的局限性。