Jan, 2024

PokerGPT: 通过大型语言模型的端到端轻量级解决方案,用于多人德州扑克

TL;DRPokerGPT 使用增强学习人类反馈技术,通过将真实游戏记录转化为提示信息,将 LM 模型细化,从而解决了德州扑克等不完全信息游戏中的问题,在获胜率、模型大小、训练时间和响应速度等方面优于之前的方法。