BriefGPT.xyz
Ask
alpha
关键词
historical policy data
搜索结果 - 1
ChessGPT:连接策略学习和语言建模
在本论文中,我们提出了一个名为 ChessGPT 的神经网络模型,该模型整合了供强化学习所需的历史政策数据和自然语言形式的分析洞察力,从而使智能体能够更好地解决决策问题和棋类游戏。
PDF
a year ago
Prev
Next