BriefGPT.xyz
Ask
alpha
关键词
game-playing agents
搜索结果 - 2
语言模型自对弈在非零和博弈中的效果
通过对《Deal or No Deal》协商游戏进行自我对弈,我们发现语言模型的自我对弈在合作与竞争方面都能显著提升性能,暗示了自我对弈和相关技术的潜力。
PDF
9 days ago
通用游戏的空间状态 - 行为特征
本文提出了一种可有效设计和实现通用游戏空间状态 - 动作特征的方法,并提供了适用于广泛不同游戏使用的设计和具体实现,这种方法可以训练出符合本地区域状态变量的特征,以此来激励或者抑制动作。
PDF
2 years ago
Prev
Next