Feb, 2024

重新思考战略环境下的学习尺度定律

TL;DR通过研究机器学习模型的扩展部署,本论文考察了模型和策略交互对规模定律的影响,发现战略交互可能破坏了常规的规模定律,同时提出了一种新的游戏模型选择范式。