BriefGPT.xyz
Ask
alpha
关键词
grid world
搜索结果 - 2
EMNLP
当可以进行变形器基础和组合:来自组合泛化基准测试的见解
使用谷歌的翻译翻译:“该论文介绍了基于变压器的模型如何理解世界,并将语言表达与现实世界联系起来,这对研究者在这一领域的工作非常有帮助。通过在基于网格的导航任务上进行的基准测试,我们发现识别网格世界中的目标位置是模型面临的主要挑战,变压器可以
→
PDF
2 years ago
AAAI
一个代理应该如何练习?
该研究提出了一种通过学习内在奖励函数来驱动代理在练习期间学习,避免缺乏外在任务奖励的影响的方法,并通过元梯度法来适应练习奖励参数,该方法在格子世界以及两个游戏中进行了评估,显示了在练习和比赛中同时学习的优势。
PDF
5 years ago
Prev
Next