ICMLFeb, 2023

冰与火之歌:分析 "科学世界" 中的文本自传递代理

TL;DR本文研究了基于自主目标选择和组织学习计划框架下,语言对于自主学习的重要性,提出了三个开放式科学问题:社交互动中反事实反馈的影响,学习过程中来自稀有语言目标的重采样,以及多种探索方式的结合。通过实验表明,社交互动中反事实反馈的精选对自主学习结果的提高具有决定性作用;在学习过程中,重采样来自稀有语言目标的例子有助于学习;在自主生成目标时,选择具有中等难度的目标可以显著提高最终的表现。