Jul, 2022

使用元指称游戏学习组合学习行为

TL;DR人类使用组成性从过去的经验推广到实际或虚构的新经验中。为了支持我们想象和参与新经验,我们将经验分解为基本原子组件,然后以新颖的方式重新组合这些原子组件以支持我们的能力。本文提出了一种名为符号行为基准(S2B)的贝奇马克来调查智能体展示组成学习行为能力的能力,以便建造能够与人类合作的人工智能。