Jul, 2024

当可以进行语境内的Transformer组合泛化?

TL;DR在这篇文章中,我们研究了一个模块化多任务设置,以精确控制数据生成过程中的组合结构,通过提供实验证据,发现转换器在上下文学习中在组合泛化方面存在困难,只有当引入瓶颈强制将任务推理与任务执行明确分开时,组合泛化才变得可能。