Sep, 2024

用于长度泛化的循环变换器

TL;DR本研究解决了变换器在处理未知长度输入时的泛化能力不足的问题。通过引入循环变换器并采用自适应步数的方法,显著改善了长度泛化能力。研究发现,循环变换器能够学习到高度泛化的解决方案,从而在多个任务中表现出色。