Oct, 2023

通过仿真向 Seq2Seq 模型注入结构化归纳偏置

TL;DR一项关于 seq2seq 神经架构中结构变换的结构性归纳偏差的研究,通过将 Transformer 预训练来模拟有限状态转换器(FSTs),说明了如何在少量数据上实现系统性泛化和 FST 样任务的少样本学习。