Aug, 2024

变压器如何学习结构化数据:来自层次过滤的洞见

TL;DR本研究解决了生成模型在树形结构上序列的层次过滤问题,推动了对数据中位置相关性的控制。通过创新的方法,证实了传统编码器变压器架构能够有效实施最佳信念传播算法,从而在根分类和掩码语言建模任务中实现显著成果,表明变压器在训练过程中逐步整合更大距离的相关性。