Oct, 2023

知识追踪中基于进化的 Transformer 神经架构搜索

TL;DR本研究旨在通过使用卷积操作增强 Transformer 的局部上下文建模能力,提出一种进化神经架构搜索方法来自动选择输入特征,并自动确定何时应用哪种操作以实现局部 / 全局上下文建模的平衡,实验结果表明该方法能有效地找到最优体系结构。