Aug, 2023

平均困难注意力变换器是恒定深度均匀阈值电路

TL;DR该论文研究了 Transformers 模型在自然语言处理任务中的应用,并发现它们与常深度门电路之间的关系,通过两个假设(平均难度的注意力和对内部计算相对于输入长度的对数精度)。研究表明,平均难度的注意力 Transformers 可以识别属于复杂度类 TC0 的语言,而对数精度 Transformers 可以识别属于均匀 TC0 类的语言。此外,该论文还指出第一个结果可以扩展为生成均匀电路。