Jun, 2024

从 Transformer 中提取有限状态机

TL;DR我们提出了一种专门为 Transformer 模型设计的自动机提取算法,通过对 Transformer 模型的内部潜在表示进行转换过程的跟踪并使用经典的教学方法来将其解释为确定有限状态自动机(DFA),揭示了 Transformer 模型如何理解形式语言的结构,从而增强了 Transformer 模型的可解释性并深入了解了机器学习系统如何处理形式语言。