Nov, 2023

Banach-Tarski 嵌入与变换器

TL;DR我们介绍了一种将任意递归数据结构嵌入到高维向量中的新构建方法,这些嵌入为变压器的潜在状态向量提供了可解释的模型。我们展示了当嵌入维度足够大时,这些嵌入可以解码为原始数据结构。这个解码算法在变压器中有一个自然的实现。我们还展示了这些嵌入向量可以直接操作底层数据执行计算而无需解码。例如,我们提出了一个算法,仅使用嵌入空间的向量操作构造嵌入的标记序列的嵌入句法树。