May, 2024

路径积分形式下无限上下文转换器中的折叠上下文浓缩

TL;DR利用生成式预训练变形器的注意力算法和神经网络在路径积分形式上进行推广,将变形器的作用解释为令牌状态的时间演变,并建议在相同时间内,所有关键 - 令牌状态都可以与查询令牌状态进行关注,从而通过使用有限的序列大小的低内存来保持分离序列之间的无限上下文信息的注意力。