Apr, 2024

用于大型基于Transformer的模型的高效离群层

TL;DR我们介绍了一种异常值高效的现代 Hopfield 模型(命名为 OutEffHop),并使用它来解决量化巨大的基于 Transformer 的模型中的异常值引起的挑战。