Jan, 2025
LeetDecoding:一个用于指数衰减因果线性注意力的PyTorch库,包含CUDA实现
LeetDecoding: A PyTorch Library for Exponentially Decaying Causal Linear
Attention with CUDA Implementations
TL;DR本研究解决了在生成式预训练变换器中因果注意力的复杂性和计算方法不足的问题,提出了一个名为LeetDecoding的Python库。该库提供了易于集成的计算例程,支持在GPU上进行快速推理,并使研究人员能够在没有GPU编程知识的情况下,评估新计算方法的效果。