May, 2024

通过图算法理解 Transformer 推理能力

TL;DRTransformer 自动缩放机制、算法推理能力的研究(深度、宽度、额外标记数)及在图推理任务中的优秀表现。