May, 2024

通过图算法理解Transformer推理能力

TL;DRTransformer自动缩放机制、算法推理能力的研究(深度、宽度、额外标记数)及在图推理任务中的优秀表现。