Jan, 2024

T3: 透明化追踪与触发技术用于计算和集合的细粒度叠加

TL;DRT3是一种通过硬件-软件协同设计,透明地重叠序列化的通信和计算,并最小化资源争用的方法,可对Transformer模型进行加速,减少数据移动。