Jun, 2023

常数内存注意力块

TL;DR提出了 CMAB 的全新通用关注块的方法,并展示了在神经过程和时间点过程中竞争状态下达到与现有技术相当结果的大量经验证据,同时显著提高了内存效率。