Jul, 2023

可增量计算的神经网络:动态输入的高效推理

TL;DR深度学习和增量计算方法,采用向量量化处理输入数据,通过离散化中间值以便复用信息,应用于 Transformer 架构,实现了复杂度与输入变动比例成正比的高效增量推理算法,并通过实验证明在文档分类中达到了和传统方法几乎相等的准确性,但处理微小编辑序列时所需操作次数降低到了原先的 12.1 倍。