Jul, 2024

大型语言模型的修补训练

TL;DR该研究论文介绍了一种新的大型语言模型的训练方法——补丁级别训练,通过将多个标记压缩为一个补丁来减少序列长度,从而显著降低了计算成本,而不影响模型性能。