May, 2024

TAIA:大型语言模型的非分布式数据学习者

TL;DR通过细调参数和推理时干预的Transformer模型,能够在数据匮乏的领域中提高大语言模型的性能。