Feb, 2024

分析序列组成对语言模型预训练的影响

TL;DR将相关文档连接起来并使用内部文档因果掩模,可以提高语言模型的性能,并通过 BM25Chunk 方法改善语境学习、知识记忆和上下文利用能力。