Feb, 2024
分析序列组成对语言模型预训练的影响
Analysing The Impact of Sequence Composition on Language Model Pre-Training
Yu Zhao, Yuanbin Qu, Konrad Staniszewski, Szymon Tworkowski, Wei Liu...
TL;DR将相关文档连接起来并使用内部文档因果掩模,可以提高语言模型的性能,并通过 BM25Chunk 方法改善语境学习、知识记忆和上下文利用能力。