BriefGPT.xyz
Ask
alpha
关键词
intra-document causal masking
搜索结果 - 1
分析序列组成对语言模型预训练的影响
将相关文档连接起来并使用内部文档因果掩模,可以提高语言模型的性能,并通过 BM25Chunk 方法改善语境学习、知识记忆和上下文利用能力。
PDF
5 months ago
Prev
Next