BriefGPT.xyz
Ask
alpha
关键词
test-time loss
搜索结果 - 1
关于检索增强的 Transformer 的泛化能力
该研究探讨了 Retrieval-Enhanced Transformer(RETRO)模型的性能以及性能提升的原因,发现检索数据库可显著提高语言建模的效果,但其性能提升主要来自于测试数据与数据库的重叠标记。该研究还指出,检索增强的语言模型
→
PDF
a year ago
Prev
Next