关键词retrieval-enhanced transformer
搜索结果 - 2
- 关于检索增强的 Transformer 的泛化能力
该研究探讨了 Retrieval-Enhanced Transformer(RETRO)模型的性能以及性能提升的原因,发现检索数据库可显著提高语言建模的效果,但其性能提升主要来自于测试数据与数据库的重叠标记。该研究还指出,检索增强的语言模型 - 从数十万亿的标记中检索以提高语言模型
通过从大型语料库中检索与前面 token 相似的文档块来改善自回归语言模型的条件,并创建 Retrieval-Enhanced Transformer(RETRO),该模型在 Pile 数据集上的表现与 GPT-3 和 Jurassic-1