BriefGPT.xyz
大模型
Ask
alpha
关键词
retrieval-augmented training datasets
搜索结果 - 1
教小型语言模型如何推广到未见过的组合问题
我们在本文中提出了一种通过多任务监督预训练和密集检索系统的组合来实现对具有挑战性的复合问题的泛化的方法,并且展示了通过添加用于训练的检索增强数据集可以显著提高模型的性能。
PDF
a year ago
Prev
Next