Jul, 2024

学习减少: 关于提高大型语言模型在结构化数据上的性能

TL;DR通过 On-Policy Learning 细调语言模型以生成输入结构化数据的简化版本,Learning to Reduce 框架在减少输入中取得出色表现,并在不同数据集上展现了泛化能力,对于长篇上下文的表格问答任务尤为有效。