Jul, 2024

AdaptEval:针对文本摘要的领域适应评估大型语言模型

TL;DR使用大型语言模型(LLM)进行抽象概括任务虽然取得了进展,但缺乏评估其在不同领域中适应能力的研究。我们评估了多种LLM模型在不同领域下的领域适应能力,包括精调和上下文学习设置。我们还提出了AdaptEval,即首个领域适应评估套件。AdaptEval包括领域基准和一组指标,以便分析领域适应。我们的结果表明,LLM在上下文学习设置中表现出可比较的性能,并不受其参数规模的影响。