Feb, 2024

语言模型作为科学导师

TL;DR近期,NLP 在培训具备强大科研问题解决技能的语言模型方面取得了令人振奋的进展。本文通过引入 TutorEval 和 TutorChat,提出了一种针对科学教育中需要处理长篇科学文档的语言模型应用的多样化问答基准评估方法,以及使用现有对话数据集对基础模型进行微调并展示其对 TutorEval 性能的影响,进一步创建了一套长篇合成教材对话数据集 TutorChat,最终在 TutorEval、GSM8K 和 MATH 上表现出色。