Aug, 2024

定义边界:大型语言模型任务可行性光谱

TL;DR本研究解决了大型语言模型(LLMs)在处理超出其知识和能力的查询时常常产生错误或虚假响应的问题。通过系统概念化不可行任务,提供正式定义和分类,开发新的数据集并评估多种LLMs在任务可行性上的表现。本研究的实验结果验证了改进训练方法的有效性,展现了优化LLMs操作边界的潜在方向。