Aug, 2023

TaskLAMA: 探究语言模型的复杂任务理解能力

TL;DR通过使用大型语言模型,我们从高质量的人工标注数据集中提取知识,并引入了新的评估指标,发现结构化复杂任务分解能够有效地将复杂任务分解为个别步骤,相对于基准实验的最大改进幅度为280%,但在预测两两时间依赖性方面仍存在困难。