May, 2023

TELeR: 用于复杂任务基准测试的 LLM 提示的通用分类

TL;DR提出了一种通用分类法,以设计具有特定属性的提示来执行广泛的复杂任务,从而解决了使用不同提示类型 / 样式和提示中提供不同程度细节时 LLMs 性能差异的问题,使未来的基准研究能够报告所使用的特定类别的提示,启用对不同研究的有意义的比较,并通过这种分类法建立共同标准,研究人员将能够更准确地得出关于 LLMs 在特定复杂任务上的表现的结论。