EMNLPOct, 2023

InstructExcel:一个 Excel 自然语言指令的基准

TL;DR该研究探讨了大型语言模型在解决 Excel 相关任务上的可行性,并引入了一个新的大规模基准测试,InstructExcel,该测试覆盖了多个 Excel 操作并包含超过 10,000 个样本。实验结果表明,GPT-4 相比 GPT-3.5 在此基准测试上表现较好,并且提供更多上下文示例和动态提示可以提高性能。