EMNLPOct, 2023

辅助工具生成策略的综合评估

TL;DR通过对不同策略的系统和公平比较,本研究发现强大的无工具基准线策略与工具辅助策略竞争力相当,暗示有效地使用具有上下文演示的工具仍是一个困难的未解决问题;对于知识检索任务,使用工具对错误输出进行改进的策略优于提前或在生成过程中检索相关信息的策略;使用工具的策略在需要工作的标记数量上是昂贵的,造成了显著的性能改善,但这并不意味着将其转化为实质性的性能提升。总之,我们的研究结果表明,少样本工具集成仍然是一个待解决的挑战,强调了对未来策略的全面评估来准确评估其效益和成本的需求。