Dec, 2023

LLM能否找到绿色圆圈?构成泛化的调查和人类引导工具操作

TL;DR我们通过对现有ICL方法的实证调查发现其在复合泛化问题上表现不佳,因此我们提出了一种人工引导的工具操作框架(HTM),它通过生成子问题的工具并整合多个工具来提高工具的创建和使用效果。实验证明,我们的方法在两个复合泛化基准测试上取得了最先进的性能,并在最具挑战性的测试中优于现有方法70%。