Apr, 2024
朝实用性工具使用的方向:为不断学习的LLMs而努力
Towards Practical Tool Usage for Continually Learning LLMs
TL;DR大型语言模型具有解决语言相关任务的天赋,但由于它们静止于参数中的知识的局限性,存在无法应对信息变化和任务技能过时的问题。工具使用能帮助LLM通过接口获得外部系统的支持,但使用工具的LLM仍需适应不稳定的环境,并且需要学会使用预定义的工具。为验证这一观点,我们开发了一个合成基准并聚合了现有的自然语言处理任务,形成一个更加真实的测试场景。我们证明模型规模扩大并非解决方案,而不论是否使用工具,持续学习技术都能使工具型LLM更快适应并遗忘更少,凸显了它们作为持续学习者的潜力。