Apr, 2024

我们真的需要一个复杂的代理系统吗?将具体化的代理蒸馏成单一模型

TL;DRSTEVE-2 使用层次化知识蒸馏框架,将大型语言模型和多模态语言模型集成到开放式任务中的具身代理中,实现了复杂的任务执行以及对可执行动作的生成。STEVE-2 在导航和创作任务上的广泛评估表明,在开放式任务中,其表现优于其他方法,性能提升了 1.4-7.3 倍。