Apr, 2024

HELPER-X:基于记忆增强语言模型的统一可指导体现代理人解决四个交互式视觉语言领域

TL;DR扩展HELPER的记忆范围,整合额外的API来提问,使得代理可以跨多个领域进行计划执行、自然语言指令跟踪、主动提问和常识房间重组,HELPER-X在四个不同的互动视觉-语言体验代理基准测试中取得了少量训练和最新框架表现,与接受过特定领域培训的代理保持一定的竞争力。