Feb, 2024

咖啡厅场景的多模态体验互动代理

TL;DR通过多模态环境记忆模块,我们提出了多模态交互式智能体(MEIA),能够将自然语言表达的高级任务转化为可执行动作序列,从而实现了大型模型与具有体现性控制的集成,实验结果展示了 MEIA 在各种交互任务中的良好表现。