LACMA：语言对齐的对比学习和元动作用于体现式指令跟踪

EMNLPOct, 2023

LACMA：语言对齐的对比学习和元动作用于体现式指令跟踪

LACMA: Language-Aligning Contrastive Learning with Meta-Actions for Embodied Instruction Following

Cheng-Fu Yang, Yen-Chun Chen, Jianwei Yang, Xiyang Dai, Lu Yuan...

TL;DR通过对代理的隐藏状态与指令进行对比学习，以及引入元动作来缩小高级语言指令与代理低级行动空间之间的语义差距，该研究成功提高了代理在未知环境下的成功率。

Abstract

end-to-end transformers have demonstrated an impressive success rate for embodied instruction following when the environment has been seen in training. However, they tend to struggle when deployed in an unseen en

end-to-end transformers embodied instruction following contrastive learning meta-actions unseen environments

发现论文，激发创造

如今是否已经到达目的地？学习跟随具身教学中的定位

本研究针对 “Embodied instruction following” 的挑战性问题，利用 ALFRED 基准测试，通过引入多个视角和培训模型预测空间关系的方式来解决目标定位和语言指令接地等关键难点，同时通过引入预训练的物体检测模块来提高语言接地，实验证明我们的方法可以超越基线模型性能。

Jan, 2021

ICAL: 将轨迹转化为可行动洞见的多模态智能体的持续学习

我们提出了一种名为 In-Context Abstraction Learning（ICAL）的方法，通过从次优演示和人类反馈中构建多模态体验洞察记忆，将 VLMs 将轨迹抽象为一个通用程序，显著提高了检索增强的 LLM 和 VLM 代理的决策能力。

Jun, 2024

基于矩估计的对抗训练用于语境感知理解

本文中，我们提出了 Moment-based Adversarial Training（MAT）的方法，用于帮助机器人处理家庭任务，并在 ALFRED benchmark 上取得了优异的结果。

Apr, 2022

对比语言、动作和状态预训练用于机器人学习

本文介绍了一种名为 Contrastive Language, Action, and State Pre-training (CLASP) 的方法，采用分布式输出使文本命令和行为单元之间的对齐变得更加准确，从而帮助了解决机器人学习中的相关问题。该模型在对未知数据集进行检索和图像描述生成等任务中表现出了优秀的性能。

Apr, 2023

元学习在指令驱动自然语言生成中的应用

本研究旨在探讨对多任务教学学习（MTIL）应用元学习（meta-learning）是否可以进一步提高对未见任务的泛化能力。通过在自然语言理解（NLU）任务的大规模数据集上进行广泛实验，我们提出的方法在零 - shot 场景下显著改善了强基线，尤其是在测试任务严格为零 - shot 且对语言模型（LM）较难的情况下，元学习可提高教学的有效性，展示出 MTIL 的元学习在新任务中的潜力。

Oct, 2022

评估具身代理模型泛化能力的限制：基于验证集

研究提出了一种使用自然语言引导体现任务完成的模型，使用模块在更广阔的视野范围内学习选择下一步是否需要导航或操作，改进了现有基准数据集 ALFRED 上的表现。但是，最优模型在未见过的测试集分裂上表现不佳，突出了在机器学习任务中性能波动的需要修改基准设计以更好地考虑模型性能差异的需求。

May, 2022

放眼全局、再次解读：提高交互式指令跟随任务的性能

本文提出了一个基于多种新思想的新方法，通过两阶段指令解析和基于当前指令的分层注意力应用提供了准确的导航预测，从多个自我为中心的视角提取必要信息，可以以较高的精度在 ALFRED 挑战中胜出且取得了远高于以前相关研究的准确率。

Jun, 2021

学习澄清：基于行动对比自我训练的多轮对话

Action-Based Contrastive Self-Training (ACT) is a quasi-online preference optimization algorithm that improves conversation modeling in large language models (LLMs), particularly in the area of disambiguation and dialogue policy learning.

May, 2024

通過行動學習增強大型語言模型代理

我们的研究探索了语言代理程序的开放式行为学习，在每一次迭代中，通过修正和更新当前可用的动作，从而提高动作的有效性，实验证明，这种开放式行为学习方法显著改善了代理程序的性能，突出了经验行为学习在更智能的大型语言模型代理程序发展中的重要性。

Feb, 2024

AlphaBlock：机器人操纵中视觉语言推理的具身微调

提出了一个学习机器人操纵任务高级认知能力的新框架，使用语言模型构建 AlphaBlock 数据集，自动采集综合高级多步文本计划和配对观察序列，使用多模式的闭环计划模型自回归生成计划，从而实现对机器人的精细操作。实验结果表明，该方法显著提高了成功率。

May, 2023