模拟用户代理用于具身对话人工智能

Oct, 2024

模拟用户代理用于具身对话人工智能

Simulating User Agents for Embodied Conversational-AI

Daniel Philipov, Vardhan Dongre, Gokhan Tur, Dilek Hakkani-Tür

TL;DR本研究解决了大规模多样化人机对话数据集的收集成本高、劳动密集和耗时的问题。我们提出了一种基于大型语言模型的用户代理，能够在虚拟环境中模拟用户行为，从而提高具身对话数据集生成的可扩展性和效率。研究表明，该用户代理在模拟人类行为方面表现出色，能够有效增强机器人任务完成的能力。

Abstract

Embodied agents designed to assist users with tasks must engage in natural language interactions, interpret instructions, execute actions, and communicate effectively to resolve issues. However, collecting large-scale, diverse datasets of situated human-robot dialogues to train and evaluate such agents is expensive, labor-intensive, and time-consuming. To ad

发现论文，激发创造

任务完成对话用户模拟器

该研究论文介绍了用于电影预订领域的用户模拟器，它利用规则和收集到的数据，并支持电影票预订和电影寻找两个任务。为了实现对对话框架的经验算法比较，论文提出了一种新的模拟框架，展示了多个代理的思路，并详细介绍了将自己的代理添加到所提出的框架中进行测试的过程。

Dec, 2016

任务驱动的具有体感的对话智能体（TEACh）

引入TEACh数据集，通过三个基准测试，研究基于人类空间的机器人必须能够与人进行自然语言交互，理解和执行指令，使用会话来解决模糊性并从错误中恢复的具体挑战。

Oct, 2021

DialFRED: 嵌入式指令跟随的对话驱动代理

该研究提出了DialFRED，一个基于ALFRED基准的对话启用的具有体现指导AI的基准，其允许代理主动向人类用户提问，并利用用户响应中的附加信息来更好地完成其任务。使用人类注释的数据集和强化学习调整预先训练的提问者来解决DialFRED，并且鼓励研究人员提出和评估构建具有对话功能的体现代理的解决方案。

Feb, 2022

JARVIS:一种面向对话体现代理的神经符号常识推理框架

通过将大语言模型与视觉信息相结合，建立了一种神经符号共同思考推理框架 JARVIS，用于构建可解释且高效的对话体载体，结果达到了现有方法中最优结果。

Aug, 2022

任务驱动的具身化智能代理的对话行为

研究中提出通过模型建立对话和为任务完成注释一组对话行为，并利用这些注释数据为对话行为建模训练模型，从而改善智能体对话行为和低级动作执行的任务完成。

Sep, 2022

不要照搬老师: 实体对话中的数据和模型挑战

本文探讨如何训练和评估在自然语言交互中完成复杂任务的代理人，指出基于模仿学习的度量指标会误导并阻碍进展，提出应关注高级语义目标，将着眼点从低级行动度量指标推向更高层面。

Oct, 2022

通过交互式基于语境的语言指导重新定义具有代表性的代理人能力，改变以人为中心的AI协作

本文介绍了一种交互式的“体现代理”系统，它具有适应性，能够有效地处理自然语言指令，并提供反馈。同时，还介绍了一种用于收集有关该系统的大量文本指令的众包工具，以及该系统具有学习能力的数据集和基线模型。

May, 2023

使用大型语言模型进行任务导向对话评估的用户模拟

为了推动自动化任务导向对话系统的评估，本研究提出了一种基于预训练语言模型的新型用户模拟器，并通过上下文学习来生成具有鲁棒性和语言多样性的输出，以模拟人类对话行为。通过与现有对话系统交互，并收集人机交互数据集，验证了该用户模拟器在单一意图对话目标方面的表现与人类相似。

Sep, 2023

带有增强记忆的大型语言模型的开放式指导式具身化智能代理

通过相关的记忆检索，HELPER利用外部的语言-程序对内存将自由形式的人机对话解析为行动程序，以提供上下文的例子查询来转变开放域自然语言，并且拓展内存以包含用户的语言和行动计划。

Oct, 2023

基于事后效果的强化学习互动对话体系统

该研究解决了当前对话体系统在互动对话中缺乏有效引导对话的能力的问题。通过使用事后经历重写和增强现有的数据，采用离线强化学习的方法，研究提出了一种能在心理健康支持和慈善捐赠领域 outperform 现有对话体的新的技术。实验结果表明，所提方法在与真实用户的用户研究中显著优于现有的对话体系统。

Nov, 2024