模拟用户代理用于具身对话人工智能
该研究论文介绍了用于电影预订领域的用户模拟器,它利用规则和收集到的数据,并支持电影票预订和电影寻找两个任务。为了实现对对话框架的经验算法比较,论文提出了一种新的模拟框架,展示了多个代理的思路,并详细介绍了将自己的代理添加到所提出的框架中进行测试的过程。
Dec, 2016
引入TEACh数据集,通过三个基准测试,研究基于人类空间的机器人必须能够与人进行自然语言交互,理解和执行指令,使用会话来解决模糊性并从错误中恢复的具体挑战。
Oct, 2021
该研究提出了DialFRED,一个基于ALFRED基准的对话启用的具有体现指导AI的基准,其允许代理主动向人类用户提问,并利用用户响应中的附加信息来更好地完成其任务。使用人类注释的数据集和强化学习调整预先训练的提问者来解决DialFRED,并且鼓励研究人员提出和评估构建具有对话功能的体现代理的解决方案。
Feb, 2022
通过将大语言模型与视觉信息相结合,建立了一种神经符号共同思考推理框架 JARVIS,用于构建可解释且高效的对话体载体,结果达到了现有方法中最优结果。
Aug, 2022
本文探讨如何训练和评估在自然语言交互中完成复杂任务的代理人,指出基于模仿学习的度量指标会误导并阻碍进展,提出应关注高级语义目标,将着眼点从低级行动度量指标推向更高层面。
Oct, 2022
本文介绍了一种交互式的“体现代理”系统,它具有适应性,能够有效地处理自然语言指令,并提供反馈。同时,还介绍了一种用于收集有关该系统的大量文本指令的众包工具,以及该系统具有学习能力的数据集和基线模型。
May, 2023
为了推动自动化任务导向对话系统的评估,本研究提出了一种基于预训练语言模型的新型用户模拟器,并通过上下文学习来生成具有鲁棒性和语言多样性的输出,以模拟人类对话行为。通过与现有对话系统交互,并收集人机交互数据集,验证了该用户模拟器在单一意图对话目标方面的表现与人类相似。
Sep, 2023
通过相关的记忆检索,HELPER利用外部的语言-程序对内存将自由形式的人机对话解析为行动程序,以提供上下文的例子查询来转变开放域自然语言,并且拓展内存以包含用户的语言和行动计划。
Oct, 2023
该研究解决了当前对话体系统在互动对话中缺乏有效引导对话的能力的问题。通过使用事后经历重写和增强现有的数据,采用离线强化学习的方法,研究提出了一种能在心理健康支持和慈善捐赠领域 outperform 现有对话体的新的技术。实验结果表明,所提方法在与真实用户的用户研究中显著优于现有的对话体系统。
Nov, 2024