基于 HyperCLOVA 的旅游指导机器人
我们旨在构建一个系统,不仅利用大型语言模型的灵活对话能力,还利用其先进的规划能力,降低人类对话者的讲话负担并高效地规划行程。我们提出了一种将旅行社的复杂任务划分为多个子任务的方法,将每个子任务作为一个独立阶段进行管理,以有效地完成任务。我们的提出的系统在 2023 年对话机器人比赛的预赛中取得了一定的成功,并报告了比赛中发现的挑战。
Dec, 2023
这篇论文描述了我们提交给 2023 年对话机器人竞赛的对话系统。该系统旨在帮助旅行社的用户决定参观京都市的两个观光景点的计划。通过根据对话场景控制对话流程,我们的对话系统具有灵活性和稳定性,并根据系统的话语和用户的情况引入动作和语音控制以提高用户满意度。在预赛中,我们的系统在印象评估中排名第五,在计划评估中排名第六,共有 12 支队伍。
Dec, 2023
本研究论文描述的是 Irisapu 团队为 2023 年对话机器人竞赛(DRC2023)制定的对话机器人系统。我们尝试使用 OpenAI 的 GPT-3 生成灵活的对话回复句子,以预定的情景为依据,通过将对话情景划分为五个子情景并为每个子情景创建提示,实现对用户的适当回应。此外,我们还结合了我们之前关于对话故障检测的研究成果,并在竞赛中使用。尽管在初赛中我们的系统出现了错误,影响了结果,未能达到令人满意的成绩,但在 “提供信息的可靠性” 评估类别中,我们在所有团队中排名第三。
Dec, 2023
本文介绍了一种闭环视觉助手 CLOVA,利用大型语言模型(LLMs)将现成工具集成在一起,通过推理、反馈和学习三个阶段来解决视觉助手在新环境中推广使用的能力有限的问题。实验结果显示,CLOVA 在视觉问题回答、知识标注和图像编辑任务方面的性能均超过其他方法。
Dec, 2023
提出了 Cooperative Vision-and-Dialog Navigation 数据集,定义了 Navigation from Dialog History 任务,使用序列到序列模型解决人机对话中机器人导航的问题,并进一步证明历史对话越长,性能越好。
Jul, 2019
本论文提出了一个初步实现的对话管理器,利用最新的大型语言模型(如 GPT-4,IDEFICS)来将视觉能力整合到对话代理中,以增强传统的基于文本的提示与实时视觉输入。该系统的提示工程结合了对图像的对话与摘要,以确保在上下文保留和计算效率之间保持平衡。通过实现这种视觉使能的对话系统,本论文展望了未来,让对话代理无缝地融合文本和视觉模态,实现更丰富、更上下文感知的对话。
Nov, 2023
在 2023 年的对话机器人大赛(DRC2023)中,我们团队开发了一个系统,能基于用户的发言文本建立共同语境并进行更加自然的交流,并且利用共同语境生成观光景点搜索的查询,同时在等待用户理解时进行对话。
Dec, 2023
该研究提出了一个混合模型,结合了神经会话模型和基于规则的图形对话系统,通过聊天对话协助用户安排提醒,该系统相较于基于规则的基准系统表现出显著的改进,并结合了神经生成模型,使其足够稳健以应对实际应用场景。
Nov, 2017
我们提出了一种基于深度学习的外语学习平台 FreeTalky,它采用人形机器人 NAO 和各种深度学习模型,为那些对外语感到焦虑的人提供帮助。该系统采用基于人物角色的对话系统,为用户提供有趣和一致的多回合对话,并通过语法纠错系统促进用户的语法能力提高。此外,我们通过人类评估验证了 FreeTalky 是否能够通过用 NAO 机器人替代真人交流来缓解异国语言恐惧症。
Dec, 2021