基于 HyperCLOVA 的旅游指导机器人

Oct, 2022

Tourist Guidance Robot Based on HyperCLOVA

Takato Yamazaki, Katsumasa Yoshikawa, Toshiki Kawamoto, Masaya Ohagi, Tomoya Mizumoto...

TL;DR本文介绍了我们在 2022 年对话机器人竞赛中提交的系统。该系统是基于规则和生成式对话系统的组合模型。我们利用 HyperCLOVA（一种日本基础模型）来生成回复和摘要、搜索信息等。此外，我们还使用了我们原创的语音识别系统，并对其进行了本次对话任务的微调。结果，我们的系统在初赛中排名第二，晋级决赛。

Abstract

This paper describes our system submitted to Dialogue Robot competition 2022. Our proposed system is a combined model of rule-based and generation-based dialog systems. The system utilizes hyperclova, a

dialogue system hyperclova speech recognition competition japanese

发现论文，激发创造

发展交互式旅游规划：由大型语言模型驱动的对话机器人系统

我们旨在构建一个系统，不仅利用大型语言模型的灵活对话能力，还利用其先进的规划能力，降低人类对话者的讲话负担并高效地规划行程。我们提出了一种将旅行社的复杂任务划分为多个子任务的方法，将每个子任务作为一个独立阶段进行管理，以有效地完成任务。我们的提出的系统在 2023 年对话机器人比赛的预赛中取得了一定的成功，并报告了比赛中发现的挑战。

Dec, 2023

利用对话方案的 LLM 增强多模式对话系统的一致性

这篇论文描述了我们提交给 2023 年对话机器人竞赛的对话系统。该系统旨在帮助旅行社的用户决定参观京都市的两个观光景点的计划。通过根据对话场景控制对话流程，我们的对话系统具有灵活性和稳定性，并根据系统的话语和用户的情况引入动作和语音控制以提高用户满意度。在预赛中，我们的系统在印象评估中排名第五，在计划评估中排名第六，共有 12 支队伍。

Dec, 2023

DRC2023 赛事的 Irisapu 团队项目描述

本研究论文描述的是 Irisapu 团队为 2023 年对话机器人竞赛（DRC2023）制定的对话机器人系统。我们尝试使用 OpenAI 的 GPT-3 生成灵活的对话回复句子，以预定的情景为依据，通过将对话情景划分为五个子情景并为每个子情景创建提示，实现对用户的适当回应。此外，我们还结合了我们之前关于对话故障检测的研究成果，并在竞赛中使用。尽管在初赛中我们的系统出现了错误，影响了结果，未能达到令人满意的成绩，但在 “提供信息的可靠性” 评估类别中，我们在所有团队中排名第三。

Dec, 2023

CLOVA：带有工具使用和更新的封闭循环视觉助手

本文介绍了一种闭环视觉助手 CLOVA，利用大型语言模型（LLMs）将现成工具集成在一起，通过推理、反馈和学习三个阶段来解决视觉助手在新环境中推广使用的能力有限的问题。实验结果显示，CLOVA 在视觉问题回答、知识标注和图像编辑任务方面的性能均超过其他方法。

Dec, 2023

视觉和对话导航

提出了 Cooperative Vision-and-Dialog Navigation 数据集，定义了 Navigation from Dialog History 任务，使用序列到序列模型解决人机对话中机器人导航的问题，并进一步证明历史对话越长，性能越好。

Jul, 2019

实现视觉辅助对话的社交机器人

本论文提出了一个初步实现的对话管理器，利用最新的大型语言模型（如 GPT-4，IDEFICS）来将视觉能力整合到对话代理中，以增强传统的基于文本的提示与实时视觉输入。该系统的提示工程结合了对图像的对话与摘要，以确保在上下文保留和计算效率之间保持平衡。通过实现这种视觉使能的对话系统，本论文展望了未来，让对话代理无缝地融合文本和视觉模态，实现更丰富、更上下文感知的对话。

Nov, 2023

实时对话机器人的交互语言

该研究提出了一个框架，用于在现实世界中建立交互式、实时的、自然语言指导的机器人，并开源相关资产 (数据集、环境、基准和策略)。

Oct, 2022

DRC2023 中的团队流程：在旅游代理口语对话系统中建立共识和基于文本的交替对话

在 2023 年的对话机器人大赛（DRC2023）中，我们团队开发了一个系统，能基于用户的发言文本建立共同语境并进行更加自然的交流，并且利用共同语境生成观光景点搜索的查询，同时在等待用户理解时进行对话。

Dec, 2023

生产就绪的聊天机器人：生成或提取

该研究提出了一个混合模型，结合了神经会话模型和基于规则的图形对话系统，通过聊天对话协助用户安排提醒，该系统相较于基于规则的基准系统表现出显著的改进，并结合了神经生成模型，使其足够稳健以应对实际应用场景。

Nov, 2017

FreeTalky：人形机器人使用以人物角色为基础的对话使对话更容易

我们提出了一种基于深度学习的外语学习平台 FreeTalky，它采用人形机器人 NAO 和各种深度学习模型，为那些对外语感到焦虑的人提供帮助。该系统采用基于人物角色的对话系统，为用户提供有趣和一致的多回合对话，并通过语法纠错系统促进用户的语法能力提高。此外，我们通过人类评估验证了 FreeTalky 是否能够通过用 NAO 机器人替代真人交流来缓解异国语言恐惧症。

Dec, 2021