利用外部知识源扩展神经生成对话模型

EMNLPSep, 2018

利用外部知识源扩展神经生成对话模型

Extending Neural Generative Conversational Model using External Knowledge Sources

Prasanna Parthasarathi, Joelle Pineau

TL;DR该研究提出了在 Seq2Seq 会话代理模型中加入外部知识源的框架，如来自维基百科摘要和 NELL 知识库。实验显示利用外部知识可加速培训时间并提高预测表现。

Abstract

The use of connectionist approaches in conversational agents has been progressing rapidly due to the availability of large corpora. However current →

connectionist approaches conversational agents generative dialogue models external knowledge sources seq2seq models

发现论文，激发创造

情感回应生成的理论驱动数据集构建与优化

我们提出了一种新方法，利用理论驱动的偏好数据集和优化算法来对齐 LLMs，以提高情感回应生成的质量和模型的泛化性能，并通过 EmpatheticDialogues 数据集以及 diff-EPITOME 和 BERTscore 指标来评估其效果。

Jun, 2024

对话机器人性能提升的调整

本文研究了对话代理（即聊天机器人）中的对齐方法与单独指示微调相比，在预定指导方针或 “防护轨道” 中可以实现更好的依从性。它探讨了传统的训练方法，如指示微调以及直接对齐方法（例如 Identity Preference Optimization（IPO）和 Kahneman-Tversky Optimization（KTO））的最新发展。文章重点强调了对齐技术在指导微调之前和之后的有效性，以说明它们在需要严格遵守规定规则的领域（如客户关怀）中优化对话机器人的潜力。

Jun, 2024

DialSim：一个用于评估对话代理的长期对话理解能力的实时模拟器

通过引入实时对话模拟器 DialSim，可以对最新的对话代理进行评估并分析它们的局限性，为未来的对话人工智能领域的改进提供有价值的见解。

Jun, 2024

基于 LLM 的人工智能聊天机器人的全面调查

本文全面调查了基于大型语言模型（LLMs）的聊天机器人在各个领域的进化和部署，总结了基础聊天机器人发展、LLMs 演进，并提供了当前正在使用和开发中的基于 LLMs 的聊天机器人概述。我们将 AI 聊天机器人视为生成新知识的工具，探讨了它们在各个行业中的多样应用。然后，我们讨论了一些挑战，包括训练 LLMs 使用的数据和生成知识的滥用可能引发的问题。最后，我们展望未来，探索如何提升它们在众多应用中的效率和可靠性。通过介绍 LLMs-based 聊天机器人的关键里程碑和当今背景，我们的调查邀请读者深入研究这一领域，并思考它们的下一代将如何重塑对话型人工智能。

Jun, 2024

增强超市机器人交互：针对多样化顾客意图的多层次 LLM 会话界面

该论文介绍了一种新型的多层 LLM 接口，用于协助超市机器人为顾客提供服务，并提出了使用多个经过细分调整的小型专用 LLM 来处理不同用户查询的方法，通过与 GPT-4 Turbo 相比较，实验结果表明多层 LLM 机器人在性能、用户满意度、用户 - 代理合作及自我形象等四个关键领域取得了显著改进，同时还提出了一种超市机器人导航的方法，使机器人能够根据聊天机器人的响应将产品引导到正确的货架上，然后通过更低级别的机器人知觉、控制和规划实现物品的自动检索。

Jun, 2024

面向具有上下文和时间敏感的长期记忆的对话系统

近年来对长期记忆对话代理的兴趣越来越浓，这导致了使用检索增强生成（RAG）的语言模型的快速发展。本论文主张，在从长对话数据中进行有效的检索面临两个独特的问题：1）基于时间 / 事件的查询，要求模型根据时间或对话事件的顺序（例如，星期二的第三次对话）检索先前对话的信息；2）需要周围对话上下文才能理解的模糊查询。为了更好地开发能够应对这些挑战的 RAG 代理，我们生成了一个包含模糊查询和基于时间的问题的新数据集，该数据集是基于最新的长形模拟对话数据集的。我们证明了标准的 RAG 方法在处理这些问题时效果不佳。然后，我们开发了一种新的检索模型，结合了链式搜索方法、标准向量数据库检索和提示方法以消除查询的歧义，并证明了这种方法在解决这些任务上显著改善了现有方法的效果。我们相信，这个新数据集和更先进的 RAG 代理可以成为有效的记忆增强对话代理的关键基准和垫脚石，可用于各种人工智能应用。

May, 2024

个性化对话生成的最新趋势：数据集、方法和评估综述

通过个性化，在对话代理中提高用户参与度已经变得很重要，尤其是随着大规模语言模型的出现，能够生成流畅的回应。本文系统地调查了个性化对话生成的最新研究现状，包括使用的数据集、开发的方法论和应用的评价指标。涵盖了 22 个数据集，我们重点介绍了基准数据集和富有附加特征的新数据集。我们进一步分析了 2021-2023 年间顶级会议的 17 项重要工作，并确定了五种不同类型的问题。我们还透露了大规模语言模型在个性化对话生成方面的最新进展。我们的评估部分提供了这些工作中使用的全面评估维度和指标的综合总结。最后，我们讨论了当前面临的挑战，并展望了个性化对话生成领域未来研究的发展方向。

May, 2024

智能体生成对话中的说话人验证

最近大型语言模型的成功引起了广泛关注，发展适应不同说话者特征和风格的角色扮演对话代理人以增强其执行一般和特殊目的对话任务的能力，然而，个性化生成话语的能力，无论是由人类还是大型语言模型进行，尚未得到很好的研究。为了填补这一差距，我们的研究引入了一个新颖的评估挑战：在代理人生成的对话中进行说话人验证，目的是验证两组话语是否来自同一个说话人。为此，我们收集了一个包含数千名发言人及其话语的大型数据集，并开展了实验设置下的说话人验证模型的开发和评估。我们进一步利用说话人验证模型评估了基于大型语言模型的角色扮演模型的个性化能力。全面的实验表明，当前的角色扮演模型未能准确模仿说话者，主要原因是它们固有的语言特点。

May, 2024

广义全息简化表示

通过引入 Generalized Holographic Reduced Representations (GHRR)，本文探讨了基于 Hyperdimensional Computing (HDC) 的深度学习方法，通过在保留连接主义方法的灵活性的同时，允许显式规定符号方法中的表征结构，从而提高了编码复杂数据结构的能力。

May, 2024

在 Mistral 8x7B-v1 中引入 Super RAGs

通过将 Super RAGs 整合到 Mistral 8x7B v1（最先进的 LLM）中，本文研究了其在准确性、速度和用户满意度方面的改进，并通过使用微调的指令模型设置和缓存调优系统确保数据检索的效率和相关性，经过多个时期的评估表明，Super RAGs 能够有效增强 LLMs，为更复杂可靠的 AI 系统探索了新的途径。

Apr, 2024