- 让沉默发声:利用大型语言模型生成评论增强假新闻检测
通过采用大型语言模型作为用户模拟器和评论生成器,我们提出了 GenFEND,一种生成的反馈增强检测框架,通过为多个子人群组提示大型语言模型并聚合生成的评论,以做到多样化评论的可用性,尤其是来自沉默用户的评论。实验证明了 GenFEND 的有 - 多轮指导对话的归纳 - 演绎策略重用
利用复杂对话流程的明确建模,从各种真实对话中提取高级策略并将其应用于新的对话情境,以产生多样化、深入和富有洞见的指示,以提高大型语言模型与人类期望的一致性。
- ACLKAUCUS: 知识增强的用户模拟器用于训练语言模型助手
通过引入 Kaucus,一种知识增强的用户模拟器框架,我们使用基于 GPT-J 的检索增强模拟器和摘要控制模拟器生成多样化的模拟器-助手交互数据,进而发现这些交互数据作为有用的训练数据,可以创建更好的下游助手。同时,我们发现通过检索增强或摘 - 使用大型语言模型进行任务导向对话评估的用户模拟
为了推动自动化任务导向对话系统的评估,本研究提出了一种基于预训练语言模型的新型用户模拟器,并通过上下文学习来生成具有鲁棒性和语言多样性的输出,以模拟人类对话行为。通过与现有对话系统交互,并收集人机交互数据集,验证了该用户模拟器在单一意图对话 - 对话策略优化的神经用户模拟器对抗学习
采用对抗训练的用户模拟器能够生成更加真实和多样化的用户行为数据,并用于训练对话系统中的策略,相比于最大似然的模拟器,能够显著提高对话系统的成功率。
- 人工智能团队中的统计先动态建模所需的信任感知用户模拟器开发
本文研究了人工智能和人类协作的关键问题,提出了基于语料库的用户模拟器用于协同人 - AI 团队之间的有效沟通和合作,比较了两种不同的模拟方法,以寻找最佳的主动策略。
- EMNLPMultiWOZ 是一个已解决的任务吗?带有用户模拟器的交互式 TOD 评估框架
本文提出了一种交互式评估框架用于任务指向对话(TOD)系统,通过构建用户目标的预训练模型和使用用户模拟器来交互评估,实验结果表明,我们的提议可以实现与多 WoZ 数据集中的 TOD 任务 98%的成功率和信息率,并引入了句子层和会话层得分来 - EMNLP基于 GPT 架构和目标状态跟踪的增强式多领域对话系统的生成式用户模拟器
本文提出了一种以 GPT-2 模型为基础,利用目标状态追踪的生成式用户模拟器(GUS)来解决用户模拟器训练时遇到的挑战,并在 MultiWOZ2.1 数据集上通过交叉模型评估、基于语料库的评估和人类评估等方法对训练出的多个对话系统进行对比, - 通过用户模拟评估混合式倡议对话搜索系统
本文介绍了 USi,一种用于自动评估对话式搜索系统的用户仿真器,可自动回答与搜索主题有关的澄清问题,包括单轮和多轮交互。通过一系列实验证明了 USi 对人类生成的答案是相当的。
- 用于评估面向任务对话系统的比喻用户模拟器
本文提出使用隐喻用户模拟器和基于测试者的评估框架对任务型对话系统进行评估,在三个数据集的实验中,隐喻用户模拟器在准确性上表现更好,并证明了框架的高效性和良好的泛化和可扩展性。
- ACL可迁移的对话系统和用户模拟器
通过对话系统和用户模拟器之间的交互,开发了一种建模框架,旨在通过自动对话场景的创建来解决训练数据不足的问题,并使用强化学习来改进智能体的行为,从而在转移学习中提高对话系统性能。
- EMNLP通过强化学习和人类示范来减少说服对话中的重复和不一致性
本文通过引入强化学习(RL)进行用户交互训练,实现了一个更加人性化的劝说对话系统,并成功在捐赠劝说任务中取得了优于先前最先进的对话模型的表现。
- KDD通过用户模拟评估对话式推荐系统
本文提出一种通过用户模拟来替代人类评估的方法,以实现对话推荐系统的自动评估。作者表明,通过考虑用户的个人喜好和与系统的一般交互流程,偏好建模和特定任务交互模型都有助于实现高度自动化的绩效评估结果和人工人工评估的高度相关性。
- EMNLP如何构建用户模拟器以训练基于强化学习的对话系统
我们提出一种标准化用户模拟器构建的方法,用于评估对话系统质量。我们使用不同的对话规划和生成方法训练六个用户模拟器,并计算一组自动指标来评估这些模拟器的质量。此外,通过让人类用户评估模拟器并与训练系统交互,间接地和直接地评估了这些模拟器。本文 - 基于强化学习的推荐系统中环境模拟的研究
本文介绍了一种基于生成对抗网络的用户模拟器,可以用于预先训练和评估新的基于强化学习的推荐算法,并使用真实世界的电子商务数据进行实验验证。
- 端到端可训练任务导向神经对话模型中的迭代策略学习
本文提出一种采用深度强化学习框架实现的迭代式对话策略优化方法,解决了当前学习对话策略的主流方法之一 - 与用户模拟器进行对话时模拟器可靠性低的难题,同时也极大地提高了任务成功率与任务奖励值。此方法可以广泛应用于端到端任务导向型对话系统中,其 - ICMLe-QRAQ: 一个带解释的多轮推理数据集与模拟器
本文中,我们提出了一个新的数据集和用户模拟器 e-QRAQ(可解释的查询、推理和回答问题),该数据集测试了代理的读取模糊文本的能力,通过提问来回答挑战性问题并解释其问题和答案的推理。我们使用端到端记忆网络来训练一个神经结构,以成功地生成对问 - 任务完成对话用户模拟器
该研究论文介绍了用于电影预订领域的用户模拟器,它利用规则和收集到的数据,并支持电影票预订和电影寻找两个任务。为了实现对对话框架的经验算法比较,论文提出了一种新的模拟框架,展示了多个代理的思路,并详细介绍了将自己的代理添加到所提出的框架中进行