对话策略学习：联合澄清和主动学习查询

AAAIJun, 2020

对话策略学习：联合澄清和主动学习查询

Dialog Policy Learning for Joint Clarification and Active Learning Queries

Aishwarya Padmakumar, Raymond J. Mooney

TL;DR本文介绍了一个针对在线购物应用中的任务的交互式基于语言的图像检索任务中训练分层对话策略来共同执行澄清和主动学习的方法，并表明联合学习对于这两个功能的静态对话策略的使用更有效。

Abstract

intelligent systems need to be able to recover from mistakes, resolve uncertainty, and adapt to novel concepts not seen during training. Dialog interaction can enable this by the use of clarifications for correction and resolving uncertainty, and →

intelligent systems dialog interaction active learning clarification hierarchical dialog policy

发现论文，激发创造

通过强化学习在对话中进行交互式问题澄清

本文提出了通过增强学习模型来澄清模糊问题的方法，包括分割问题、选择标签、确认意图和构建适当的响应。模型基于深度政策网络的强化学习模型，通过真实用户点击数据评估并展示了显著的性能提升。

Dec, 2020

通过对话互动提问学习

利用机器人在电影领域的师生问答交互进行离线和在线强化学习，证明了学习者在提问时改进的效果，并验证了该方法。

Dec, 2016

通过检索有区别的澄清问题解决意图的歧义

提出了一种生成 “区分性问题” 的新方法，以解决用户查询中的歧义，用于任务导向型对话系统中的意图检测，而无需昂贵的领域特定澄清问题的标注数据。

Aug, 2020

基于对话的语言学习

研究人员在机器学习和自然语言理解方面的不懈探索中探讨了基于对话的语言学习，发现预测前瞻是一种有前途的学习策略，并表明它可以在没有奖励监督的情况下正确地回答问题。

Apr, 2016

必要时澄清：通过与语言模型的交互解决多义性

我们提出了一个任务无关的框架来通过询问用户澄清问题来解决模型中的歧义，我们的方法在确定何时需要澄清、确定要问的澄清问题以及通过澄清获得的新信息方面都取得了显著成果，并对模型的不确定性进行了估计，我们的方法在准确识别需要澄清的预测方面始终优于现有的不确定性估计方法，使系统能够在仅允许在 10％的示例上进行澄清时将性能提升两倍。

Nov, 2023

学习如何学习：一种用于增量学习视觉定位词义的自适应对话代理

本研究基于强化学习模型，针对生动图像作为学习基础的人机交互场景，训练了一种多模态对话代理，并基于 BURCHAK 语料库对代理进行了交互式学习和评估，在提高分类器准确性的同时，尽量减少学习过程中的人工操作。结果表明，该代理学习策略的性能超过基于手工定制的策略，并能够与人类模拟器有效协同学习。

Sep, 2017

学习澄清：基于行动对比自我训练的多轮对话

Action-Based Contrastive Self-Training (ACT) is a quasi-online preference optimization algorithm that improves conversation modeling in large language models (LLMs), particularly in the area of disambiguation and dialogue policy learning.

May, 2024

ConvAI3: 为开放域对话系统生成澄清问题（ClariQ）

本文详细介绍了对话系统提出澄清问题的挑战（ClariQ），为了解决信息查找中遇到的模糊问题，提供通用的评估框架以评估混合倡议式对话。

Sep, 2020

走向开放领域对话学习

本文提出修改对话系统，使其能够学习的方法，并讨论了如何从对话中提取知识、更新代理的语义网络并以行动和观察为基础。希望引起人们对该领域的关注，并成为未来研究的重点。

Feb, 2022

面向地理化人机交互混淆缓解的对话策略

该研究致力于通过语言设计对话策略框架，以缓解人机交互中的认知失调和混乱的问题。

Aug, 2022