BriefGPT.xyz
大模型
Ask
alpha
关键词
task-oriented dialog
搜索结果 - 25
ACL
基于角色感知奖励分解的多智能体面向任务的对话策略学习
本文介绍了一种采用多智能体对话策略学习的方法,用于同时训练系统和用户策略,并通过角色感知奖励分解和行为者 - 评论家框架提高预训练和可扩展性。结果表明,该方法能够通过对话交互,使两个智能体成功完成任务。
PDF
4 years ago
考虑同一上下文下多个适当回复的任务导向型对话系统
提出了一个名为 MADA 的多行为数据增强框架,用于生成多样化的对话回复,该框架利用了对话的一对多属性,并改善了对话策略及回复多样性的表现。
PDF
5 years ago
神经助手:联合行动预测、响应生成和潜在知识推理
本文介绍了神经助手:一种基于神经网络模型的任务导向对话系统,该系统采用了外部知识源,并联合生成文本响应和行动预测,以消除信念状态注释的需要,并实现更高的事实准确性和语言生成性能。
PDF
5 years ago
EMNLP
引导式对话策略学习:针对多领域任务导向型对话的奖励估计
该研究提出了一种基于对抗逆强化学习的引导式对话策略学习算法,该算法可以在多领域任务导向对话中进行奖励估计和策略优化,以实现有效的对话,并在多领域对话数据集上进行广泛实验。
PDF
5 years ago
NIPS
实现任务导向对话的流畅性和连贯性
本论文研究了如何在实际的客服对话场景中,生成自然流畅的语言回应和正确的外部操作指令,使用了序列到序列模型并采用了近邻基于嵌入空间的方法,在确保对话连贯性、生成准确的外部操作指令的同时,显著提高了回应的流利程度和准确性。
PDF
6 years ago
Prev
Next