- COLING聊天作为干扰:向任务导向对话添加用户背景
通过使用 Llama-2-70B 进行少样本提示来提高 MultiWOZ 数据集中用户故事的质量,我们评估了这种添加对模型的影响,结果显示这种丰富的数据集给系统带来了显著挑战,同时证明了该数据集可用于训练,能够在同一轮中始终自觉承认用户的背 - LEEETs-Dial: 末端对话系统中的语言同步
本研究通过使用共享词汇,介绍了一种实现基于 GPT-2 的端到端对话系统中对话对齐的方法,包括训练实例加权、对齐特定损失和附加调节等技术,通过在 MultiWOZ 数据集上比较不同的对齐技术,我们证明这三种方法都比基准产生出更好对齐的结果, - DiactTOD: 学习可控的通用潜在对话行为的任务导向对话系统
通过使用潜在对话行为模型 (DiactTOD) 预测和控制对话行为生成可控制的回应,该方法在 MultiWOZ 数据集上展示了在多种实验设置中的最先进性能,包括零样本、少样本和全样本微调,以及端到端和策略优化配置。
- 针对端到端任务导向对话系统的重新排序过度生成的回应
本研究提出了一种简单而有效的重排序方法,以从系统最初生成的响应列表中选择高质量响应,通过使用任何序列级(相似性)得分函数将响应的语义空间划分为高得分和低得分分区,并在训练时使用,用于提高末端任务导向对话系统的性能,以及在 MultiWOZ - MultiWOZ 数据集的数据流实现
本文介绍了使用数据流范式来进行对话建模,采用计算图层次表示用户请求,数据和对话历史,对多轮人机对话数据集 MultiWOZ 进行了多种格式转换的实验,并给出了实验结果。
- 面向任务导向对话的端到端检索生成
介绍了 AARGH,一个综合了检索和生成方法的端到端任务导向对话系统,旨在改善对话管理和输出的词汇多样性。在 MultiWOZ 数据集上,我们展示了该方法相对于最先进的基线方法可以产生更多样化的输出,同时维持或提高状态跟踪和上下文 - 响应 - 以响应选择为辅助任务的高效任务导向型对话系统
本文提出两种具有辅助任务的模型,用于响应选择,并在 MultiWOZ 2.1 数据集上取得了 107.5 和 108.3 的综合分数,优于具有三倍以上的参数基线模型。
- 后处理网络:使用强化学习优化管线任务定向对话系统的方法
本文提出了一种使用后处理网络,在不需要每个模块可微分的情况下进行强化学习,从而优化由任意方法实现的模块组成的对话系统的对话性能。通过多轮对话模拟和人类评估,证明了此方法可以提高由各种模块组成的管道系统的对话性能(使用 MultiWOZ 数据 - ACL利用槽位描述进行零样本跨域对话状态跟踪
本论文提出一种增强型随机生成方法,利用自我注意力编码器对对话和插槽进行编码,然后以自回归的方式生成插槽值,并融入信息捕捉模板,实现跨领域知识转移,实验证明该方法在多领域体系下显著提高了当前的零样本跨领域任务对话状态跟踪技术。
- EMNLP利用自监督来改善有限标注对话状态跟踪
本文提出并研究了两种自我监督方法:保持潜在一致性和建模对话行为,以提高数据效率,实验结果显示这种方法将使联合目标的准确度提高了 8.95%。
- ICLRCoCo: 用于评估对话状态跟踪器的可控因果推断
本文提出使用可控反事实推理 (CoCo) 来对话状态跟踪模型(DST)进行鲁棒性评估,利用 CoCo 生成的反事实对话场景来评估在 MultiWOZ 数据集上的 DST 模型,结果表明相对于传统的技术方法,CoCo 会对 DST 模型的性能 - MultiWOZ 2.3:一个增强的多领域任务导向对话数据集,带有注释更正和同指标注
本文介绍了 MultiWOZ 2.3 数据集,通过协同指称功能和一致化注释实现了对话行为和对话状态的一致性,提高了自然语言理解和对话状态跟踪的性能表现。
- 基于粗粒度到细粒度序列生成的会话状态跟踪方法
本文提出了一种基于结构化状态表征的、称为 Coarse-to-fine Dialogue State Tracking (CREDIT) 的方法,它将对话状态跟踪作为序列生成问题,并在 MultiWOZ 数据集上获得了令人满意的实验结果。
- ACL多领域对话行为与响应同时生成
我们提出了一个神经共同生成模型,可以同时生成对话行为和响应,相比于现有的流水线方法,我们的模型可以保留多领域对话行为的语义结构并动态关注不同的对话行为,通过在 MultiWOZ 数据集上的测试,我们的模型在自动评估和人类评估中都比几种最先进 - 面向对话的结构化融合网络
本文提出了使用结构化融合网络将显式对话结构加入神经对话系统的若干方法,该方法在 MultiWOZ 数据集上表现稳定并具有更好的域通用性、在数据减少的情况下性能更好,并且具有强大的强化学习能力。
- 基于预训练语言模型的任务导向对话系统研究 —— 以 GPT-2 为例
本研究探讨了数据稀缺对于多领域任务导向对话系统快速发展的限制,并提出了一种基于 TransferTransfo 和生成模型预训练的对话模型,并在 MultiWOZ 数据集上进行了验证,结果显示该模型可以有效地绕过显式策略和语言生成模块来实现 - ACL对话上下文表示学习的预训练方法
该论文研究了用于学习对话上下文表示的各种无监督预训练目标,提出了两种新的对话上下文编码器预训练方法,并对总共四种方法进行了检验,结果在 MultiWoz 数据集上表现出明显的性能提升,并且进一步评估表明我们的预训练目标不仅能够带来更好的性能