多模对话模型处理澄清对话的能力评估

Jul, 2023

多模对话模型处理澄清对话的能力评估

'What are you referring to?' Evaluating the Ability of Multi-Modal Dialogue Models to Process Clarificational Exchanges

Javier Chiyah-Garcia, Alessandro Suglia, Arash Eshghi, Helen Hastie

TL;DR在对话中，当引用表达不能唯一地识别出意图的指示对象时，产生了指向性模糊。此研究表明生成和回应澄清请求对于多模式、以视觉为基础的对话模型的架构和目标函数有特定的限制。通过使用 SIMMC 2.0 数据集评估不同最先进模型体系结构处理澄清交流的能力，该模型可探测它们在模型中引起的上下文更新的度量。结果发现，基于语言的模型能够编码简单的多模式语义信息和处理一些澄清交流，而多模式模型可以使用其他学习目标来获取解耦的物体表示，这对处理跨模态的复杂指向性模糊至关重要。

Abstract

referential ambiguities arise in dialogue when a referring expression does not uniquely identify the intended referent for the addressee. Addressees usually detect such ambiguities immediately and work with the s

referential ambiguities dialogue clarification exchanges multi-modal models referential ambiguities across modalities

发现论文，激发创造

探索用于 SIMMC 2.0 挑战中的歧义检测和共指消解的多模态表示

本文研究了会话人工智能中的歧义检测和指代消解，使用 TOD-BERT 和 LXMERT 模型等对此进行了实现和对比，并得出了语言模型能够检测歧义且单模态指代消解模型可通过智能对象表示避免使用视觉组件等结论。

Feb, 2022

多模态情境对话中的参照解析和上下文变化用于数据可视化探索

该论文探讨在多模态对话中，为了创建新的可视化效果，如何通过引用解析来实现用户对大屏幕可视化的引用。它描述了实体引用注释和引用解析管道，并研究了传统 CRF 和深度学习 / 转换器模型（BiLSTM-CRF 和 BERT-CRF）。结果表明，深度学习方法的转移学习显著提高了性能，虽然 CRF 仍然优于它们，但表明传统方法在低资源数据方面可能具有更好的泛化能力。

Sep, 2022

多模态澄清问题在混合主动对话式搜索中的应用

在混合主动交互搜索系统中，通过添加图像到澄清问题并提出多模态澄清问题的新任务，可以显著提高查询澄清过程的效果，改善信息检索性能，从而有效地解决了用户在表达意图和解决查询模糊性方面的困难。

Feb, 2024

论会话多模态情感识别中模态和语境的解绑和融合

在对话情景下，针对 MM-ERC（对话中的多模态情感分析）的任务，本研究通过多模态特征解缠和融合，同时模型特征的多模态性和对话背景的建模，以推动任务表现，提出了一种双层解缠机制和特征融合机制，成功地在两个公共数据集上实现了最新的最优性能，并通过进一步的分析证明了这些机制对提升 MM-ERC 任务的帮助，并具有促进其他多模态对话任务的潜力。

Aug, 2023

论文题目：基于指代消解的对话摘要

研究神经方法在抽象对话摘要模型中显式地结合指代信息的不同方法来解决对话中的核心参照问题，发现这样的模型在追踪对话过程中的信息流和关联与对应的讲话者和人物提及方面需要更准确且精确。

Jun, 2021

利用自动会话评估器实现连贯和引人入胜的口语对话响应生成

本研究提出一个评估聊天机器人响应的系统，利用明确的反馈机制改进神经响应图生成模型，从而获得更具连续性和参与度的响应。

Apr, 2019

通过查询重构扩展多领域对话状态跟踪

本研究提出一种基于序列转换模型的对话状态跟踪和指代消解方法，并使用指针生成网络模型进行查询重构，在跨领域场景下实验验证了该方法的有效性。

Mar, 2019

协作参照表达

本文提出了一个计算模型，探讨了会话参与者如何协作以使指称行为成功，使用规划法建立指称表达式和确认其标识参照物的过程，并提出了如何使用元操作来澄清指称表达式及其成果以及计划如何影响行动代理的问题。

Apr, 1995

必要时澄清：通过与语言模型的交互解决多义性

我们提出了一个任务无关的框架来通过询问用户澄清问题来解决模型中的歧义，我们的方法在确定何时需要澄清、确定要问的澄清问题以及通过澄清获得的新信息方面都取得了显著成果，并对模型的不确定性进行了估计，我们的方法在准确识别需要澄清的预测方面始终优于现有的不确定性估计方法，使系统能够在仅允许在 10％的示例上进行澄清时将性能提升两倍。

Nov, 2023

使用话语解析的多任务对话理解

提出了一个用于多方对话机器阅读理解 (MRC) 的多任务模型，结合问答 (QA) 和话语解析 (DP) 任务，在 Molweni 基准测试中证明了多任务训练不仅受益于 QA 任务，也有助于 DP 任务，当处理更长的对话时，联合模型表现得更强，验证了 DP 在相关 MRC 中的必要性。

Oct, 2021